《Python高级数据分析 机器学习、深度学习和NLP实例》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:(印)萨扬·穆霍帕迪亚(Sayan Mukhopadhyay)著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2019
  • ISBN:9787111617020
  • 页数:156 页
图书介绍:本书介绍了基于Python的高级数据分析,探讨了Neo4j、Elasticsearch和MongoDB等数据库,讨论了如何实现包括主题爬取在内的ETL技术,并用于高频算法交易和目标导向的对话系统等领域;还介绍了一些机器学习概念(如半监督学习、深度学习和NLP)的例子;同时涵盖了重要的传统数据分析技术,如时间序列和主成分分析等。

第1章 简介 1

1.1为何选择Python 1

1.2何时避免使用Python 2

1.3 Python中的面向对象编程 2

1.4在Python中调用其他语言 10

1.5将Python模型作为微服务 11

1.6高性能API和并发编程 14

第2章 Python结构化数据提取、转换和加载 19

2.1 MySQL 20

2.1.1如何安装MySQLdb 20

2.1.2数据库连接 20

2.1.3 INSERT操作 20

2.1.4 READ操作 21

2.1.5 DELETE操作 22

2.1.6 UPDATE操作 23

2.1.7 COMMIT操作 23

2.1.8 ROLL-BACK操作 24

2.2 Elasticsearch 26

2.3 Neo4j Python驱动 29

2.4 neo4j-rest-client 29

2.5内存数据库 29

2.6 Python版本MongoDB 30

2.6.1将数据导入集合 31

2.6.2使用pymongo创建连接 31

2.6.3访问数据库对象 32

2.6.4插入数据 32

2.6.5更新数据 32

2.6.6删除数据 32

2.7 Pandas 33

2.8 Python非结构化数据提取、转换和加载 34

2.8.1电子邮件解析 34

2.8.2主题爬取 36

第3章 基于Python的监督学习 43

3.1使用Python实现降维 43

3.1.1相关性分析 44

3.1.2主成分分析 46

3.1.3互信息 48

3.2使用Python进行分类 49

3.3半监督学习 50

3.4决策树 50

3.4.1哪个属性优先 50

3.4.2随机森林分类器 52

3.5朴素贝叶斯分类器 52

3.6支持向量机 54

3.7最近邻分类器 55

3.8情绪分析 56

3.9图像识别 57

3.10使用Python进行回归 58

3.10.1最小二乘估计 59

3.10.2逻辑回归 60

3.11分类和回归 60

3.12使模型高估或低估 61

3.13处理分类型数据 62

第4章 无监督学习—聚类 67

4.1 K均值聚类 68

4.2选择K—肘部法则 71

4.3距离或相似性度量 71

4.3.1属性 72

4.3.2一般及欧氏距离 72

4.3.3平方欧氏距离 74

4.3.4字符串之间的编辑距离 74

4.4文档上下文的相似性 76

4.5什么是层次聚类 77

4.5.1自下而上的方法 78

4.5.2聚类之间的距离 79

4.5.3自上而下的方法 80

4.5.4图论方法 84

4.6如何判断聚类结果是否良好 85

第5章 深度学习和神经网络 87

5.1反向传播 88

5.1.1反向传播方法 88

5.1.2广义Delta规则 88

5.1.3输出层权重更新 89

5.1.4隐藏层权重更新 90

5.1.5反向传播网络小结 91

5.2反向传播算法 92

5.3其他算法 94

5.4 TensorFlow 94

5.5递归神经网络 99

第6章 时间序列 107

6.1 变化的分类 107

6.2包含趋势的序列分析 107

6.2.1曲线拟合 108

6.2.2从时间序列中去除趋势 109

6.3包含周期性的序列数据分析 110

6.4从时间序列中去除周期性 111

6.4.1滤波 111

6.4.2差分 112

6.5转换 112

6.5.1稳定方差 112

6.5.2使周期效应累加 113

6.5.3使数据呈正态分布 113

6.6平稳时间序列 114

6.6.1平稳过程 114

6.6.2自相关和相关图 114

6.6.3自协方差和自相关函数的估计 115

6.7使用Python进行时间序列分析 116

6.7.1有用的方法 116

6.7.2自回归过程 118

6.7.3估计AR过程的参数 119

6.8混合ARMA模型 122

6.9集成ARMA模型 123

6.10傅里叶变换 124

6.11一个特殊的场景 125

6.12数据缺失 127

第7章 大数据分析 129

7.1 Hadoop 129

7.1.1 MapReduce编程 129

7.1.2 partitioning函数 130

7.1.3 combiner函数 131

7.1.4 HDFS文件系统 140

7.1.5 MapReduce设计模式 140

7.2 Spark 146

7.3云分析 148

7.4物联网 156