《Python数据分析 第2版》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)阿曼多·凡丹戈著;韩波译
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2018
  • ISBN:7115481177
  • 页数:274 页
图书介绍:

第1章Python程序库入门 1

1.1安装Python 3 3

1.1.1安装数据分析程序库 3

1.1.2 Linux平台或Mac OS X平台 3

1.1.3 Windows平台 4

1.2将IPython用作shell 4

1.3学习手册页 6

1.4 Jupyter Notebook 7

1.5 NumPy数组 8

1.6一个简单的应用 8

1.7从何处寻求帮助和参考资料 11

1.8查看Pyton库中包含的模块 12

1.9通过Matplotlib实现数据的可视化 12

1.10小结 14

第2章NumPy数组 15

2.1 NumPy数组对象 16

2.2创建多维数组 17

2.3选择NumPy数组元素 17

2.4 NumPy的数值类型 18

2.4.1数据类型对象 20

2.4.2字符码 20

2.4.3 dtype构造函数 21

2.4.4 dtype属性 22

2.5一维数组的切片与索引 23

2.6处理数组形状 23

2.6.1堆叠数组 25

2.6.2拆分NumPy数组 28

2.6.3 NumPy数组的属性 30

2.6.4数组的转换 34

2.7创建数组的视图和拷贝 35

2.8花式索引 36

2.9基于位置列表的索引方法 38

2.10用布尔型变量索引 NumPy数组 39

2.11 NumPy数组的广播 41

2.12小结 44

2.13参考资料 44

第3章Pandas入门 45

3.1 Pandas的安装与概览 46

3.2 Pandas数据结构之DataFrame 47

3.3 Pandas数据结构之Series 49

3.4利用Pandas查询数据 52

3.5利用Pandas的DataFrame进行统计计算 56

3.6利用Pandas的DataFrame实现数据聚合 58

3.7 DataFrame的串联与附加操作 62

3.8连接DataFrames 63

3.9处理缺失数据问题 65

3.10处理日期数据 67

3.11数据透视表 70

3.12小结 71

3.13参考资料 71

第4章 统计学与线性代数 72

4.1用NumPy进行简单的描述性统计计算 72

4.2用NumPy进行线性代数运算 75

4.2.1用NumPy求矩阵的逆 75

4.2.2用NumPy解线性方程组 77

4.3用NumPy计算特征值和特征向量 78

4.4 NumPy随机数 80

4.4.1用二项式分布进行博弈 81

4.4.2正态分布采样 83

4.4.3用Scipy进行正态检验 84

4.5创建掩码式NumPy数组 86

4.6忽略负值和极值 88

4.7小结 91

第5章 数据的检索、加工与存储 92

5.1利用NumPy和pandas对CSV文件进行写操作 92

5.2二进制npy与pickle格式 94

5.3使用PyTables存储数据 97

5.4 Pandas DataFrame与HDF5仓库之间的读写操作 99

5.5使用Pandas读写Excel文件 102

5.6使用REST Web服务和JSON 103

5.7使用Pandas读写JSON 105

5.8解析RSS和Atom订阅 106

5.9使用Beautiful Soup解析HTML 108

5.10小结 114

5.11参考资料 114

第6章 数据可视化 115

6.1 Matplotlib的子库 116

6.2 Matplotlib绘图入门 116

6.3对数图 118

6.4散点图 119

6.5图例和注解 121

6.6三维图 123

6.7 Pandas绘图 125

6.8时滞图 127

6.9自相关图 129

6.10 Plot.ly 130

6.11小结 132

第7章 信号处理与时间序列 133

7.1 statsmodels模块 134

7.2移动平均值 134

7.3窗口函数 136

7.4协整的定义 138

7.5自相关 140

7.6自回归模型 142

7.7 ARMA模型 145

7.8生成周期信号 147

7.9傅里叶分析 149

7.10谱分析 152

7.11滤波 153

7.12小结 155

第8章 应用数据库 156

8.1基于sqlite3的轻量级访问 157

8.2通过Pandas访问数据库 159

8.3 SQLAlchemy 161

8.3.1 SQLAlchemy的安装和配置 161

8.3.2通过SQLAlchemy填充数据库 162

8.3.3通过SQLAlchemy查询数据库 164

8.4 Pony ORM 166

8.5 Dataset:懒人数据库 167

8.6 PyMongo与MongoDB 168

8.7利用Redis存储数据 170

8.8利用memcache存储数据 171

8.9 Apache Cassandra 172

8.10小结 174

第9章 分析文本数据和社交媒体 176

9.1安装NLTK 177

9.2 NLTK简介 177

9.3滤除停用字、姓名和数字 178

9.4词袋模型 180

9.5词频分析 181

9.6朴素贝叶斯分类 183

9.7情感分析 186

9.8创建词云 189

9.9社交网络分析 193

9.10小结 195

第10章 预测性分析与机器学习 197

10.1预处理 198

10.2基于逻辑回归的分类 201

10.3基于支持向量机的分类 202

10.4基于ElasticNetCV的回归分析 205

10.5支持向量回归 207

10.6基于相似性传播算法的聚类分析 210

10.7均值漂移算法 211

10.8遗传算法 213

10.9神经网络 217

10.10决策树 219

10.11小结 222

第11章 Python生态系统的外部环境和云计算 223

11.1与MATLAB/Octave交换信息 224

11.2安装rpy2 225

11.3连接R 225

11.4为Java传递NumPy数组 228

11.5集成SWIG和NumPy 229

11.6集成Boost和Python 233

11.7通过f2py使用For ran代码 235

11.8 PythonAnywhere云 236

11.9小结 238

第12章 性能优化、性能分析与并发性 239

12.1代码的性能分析 240

12.2安装Cython 245

12.3调用C代码 248

12.4利用multiprocessing创建进程池 252

12.5通过Joblib提高for循环的并发性 254

12.6比较Bottleneck函数与NumPy函数 255

12.7通过Jug实现MapReduce 257

12.8安装MPI for Python 259

12.9 IPython Parallel 260

12.10小结 263

附录A重要概念 264

附录B常用函数 269