《普通高等院校应用型人才培养“十三五”规划教材 Python数据分析》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:周海燕责任编辑;(中国)吴道君,朱家荣
  • 出 版 社:北京:中国铁道出版社
  • 出版年份:2019
  • ISBN:9787113258719
  • 页数:200 页
图书介绍:本书全面讲解Python数据分析的相关知识和技术,包括数据分析编程工具JupyterNotebook、数值计算NumPy、数据可视化Matplotlib、数据分析Pandas、机器学习Sklearn。本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。本书根据Python数据分析的知识结构分为6章,分别讲解开发工具、数值计算、可视化、数据分析、数据预处理、机器学习。

第1章 Python数据分析概述 1

1.1 数据分析的概念、流程和应用 1

1.1.1 数据分析的概念 1

1.1.2 数据分析的流程 2

1.1.3 数据分析的应用 2

1.2 数据分析工具 3

1.2.1 常用工具 4

1.2.2 Python数据分析 4

1.3 Python数据分析环境 5

小结 9

习题 9

实验 10

第2章 NumPy数值计算 15

2.1 NumPy多维数组 15

2.1.1 数组创建 15

2.1.2 数组对象属性 22

2.1.3 数组数据类型 23

2.2 数组操作 24

2.2.1 修改数组形状 24

2.2.2 翻转数组 26

2.2.3 连接数组 27

2.2.4 分割数组 28

2.2.5 数组元素添加与删除 30

2.3 数组索引与切片 32

2.3.1 数组索引 32

2.3.2 数组切片 33

2.3.3 布尔型索引 34

2.3.4 花式索引 35

2.4 数组的运算 35

2.4.1 数组和标量间的运算 35

2.4.2 广播 36

2.4.3 算术函数 37

2.4.4 集合运算 40

2.4.5 统计运算 41

2.4.6 排序 43

2.4.7 搜索 44

2.5 线性代数 45

2.5.1 数组相乘 46

2.5.2 矩阵行列式 46

2.5.3 逆矩阵 46

2.5.4 线性方程组 47

2.5.5 特征值和特征向量 47

2.6 数组的存取 48

小结 48

习题 48

实验 51

第3章 Matplotlib数据可视化 54

3.1 线形图 54

3.1.1 绘制线形图 54

3.1.2 颜色设置 55

3.1.3 线型设置 56

3.1.4 坐标点设置 57

3.1.5 线宽设置 59

3.2 其他图形 59

3.2.1 散点图 59

3.2.2 柱形图 61

3.2.3 条形图 63

3.2.4 饼图 64

3.2.5 直方图 65

3.2.6 箱线图 67

3.3 自定义设置 69

3.3.1 图例设置 69

3.3.2 坐标网格设置 70

3.3.3 坐标系设置 71

3.3.4 样式设置与注解 72

3.3.5 RC设置 73

3.4 子图 74

3.4.1 创建子图 74

3.4.2 子图坐标系设置 76

3.4.3 图形嵌套 77

3.5 绘制三维图形 78

小结 81

习题 82

实验 82

第4章 Pandas数据分析 89

4.1 Pandas数据结构 89

4.2 DataFrame基本功能 94

4.3 读取外部数据 95

4.3.1 CSV文件 96

4.3.2 Sqlite数据库 98

4.4 数据帧的列操作和行操作 99

4.4.1 列操作 99

4.4.2 行操作 101

4.5 高级索引 103

4.5.1 重建索引 103

4.5.2 更换索引 106

4.5.3 层次化索引 107

4.6 Pandas数据运算 108

4.6.1 算术运算 108

4.6.2 函数应用与映射运算 109

4.6.3 排序 111

4.6.4 迭代 113

4.6.5 唯一值与值计数 115

4.7 统计函数 116

4.7.1 描述性统计 116

4.7.2 变化率 119

4.7.3 协方差 120

4.7.4 相关性 120

4.7.5 数据排名 121

4.8 分组与聚合 122

4.8.1 分组 122

4.8.2 聚合 124

4.9 透视表与交叉表 127

4.9.1 透视表 127

4.9.2 交叉表 128

小结 129

习题 129

实验 129

第5章 数据预处理 134

5.1 数据清洗 134

5.1.1 重复值 134

5.1.2 缺失值 135

5.1.3 异常值 140

5.2 合并连接与重塑 142

5.2.1 merge合并 142

5.2.2 concat合并 144

5.2.3 combine-first合并 146

5.2.4 数据重塑 147

5.3 数据变换 149

5.3.1 虚拟变量 149

5.3.2 函数变换 150

5.3.3 连续属性离散化 151

5.3.4 规范化 152

5.3.5 随机采样 154

小结 156

习题 156

实验 156

第6章 Sklearn机器学习 162

6.1 术语 162

6.2 Sklearn 164

6.2.1 Sklearn数据集 165

6.2.2 Sklearn常用算法 171

6.2.3 数据预处理 175

6.2.4 数据集拆分 177

6.2.5 模型评估 177

6.2.6 Sklearn常用方法 178

6.2.7 模型的保存和载入 179

6.3 降维 179

6.3.1 PCA(主成分分析) 179

6.3.2 LDA(线性评价分析) 181

6.4 回归 182

6.4.1 线性回归 183

6.4.2 逻辑回归 184

6.4.3 回归决策树 185

6.5 分类 186

6.5.1 朴素贝叶斯 187

6.5.2 分类决策树 188

6.5.3 SVM(支持向量机) 189

6.5.4 神经网络 190

6.5.5 K-近邻算法 191

6.6 聚类 192

6.6.1 K-means算法 193

6.2.2 DBSCAN 194

小结 195

习题 195

实验 196

参考文献 200