第0章 本书的技术体系 1
0.1 Python的发展趋势 2
0.2 人工智能时代学习Python的重要性 2
0.3 本书的技术体系 3
0.4 学习本书需要注意的事项 6
第1章 Python基础知识 7
1.1 Python简介 8
1.1.1 了解Python的起源与发展历史 8
1.1.2 Python的特色 8
1.1.3 学习Python的原因 9
1.2 Python的当前版本 9
1.3 Python的优缺点 10
1.4 Python与其他语言的区别 10
1.5 Python的应用领域 11
第2章 Python的安装、配置与卸载 13
2.1 Python的安装 14
2.1.1 Python的下载 14
2.1.2 Python的安装 15
2.2 Python的配置 17
2.2.1 Python环境变量的设置 17
2.2.2 Python的启动 18
2.3 Python的卸载 19
第3章 Python 3基础语法 21
3.1 第一个Python程序 22
3.2 Python的输入和输出 26
3.2.1 Python的输出语句 26
3.2.2 Python的输入语句 26
3.3 Python的基本数据类型 27
3.3.1 数字 27
3.3.2 字符串 28
3.3.3 列表 29
3.3.4 元组 30
3.3.5 集合 31
3.3.6 字典 32
3.4 Python库的导入 32
3.5 Python的集成开发环境 34
3.6 自测练习 36
第4章 Python 3的编程 37
4.1 条件语句 38
4.2 循环语句 39
4.2.1 while循环 40
4.2.2 for循环 40
4.3 函数 43
4.4 模块 45
4.5 自测练习 46
第5章 机器学习基础 47
5.1 机器学习概述 48
5.2 监督学习简介 50
5.3 非监督学习简介 50
5.4 增强学习简介 51
5.5 深度学习简介 53
5.6 机器学习常用术语 55
第6章 Python机器学习及分析工具 57
6.1 矩阵操作函数库(NumPy) 58
6.1.1 NumPy的安装 58
6.1.2 NumPy的基本使用 59
6.2 科学计算的核心包(SciPy) 64
6.2.1 科学计算的核心包的安装 64
6.2.2 科学计算的核心包的基本使用 67
6.3 Python的绘图库(Matplotlib) 71
6.3.1 Matplotlib简介及安装 71
6.3.2 Matplotlib的基本使用 72
6.4 数据分析包(Pandas) 79
6.4.1 Pandas简介和安装 79
6.4.2 Pandas的基本使用方法 80
6.5 机器学习函数库(Scikit-learn) 81
6.6 统计建模工具包(StatsModels) 88
6.7 深度学习框架(TensorFlow) 90
第7章 数据预处理 93
7.1 数据预处理概述 94
7.2 数据清理 95
7.2.1 异常数据处理 95
7.2.2 缺失值处理 96
7.2.3 噪声数据处理 97
7.3 数据集成 98
7.4 数据变换 99
7.5 数据归约 101
7.6 Python的主要数据预处理函数 102
7.6.1 Python的数据结构 102
7.6.2 数据缺失处理函数 104
第8章 分类问题 115
8.1 分类概述 116
8.2 常用方法 116
8.2.1 k-近邻算法 116
8.2.2 朴素贝叶斯 118
8.2.3 支持向量机 123
8.2.4 AdaBoost算法 125
8.2.5 决策树 127
8.2.6 Multi-layerPerceptron多层感知机 135
8.3 项目实战 137
8.3.1 实例1:使用k-近邻算法实现约会网站的配对效果 137
8.3.2 实例2:使用朴素贝叶斯过滤垃圾邮件 141
8.3.3 实例3:SVM实现手写识别系统 144
8.3.4 实例4:基于单层决策树构建分类算法 147
8.3.5 实例5:使用决策树对iris数据集分类 151
8.3.6 实例6:使用决策树对身高体重数据进行分类 153
8.3.7 实例7:使用k-近邻算法对鸢尾花数据进行交叉验证 156
8.3.8 使用多层感知器分析,根据葡萄酒的各项化学特征来判断葡萄酒的优劣 160
8.4 自测练习 163
第9章 预测分析 165
9.1 预测概述 166
9.2 常用方法 166
9.2.1 时间序列分析预测法 166
9.2.2 BP神经网络模型 168
9.3 项目实战 170
9.3.1 实例1:根据一年的历史数据预测后十年的数据趋势 170
9.3.2 实例2:使用神经网络预测公路运量 178
9.4 自测练习 185
第10章 关联分析 187
10.1 关联分析概述 188
10.2 基本方法 188
10.2.1 Apriori算法 189
10.2.2 FP-Growth算法 189
10.3 项目实战(解决目前流行的实际问题) 192
10.3.1 用Apriori进行关联分析的实例 192
10.3.2 使用FP-Growth算法提取频繁项集 195
10.4 自测练习 199
第11章 网络爬虫 201
11.1 网络爬虫概述 202
11.1.1 网络爬虫原理 202
11.1.2 爬虫分类 203
11.2 网页抓取策略和方法 204
11.2.1 网页抓取策略 204
11.2.2 网页抓取的方法 204
11.3 项目实战 205
11.3.1 用Python抓取指定的网页 205
11.3.2 用Python抓取包含关键词的网页 207
11.3.3 下载贴吧中的图片 208
11.3.4 股票数据抓取 210
11.4 自测练习 213
第12章 集成学习 215
12.1 集成学习概述 216
12.2 常用方法 216
12.2.1 Bagging和随机森林 216
12.2.2 Boosting和AdaBoost 217
12.3 项目实战 219
12.3.1 使用随机森林方法预测乘员的存活概率 219
12.3.2 使用AdaBoost方法进行二元分类 222
12.4 自测练习 225
第13章 深度学习 227
13.1 深度学习概述 228
13.2 常用方法 228
13.2.1 监督学习的深度学习网络结构 229
13.2.2 非监督学习的深度学习网络结构 230
13.3 项目实战 233
13.3.1 使用TensorFlow框架进行MNIST数据集生成 233
13.3.2 使用Theano框架进行MNIST数字识别 237
13.4 自测练习 241
第14章 数据降维及压缩 243
14.1 数据降维及压缩概述 244
14.1.1 数据降维 244
14.1.2 图像压缩 245
14.2 基本方法 245
14.2.1 主成分分析 245
14.2.2 奇异值分解 248
14.3 项目实战 251
14.3.1 主成分分析PCA实例 251
14.3.2 使用奇异值分解进行图像压缩 257
14.4 自测练习 260
第15章 聚类分析 261
15.1 聚类分析概述 262
15.2 K-means算法 264
15.2.1 K-means算法与步骤 264
15.2.2 K-means算法涉及的问题 264
15.2.3 实际聚类问题的处理流程 265
15.3 项目实战 266
15.3.1 K-means算法实现二维数据聚类 266
15.3.2 使用Scikit-learn中的方法进行聚类分析 269
15.4 自测练习 276
第16章 回归分析问题 279
16.1 回归分析概述 280
16.2 基本方法 280
16.2.1 一元回归分析 280
16.2.2 多元线性回归 281
16.2.3 回归的计算方法 282
16.2.4 逻辑回归分析 284
16.3 项目实战 286
16.3.1 身高与体重的回归分析 286
16.3.2 房价预测 293
16.3.3 产品销量与广告的多元回归分析 296
16.3.4 鸢尾花数据的逻辑回归分析 298
16.4 自测练习 300