第1章 绪论 1
1.1 数据科学概述 1
1.2 数据科学的建模流程 2
1.3 Python 语言开发环境与库入门 6
第2章 回归模型 13
2.1 概述 13
2.2 线性回归 13
2.3 线性回归案例 18
2.4 逻辑回归 24
2.5 逻辑回归案例 28
第3章 聚类模型 33
3.1 概述 33
3.2 K-means聚类 36
3.3 密度聚类 41
3.4 层次聚类 42
3.5 案例 50
第4章 关联规则 60
4.1 概述 60
4.2 Apriori算法 63
4.3 基于Apriori算法的改进算法 66
4.4 FP-Growth算法 68
4.5 关联规则案例 71
第5章 决策树 79
5.1 概述 79
5.2 ID3算法 81
5.3 C4.5 算法 85
5.4 CART算法 87
5.5 决策树的剪枝 90
5.6 案例 92
第6章 支持向量机 102
6.1 概述 102
6.2 线性支持向量机 102
6.3 非线性支持向量机 107
6.4 支持向量机的求解与多分类问题 110
6.5 新闻文本分类案例 111
6.6 scikit-learn库中的SVM 114
第7章 贝叶斯网络 116
7.1 概述 116
7.2 朴素贝叶斯网络 120
7.3 TAN贝叶斯网络 125
7.4 无约束贝叶斯网络 129
7.5 利用朴素贝叶斯网络进行垃圾邮件的过滤 132
7.6 scikit-learn库中的Naive-Bayes分类 135
第8章 深度学习 137
8.1 概述 137
8.2 多层感知机 140
8.3 卷积神经网络 147
8.4 循环神经网络 150
8.5 构建卷积神经网络模型对CIFAR图片数据集分类 152
8.6 TensorFlow的基本用法 157
参考文献 161