第1章 概述 1
1.1 名词演化 1
1.2 基本内容 2
1.3 数据智慧 4
第2章 线性回归方法 7
2.1 多元线性回归 7
2.2 压缩方法:岭回归与Lasso 16
2.3 Lasso模型的求解与理论性质 22
2.4 损失函数加罚的建模框架 25
2.5 上机实践 30
第3章 线性分类方法 39
3.1 分类问题综述与评价准则 39
3.2 Logistic回归 42
3.3 线性判别 46
3.4 上机实践 49
第4章 模型评价与选择 60
4.1 基本概念 60
4.2 理论方法 63
4.3 数据重利用方法 67
4.4 上机实践 70
第5章 决策树与组合方法 78
5.1 决策树 78
5.2 Bagging 81
5.3 Boosting 86
5.4 随机森林 98
5.5 上机实践 100
第6章 神经网络与深度学习 114
6.1 神经网络 115
6.2 深度学习 127
6.3 上机实践 135
第7章 支持向量机 148
7.1 线性可分支持向量机 148
7.2 软间隔支持向量机 151
7.3 一些拓展 153
7.4 上机实践 155
第8章 聚类分析 163
8.1 基于距离的聚类 163
8.2 基于模型和密度的聚类 168
8.3 稀疏聚类 170
8.4 双向聚类 173
8.5 上机实践 174
第9章 推荐系统 182
9.1 基于邻居的推荐 183
9.2 潜在因子与矩阵分解算法 188
9.3 上机实践 192
第10章 大数据案例分析 197
10.1 智能手机用户监测数据案例分析 197
10.2 美国航空数据案例分析 211
参考文献 227