第1章 概述 1
1.1名词演化 1
1.2基本内容 2
1.3数据智慧 4
第2章 线性回归方法 7
2.1多元线性回归 7
2.2压缩方法:岭回归与Lasso 16
2.3 Lasso模型的求解与理论性质 22
2.4损失函数加罚的建模框架 27
2.5上机实践:R 32
2.6上机实践:Python 40
第3章 线性分类方法 52
3.1分类问题综述与评价准则 52
3.2 Logistic回归 55
3.3线性判别 59
3.4上机实践:R 62
3.5上机实践:Python 72
第4章 模型评价与选择 80
4.1基本概念 80
4.2理论方法 83
4.3数据重利用方法 87
4.4上机实践:R 90
4.5上机实践:Python 97
第5章 决策树与组合方法 103
5.1决策树 103
5.2 Bagging 106
5.3 Boosting 111
5.4随机森林 125
5.5上机实践:R 127
5.6上机实践:Python 141
第6章 神经网络与深度学习 152
6.1神经网络 153
6.2深度信念网 165
6.3卷积神经网络 173
6.4上机实践:R 185
6.5上机实践:Python 192
第7章 支持向量机 217
7.1线性可分支持向量机 217
7.2软间隔支持向量机 220
7.3一些拓展 224
7.4上机实践:R 227
7.5上机实践:Python 229
第8章 聚类分析 238
8.1基于距离的聚类 238
8.2基于模型和密度的聚类 243
8.3稀疏聚类 247
8.4双向聚类 250
8.5上机实践:R 255
8.6上机实践:Python 262
第9章 推荐系统 269
9.1基于邻居的推荐 270
9.2潜在因子与矩阵分解算法 275
9.3上机实践:R 279
9.4上机实践:Python 284
第10章 大数据案例分析 286
10.1智能手机用户监测数据案例分析 286
10.2美国航空数据案例分析 300
10.3美国纽约公共自行车数据案例分析 314
参考文献 328