《大数据挖掘与统计机器学习》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:吕晓玲,宋捷主编
  • 出 版 社:北京:中国人民大学出版社
  • 出版年份:2019
  • ISBN:9787300264066
  • 页数:332 页
图书介绍:本课程的教学内容主要包括聚类、关联、降维、变量选择、分类与预测、集成算法、图模型与推荐系统等。每一部分都是本课程授课的主要内容,都力求深入浅出,精讲细讲,不光讲解各种方法的过程与原理,还要加强学生对各种方法的深入理解。

第1章 概述 1

1.1名词演化 1

1.2基本内容 2

1.3数据智慧 4

第2章 线性回归方法 7

2.1多元线性回归 7

2.2压缩方法:岭回归与Lasso 16

2.3 Lasso模型的求解与理论性质 22

2.4损失函数加罚的建模框架 27

2.5上机实践:R 32

2.6上机实践:Python 40

第3章 线性分类方法 52

3.1分类问题综述与评价准则 52

3.2 Logistic回归 55

3.3线性判别 59

3.4上机实践:R 62

3.5上机实践:Python 72

第4章 模型评价与选择 80

4.1基本概念 80

4.2理论方法 83

4.3数据重利用方法 87

4.4上机实践:R 90

4.5上机实践:Python 97

第5章 决策树与组合方法 103

5.1决策树 103

5.2 Bagging 106

5.3 Boosting 111

5.4随机森林 125

5.5上机实践:R 127

5.6上机实践:Python 141

第6章 神经网络与深度学习 152

6.1神经网络 153

6.2深度信念网 165

6.3卷积神经网络 173

6.4上机实践:R 185

6.5上机实践:Python 192

第7章 支持向量机 217

7.1线性可分支持向量机 217

7.2软间隔支持向量机 220

7.3一些拓展 224

7.4上机实践:R 227

7.5上机实践:Python 229

第8章 聚类分析 238

8.1基于距离的聚类 238

8.2基于模型和密度的聚类 243

8.3稀疏聚类 247

8.4双向聚类 250

8.5上机实践:R 255

8.6上机实践:Python 262

第9章 推荐系统 269

9.1基于邻居的推荐 270

9.2潜在因子与矩阵分解算法 275

9.3上机实践:R 279

9.4上机实践:Python 284

第10章 大数据案例分析 286

10.1智能手机用户监测数据案例分析 286

10.2美国航空数据案例分析 300

10.3美国纽约公共自行车数据案例分析 314

参考文献 328