《机器学习与数据科学 基于R的统计学习方法》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:(美)古铁雷斯(Daniel D.Gutierrez)
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2017
  • ISBN:9787115452405
  • 页数:242 页
图书介绍:本书通过8章内容,由浅入深地介绍了机器学习、数据处理、数据再加工、数据分析、回归分析、数据分类、模型性能评估以及无监督学习等内容。可谓是每一章都是当前最新颖最有探索价值的专题,对于想要了解机器学习和数据科学相关内容的读者,一定是必读之选。

第1章 机器学习综述 1

1.1 机器学习的分类 2

1.2 机器学习的实际案例 3

1.2.1 预测回头客挑战赛 4

1.2.2 Netflix公司 5

1.2.3 算法交易挑战赛 6

1.2.4 Heritage健康奖 7

1.3 机器学习的过程 10

1.4 机器学习背后的数学 15

1.5 成为一名数据科学家 16

1.6 统计计算的R工程 18

1.7 RStudio 19

1.8 使用R包 20

1.9 数据集 22

1.10 在生产中使用R 23

1.11 小结 24

第2章 连接数据 25

2.1 管理你的工作目录 27

2.2 数据文件的种类 28

2.3 数据的来源 28

2.4 从网络中下载数据集 29

2.5 读取CSV文件 31

2.6 读取Excel文件 33

2.7 使用文件连接 34

2.8 读取JSON文件 35

2.9 从网站中抓取数据 36

2.10 SQL数据库 38

2.11 R中的SQL等价表述 42

2.12 读取Twitter数据 46

2.13 从谷歌分析中读取数据 48

2.14 写数据 51

2.15 小结 53

第3章 数据处理 54

3.1 特征工程 57

3.2 数据管道 59

3.3 数据采样 60

3.4 修正变量名 60

3.5 创建新变量 62

3.6 数值离散化 63

3.7 日期处理 65

3.8 将类变量二值化 67

3.9 合并数据集 68

3.10 排列数据集 70

3.11 重塑数据集 71

3.12 使用dplyr进行数据操作 72

3.13 处理缺失数据 75

3.14 特征缩放 77

3.15 降维 78

3.16 小结 81

第4章 探索性数据分析 83

4.1 数据统计 84

4.2 探索性可视化 87

4.3 直方图 88

4.4 箱形图 89

4.5 条形图 92

4.6 密度图 93

4.7 散点图 95

4.8 QQ图 101

4.9 热图 102

4.10 缺失值的图表 103

4.11 解释性图表 104

4.12 小结 106

第5章 回归 107

5.1 一元线性回归 108

5.2 多元线性回归 120

5.3 多项式回归 127

5.4 小结 134

第6章 分类 136

6.1 一个简单的例子 137

6.2 逻辑回归 139

6.3 分类树 143

6.4 朴素贝叶斯 147

6.5 K-最近邻 151

6.6 支持向量机 155

6.7 神经网络 159

6.8 集成 165

6.9 随机森林 168

6.10 梯度提升机 171

6.11 小结 174

第7章 评估模型性能 176

7.1 过拟合 177

7.2 偏差和方差 183

7.3 干扰因子 187

7.4 数据泄漏 188

7.5 测定回归性能 190

7.6 测定分类性能 194

7.7 交叉验证 197

7.8 其他机器学习诊断法 204

7.8.1 获取更多的训练观测数据 205

7.8.2 特征降维 205

7.8.3 添加新特征 205

7.8.4 添加多项式特征 206

7.8.5 对正则化参数进行微调 206

7.9 小结 206

第8章 非监督学习 208

8.1 聚类 209

8.2 模拟聚类 211

8.3 分级聚类 212

8.4 K-均值聚类 219

8.5 主成分分析 224

8.6 小结 233

术语表 234