《数据科学理论与实践》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:朝乐门编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2017
  • ISBN:9787302480549
  • 页数:294 页
图书介绍:本书重点介绍数据科学中的新理论和代表性实践,填补数据科学与大数据技术专业的核心教材的空白。主要内容包括:基础理论、流程与方法、技术与工具、数据产品及开发、典型案例及实践、R语言学习笔记与参考手册、数据科学的重要资源。

第1章 基础理论 1

如何开始学习 1

1.1 术语定义 2

1.2 研究目的 7

1.3 发展简史 11

1.4 理论体系 14

1.5 基本原则 16

1.6 数据科学家 23

如何继续学习 28

习题 32

参考文献 32

第2章 理论基础 34

如何开始学习 34

2.1 数据科学的学科地位 35

2.2 统计学 36

2.3 机器学习 42

2.4 数据可视化 56

如何继续学习 58

习题 59

参考文献 59

第3章 流程与方法 61

如何开始学习 61

3.1 基本流程 62

3.2 数据加工 70

3.3 数据审计 79

3.4 数据分析 83

3.5 数据可视化 86

3.6 数据故事化 96

3.7 项目管理 101

如何继续学习 103

习题 104

参考文献 104

第4章 技术与工具 106

如何开始学习 106

4.1 技术体系 107

4.2 MapReduce 112

4.3 Hadoop 119

4.4 Spark 129

4.5 NoSQL与NewSQL 136

4.6 R与Python 148

4.7 发展趋势 149

如何继续学习 153

习题 154

参考文献 154

第5章 数据产品及开发 156

如何开始学习 156

5.1 定义 157

5.2 主要特征 159

5.3 关键活动 163

5.4 数据柔术 164

5.5 数据能力 175

5.6 数据战略 183

5.7 数据治理 185

如何继续学习 188

习题 189

参考文献 189

第6章 典型案例及实践 190

如何开始学习 190

6.1 2012年美国总统大选 191

6.2 统计分析 195

6.3 机器学习 198

6.4 数据可视化 213

6.5 SparkR编程 215

如何继续学习 229

习题 229

参考文献 230

附录A R语言学习笔记与参考手册 231

学习与参考指南 231

1.R变量定义方法 233

2.R语句的写法 234

3.R中的赋值语句 234

4.R的文件读写路径——当前工作目录 235

5.R的变量查找机制——搜索路径 235

6.R中查看帮助的方法 237

7.R区分大小写字母 237

8.R的注释 238

9.R的语句 238

10.R中的变量命名规范 238

11.R中的关键字/保留字 239

12.R中的默认数据类型 240

13.R中数据类型的判断与强制类型转换 241

14.R中的向量 241

15.R中的列表 245

16.R中的数据框 248

17.R中的因子类型 253

18.R中的循环语句 254

19.R中的选择语句 255

20.R中的特殊运算符 256

21.R中的快速生成数列的方法 257

22.R中自定义函数 258

23.R中常用的数学函数 259

24.R中的字符串处理函数 260

25.R中的常用统计函数 262

26.R中的随机数 263

27.R包的用法 264

28.R中的矩阵 265

29.R中的数组 268

30.R中的面向对象编程 269

31.R中的S4类 270

32.R中的数据可视化 273

33.R的输入输出 274

34.R中的正则表达式 275

35.R的数据集 278

36.R第三方包——R的灵魂 279

37.基于R的数据加工 280

附录B 数据科学的重要资源 285

1.学术期刊 285

2.国际会议 285

3.研究机构 286

4.课程资源 286

5.硕士学位项目 286

6.专家学者 287

7.相关工具 287

附录C 术语索引 288

后记 293