《数据科学与大数据技术导论》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:方志军主编;董新华,俞雷,于为,黄勃副主编
  • 出 版 社:武汉:华中科技大学出版社
  • 出版年份:2019
  • ISBN:9787568052207
  • 页数:254 页
图书介绍:当今时代是一个充斥着庞大信息量的时代,身处这样一个时代,如若能够站在数据链的顶端,便能够应用数据来解决一些现实问题,如减少决策误差、量化风险、减少损失,并通过大数据的分析解决社会问题等等。本书浅谈了大数据的应用领域、大数据与统计学之间的关系等问题,希望读者能够通过这本书的学习能够对大数据有细致的了解。本书首先介绍了数据、大数据、数据挖掘的定义定,介绍了Python基础知识、数据分析与可视化,进而介绍数据挖掘、机器学习、大数据处理的相关知识。在介绍了热门概念和知识点之后,对python相关的数据处理功能做了详细介绍,并配合案例讲解如何将理论应用于实践。

第1章 什么是大数据 1

1.1 数据、大数据及数据挖掘 1

1.2 大数据与统计学 5

1.3 机器学习与人工智能 6

1.4 相关领域应用 8

1.5 本章小结 12

1.6 习题 12

第2章 Python基础知识 13

2.1 Python概述 13

2.2 Python数据类型 17

2.3 判断与循环 43

2.4 函数与模块 55

2.5 文件的读/写 69

2.6 异常与警告 73

2.7 本章小结 79

2.8 习题 79

第3章 数据分析与可视化 81

3.1 Python数据分析包 81

3.2 数据准备 83

3.3 数据处理 95

3.4 数据分析 121

3.5 数据可视化 131

3.6 本章小结 142

3.7 习题 142

第4章 数据挖掘 145

4.1 数据挖掘绪论 145

4.2 数据存储 153

4.3 数据挖掘技术 161

4.4 数据挖掘应用 173

4.5 本章小结 181

4.6 习题 182

第5章 机器学习 183

5.1 机器学习概述 183

5.2 回归分析 185

5.3 分类算法 190

5.4 聚类算法 197

5.5 深度学习 201

5.6 机器学习的应用 204

5.7 本章小结 205

5.8 习题 205

第6章 大数据处理 206

6.1 Hadoop概述 206

6.2 Hadoop生态系统 208

6.3 Hadoop集群的安装与配置 211

6.4 HDFS简介 219

6.5 MapReduce编程模型 226

6.6 资源管理调度框架 232

6.7 Spark 238

6.8 本章小结 252

6.9 习题 253

参考文献 254