当前位置:首页 > 工业技术
数据科学与大数据技术导论
数据科学与大数据技术导论

数据科学与大数据技术导论PDF电子书下载

工业技术

  • 电子书积分:10 积分如何计算积分?
  • 作 者:张祖平编著
  • 出 版 社:长沙:中南大学出版社
  • 出版年份:2018
  • ISBN:9787548733744
  • 页数:217 页
图书介绍:本书全面阐释了大数据的概念、相关的技术和应用的现状,使读者对大数据的相关技术、应用和产业链能有一个比较清晰的认识。 主要内容包括大数据概论、数据组织存储技术、NoSQL、Hadoop 和 MapReduce、数据查询和分析高级技术、数据挖掘技术、数据分析语言 R、大数据用于预测和决策、大数据与市场营销、大数据应用案例、大数据应用主流解决方案等。本书适合高等院校的大数据相关专业的本专科生、研究生以及IT行业的从业人员及所有对大数据感兴趣的人士阅读。
《数据科学与大数据技术导论》目录

第1章 专业概论 1

1.1 专业发展历史 1

1.1.1 专业产生背景 1

1.1.2 专业创办与申报 4

1.2 专业特点要求 4

1.2.1 专业培养定位 4

1.2.2 交叉型与复合型 4

1.3 专业课程模块 5

1.3.1 通识教育课 5

1.3.2 公共基础课 5

1.3.3 学科基础课 5

1.3.4 专业核心课 6

1.3.5 专业课 6

1.3.6 集中实践环节 6

1.3.7 专业完整课程体系供参考选择 7

1.4 专业技能体系 11

1.4.1 大数据环境 11

1.4.2 数据获取 11

1.4.3 数据处理与编程 11

1.4.4 数据挖掘与统计 15

1.4.5 数据预测 18

1.4.6 数据可视化 20

1.5 紧密相关的专业 23

1.5.1 计算机科学与技术 24

1.5.2 统计学 24

1.6 就业前景 24

1.7 本章小结 25

思考题 25

本章相关的实验 26

第2章 数据科学与大数据基本概念 27

2.1 数据相关的概念 27

2.1.1 基本概念 27

2.1.2 数据的分类 28

2.1.3 数据的属性 29

2.1.4 数据集 30

2.1.5 数据特征的统计描述 30

2.1.6 数据的相似性和相异性度量 36

2.2 数据科学 37

2.2.1 数据科学定义 38

2.2.2 发展历史 40

2.2.3 研究内容 40

2.2.4 知识体系 40

2.2.5 与其他学科的关系 55

2.2.6 体系框架 55

2.3 基于数据科学的数据分析与挖掘 56

2.3.1 数据分析应用面临的挑战与发展 56

2.3.2 用好数据科学 57

2.3.3 数据科学平台工具 59

2.4 数据库 59

2.4.1 数据库概述 59

2.4.2 基本概念 60

2.4.3 数据库的分类 65

2.4.4 关系数据库系统操作语言 66

2.5 大数据 71

2.5.1 大数据定义及特征 71

2.5.2 大数据范式 71

2.6 本章小结 73

思考题 73

本章相关的实验 74

第3章 大数据核心技术 75

3.1 数据采集 75

3.1.1 软件接口方式 75

3.1.2 开放数据库方式 76

3.1.3 基于底层数据交换的数据直接采集方式 77

3.1.4 数据爬取 77

3.2 数据存储与管理 81

3.2.1 大数据存储与管理的主要模式 81

3.2.2 大数据存储典型的三种技术路线 82

3.3 数据预处理 84

3.3.1 数据预处理的主要步骤 84

3.3.2 数据核查的主要方法 84

3.3.3 数据提质 85

3.3.4 数据集成 87

3.3.5 数据归约 87

3.3.6 数据变换 88

3.3.7 数据离散化 88

3.4 数据清洗 89

3.4.1 基本概念 89

3.4.2 数据清洗原理 90

3.4.3 需要清洗的主要数据类型 90

3.4.4 数据清洗方法 91

3.5 数据挖掘 92

3.5.1 起源 92

3.5.2 发展阶段 92

3.5.3 主要方法 93

3.5.4 行业应用 94

3.5.5 数据挖掘经典算法 96

3.5.6 关联规则挖掘 96

3.5.7 数据挖掘相关技术 101

3.6 数据可视化 101

3.6.1 概述 101

3.6.2 概念 101

3.6.3 主要应用 102

3.6.4 基本思想 102

3.6.5 基本手段 102

3.6.6 适用范围 102

3.6.7 发展阶段 103

3.6.8 大数据可视化 104

3.7 本章小结 106

思考题 106

本章相关的实验 107

第4章 大数据环境与技术 108

4.1 典型大数据环境及工具 108

4.1.1 Hadoop综述 108

4.1.2 Hadoop特点 109

4.1.3 Hadoop核心架构 110

4.1.4 Hadoop的发展及社区服务 112

4.1.5 Hadoop应用实例 114

4.1.6 Hadoop安装 114

4.1.7 Hadoop配置及启动服务 115

4.1.8 Hadoop文件操作 118

4.2 典型大数据实用技术 120

4.2.1 存储HDFS及相关技术 120

4.2.2 计算Yarn及相关技术 125

4.2.3 计算Spark及相关技术 134

4.3 本章小结 140

思考题 141

本章相关的实验 141

第5章 大数据应用系统 142

5.1 医疗大数据 142

5.1.1 医疗大数据背景 142

5.1.2 医疗大数据应用技术研究中心 144

5.1.3 医疗大数据应用关键技术 146

5.1.4 引领未来的关键共性技术 167

5.1.5 医疗大数据软硬件环境 169

5.2 交通大数据 172

5.2.1 交通大数据背景 172

5.2.2 交通大数据应用中面临的问题 173

5.2.3 交通大数据数据特点及数据来源 174

5.2.4 交通大数据融合技术 175

5.2.5 交通大数据的全流程分层次特点与技术 182

5.2.6 交通大数据安全技术 183

5.2.7 交通大数据的数据发现 185

5.2.8 交通管理数据库设计技术 187

5.2.9 交通大数据应用 189

5.2.10 交通大数据软硬件环境 193

5.2.11 交通大数据分析与展示技术 196

5.3 本章小结 199

思考题 199

本章相关的实验 200

附录:数据科学与大数据技术培养方案 201

参考文献 217

相关图书
作者其它书籍
返回顶部