《数据科学技术与应用》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:宋晖,刘晓强主编;王洪亚,杜明,李柏岩,徐波编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2018
  • ISBN:9787121346651
  • 页数:152 页
图书介绍:本书注重基本知识和最新实用技术的结合,能够将所学的知识融会贯通,联系实际开展数据分析工作。全书内容涵盖数据科学基础知识,数据科学的工作流程,包括数据采集、数据整理和探索、数据可视化和数据建模预测等技术方法和开发实现。通过图像、文本、时序与声音等数据科学领域的前沿应用,介绍数据分析的最新成果和实现方法。本书采用Python作为开发工具,读者只需具备编程语言基础即可。每小节附有思考和练习,每章提供综合练习题,提供电子教案、教学和实验案例。并通过二维码扫描提供知识扩展、学习指导等。

第1章 数据科学基础 1

1.1 数据科学概述 1

1.1.1 数据的力量 1

1.1.2 数据科学的知识结构 3

1.1.3 数据科学的工作流程 4

1.1.4 数据科学与大数据 5

1.2 Python数据分析工具 7

1.2.1 科学计算集成环境Anaconda 7

1.2.2 Python编译环境 7

1.2.3 Jupyter Notebook 8

1.3 Python语言基础 10

1.3.1 常用数据类型 10

1.3.2 流程控制 11

1.3.3 函数和方法库 13

综合练习题 14

第2章 多维数据结构与运算 15

2.1 多维数组对象 15

2.1.1 一维数组对象 16

2.1.2 二维数组对象 17

2.1.3 创建多维数组的常用方法 19

2.2 多维数组运算 21

2.2.1 基本算术运算 21

2.2.2 函数和矩阵运算 22

2.2.3 随机数组生成函数 25

2.3 案例:随机游走轨迹模拟 26

综合练习题 29

第3章 数据汇总与统计 30

3.1 统计基本概念 30

3.1.1 统计的含义 30

3.1.2 常用统计量 31

3.2 pandas数据结构 33

3.2.1 Series对象 33

3.2.2 Series数据访问 34

3.2.3 DataFrame对象 37

3.2.4 DataFrame数据访问 37

3.3 数据文件读写 41

3.3.1 读写CSV和TXT文件 41

3.3.2 读取Excel文件 44

3.4 数据清洗 45

3.4.1 缺失数据处理 46

3.4.2 去除重复数据 48

3.5 数据规整化 49

3.5.1 数据合并 49

3.5.2 数据排序 51

3.6 统计分析 53

3.6.1 通用函数与运算 53

3.6.2 统计函数 54

3.6.3 相关性分析 56

3.6.4 案例:调查反馈表分析 56

综合练习题 59

第4章 数据可视化 60

4.1 Python绘图基础 60

4.1.1 认识基本图形 60

4.1.2 pandas快速绘图 61

4.1.3 Matplotlib精细绘图 63

4.2 可视化数据探索 67

4.2.1 绘制常用图形 67

4.2.2 绘制数据地图 77

综合练习题 81

第5章 机器学习建模分析 83

5.1 机器学习概述 83

5.1.1 机器学习与人工智能 83

5.1.2 Python机器学习方法库 85

5.2 回归分析 85

5.2.1 回归分析原理 85

5.2.2 回归分析实现 86

5.2.3 回归分析性能评估 89

5.3 分类分析 91

5.3.1 分类学习原理 91

5.3.2 决策树 93

5.3.3 支持向量机 96

5.4 聚类分析 100

5.4.1 聚类任务 100

5.4.2 K-means算法 101

5.4.3 聚类方法的性能评估 104

5.5 神经网络和深度学习 106

5.5.1 神经元与感知器 106

5.5.2 神经网络 107

5.5.3 神经网络分类实现 108

5.5.4 深度学习 110

综合练习题 111

第6章 文本数据处理 112

6.1 文本处理概述 112

6.1.1 文本处理的常见任务 112

6.1.2 文本处理的基本步骤 113

6.2 中文文本处理 115

6.2.1 中文分词 115

6.2.2 词性标注 116

6.2.3 特征提取 117

6.3 实例:垃圾邮件识别 120

6.3.1 数据来源 121

6.3.2 构建文本分类特征训练集 122

6.3.3 模型训练和验证 122

综合练习题 123

第7章 图像数据处理 124

7.1 数字图像概述 124

7.1.1 数字图像 124

7.1.2 数字图像类型 125

7.1.3 数字图像处理 125

7.2 Python图像处理 126

7.2.1 Python图像处理库 126

7.2.2 图像基本操作 127

7.3 案例:深度学习实现图像分类 129

7.3.1 卷积神经网络 129

7.3.2 深度学习库Keras 130

7.3.3 用Keras实现图像分类 132

综合练习题 136

第8章 时序数据与语音处理 137

8.1 时序数据概述 137

8.1.1 时序数据特性 137

8.1.2 时序数据特征的提取 138

8.2 时序数据分析方法 140

8.2.1 时序数据分析过程 140

8.2.2 股票预测实例 142

8.3 语音识别实例 146

8.3.1 语音识别技术简介 146

8.3.2 语音识别中的时序数据处理 147

8.3.3 语音识别实例 149

综合练习题 151

参考文献 152