当前位置:首页 > 工业技术
数据挖掘理论与技术
数据挖掘理论与技术

数据挖掘理论与技术PDF电子书下载

工业技术

  • 电子书积分:10 积分如何计算积分?
  • 作 者:罗森林,马俊,潘丽敏编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2013
  • ISBN:9787121189890
  • 页数:242 页
图书介绍:本书介绍数据挖掘的经典内容和包括作者团队的最新研究成果。适应于交叉学科人才的培养,是经过长期酝酿和多年教学经验总结而认真构架而成的,包括数据挖掘产生背景、基本概念和发展趋势分析;数据预处理技术;数据挖掘算法的评分函数;数据分析和不确定性;数据仓库与OLAP技术,此处引入了课题组的基因芯片的数据处理方法和成果,包括所采用的SOM聚类算法、实验及结果分析等;数据的分类分析、聚类分析、关联规则发现;统计预测方法与序列模式挖掘;数据挖掘高级应用,将融入课题组多年的研究方法和研究成果。
《数据挖掘理论与技术》目录

第1章 绪论 1

1.1数据挖掘产生的背景 1

1.1.1技术背景 1

1.1.2理论基础 2

1.1.3数据挖掘相关概念 3

1.2数据挖掘知识基础 4

1.2.1基本概念及特点 4

1.2.2数据集 5

1.2.3功能与分类 7

1.2.4任务与过程 9

1.2.5方法与步骤 14

1.3数据挖掘简史与现状 16

1.3.1简史 16

1.3.2现状 19

1.4数据挖掘的技术工具 19

1.4.1技术工具 20

1.4.2工具选择 24

1.5数据挖掘的应用 25

1.5.1典型应用 25

1.5.2高级应用 27

1.6技术难点与发展趋势 32

1.6.1常见误解 32

1.6.2技术难点 33

1.6.3发展趋势 34

1.7本章小结 35

思考题 35

第2章 概率统计理论基础 36

2.1引言 36

2.2概率统计知识基础 36

2.3随机变量的分布函数 37

2.3.1多维随机变量 37

2.3.2条件分布 39

2.4统计推理 40

2.5参数估计 41

2.5.1估计理论 41

2.5.2最大似然估计 43

2.5.3贝叶斯估计 44

2.6假设检验 45

2.7数据采样方法 45

2.8本章小结 47

思考题 47

第3章 数据挖掘效果评价 48

3.1引言 48

3.2模型的评分函数 48

3.2.1基本概念 48

3.2.2预测模型的评分函数 49

3.2.3描述模型的评分函数 52

3.3模型的比较与验证 54

3.3.1模型比较 54

3.3.2模型验证 55

3.4模型的性能提升 55

3.4.1增量学习 56

3.4.2半监督学习 57

3.4.3迁移学习 59

3.4.4反模型 60

3.4.5 Boosting 61

3.5模型的建立与使用 62

3.5.1模型的建立 62

3.5.2模型的理解 62

3.5.3模型的使用 62

3.6本章小结 63

思考题 63

第4章 数据预处理 64

4.1引言 64

4.2数据预处理知识基础 64

4.3数据清理 65

4.3.1遗漏值 65

4.3.2噪声数据 65

4.3.3不一致数据 67

4.4数据集成 67

4.5数据转换 68

4.6数据规约 69

4.6.1数据方聚集 69

4.6.2维归约 70

4.6.3数据压缩 71

4.6.4数值归约 73

4.7数据离散 78

4.8应用实例分析 80

4.8.1腹围空缺数值归一化弥补方法 80

4.8.2 Ⅱ型糖尿病数据预处理 87

4.9本章小结 91

思考题 91

第5章 数据仓库 93

5.1引言 93

5.2数据仓库知识基础 93

5.2.1基本概念 93

5.2.2基本作用 94

5.2.3与数据挖据的关系 94

5.3数据仓库中的模型 95

5.3.1概念模型 95

5.3.2物理模型 96

5.3.3元数据模型 98

5.3.4多维数据模型 99

5.4数据仓库系统结构 100

5.4.1组成 100

5.4.2数据仓库概念结构 101

5.4.3数据仓库结构类型 102

5.5 OLAP分析 103

5.5.1知识基础 103

5.5.2多维分析 105

5.5.3 OLAP结构 107

5.5.4多维数据库 108

5.5.5关系数据库 108

5.6本章小结 109

思考题 109

第6章 数据分类分析 110

6.1引言 110

6.2分类分析知识基础 110

6.2.1基本概念 110

6.2.2基本作用 110

6.2.3评价方法 110

6.3主要技术方法及分析 112

6.4贝叶斯分类 114

6.4.1朴素贝叶斯分类法 115

6.4.2贝叶斯网络 117

6.4.3动态贝叶斯网络 118

6.5基于决策树的算法 119

6.5.1基本思想 119

6.5.2 ID3算法 119

6.5.3 C4.5算法 120

6.5.4 SLIQ算法 123

6.5.5 SPRINT算法 123

6.6神经网络与遗传算法 124

6.6.1神经网络 124

6.6.2遗传算法 127

6.7支持向量机 129

6.8粗糙集与模糊集 133

6.8.1粗糙集 133

6.8.2模糊集 136

6.9最大熵模型 137

6.10应用实例分析 141

6.10.1汉语句义类型识别 141

6.10.2特定音频事件识别 145

6.11本章小结 155

思考题 155

第7章 数据聚类分析 156

7.1引言 156

7.2聚类分析知识基础 156

7.2.1基本概念 156

7.2.2基本作用 156

7.2.3近邻测度 157

7.2.4评价方法 159

7.3主要技术方法及分析 160

7.4基于划分的算法 162

7.4.1基本思想 162

7.4.2 K-means算法 162

7.4.3 K-medoids算法 163

7.4.4 CLARANS算法 163

7.5基于层次的算法 164

7.5.1基本思想 164

7.5.2 BIRCH算法 165

7.5.3 CURE算法 166

7.5.4 ROCK算法 166

7.5.5 Chameleon算法 167

7.6基于密度的算法 168

7.6.1基本思想 168

7.6.2 DBSCAN算法 169

7.6.3 OPTICS算法 169

7.6.4 DENCLUE算法 170

7.7基于网格的算法 171

7.7.1基本思想 171

7.7.2 STING算法 171

7.7.3 Wave Cluster算法 172

7.7.4 CLIQUE算法 173

7.8基于模型的算法 174

7.8.1基本思想 174

7.8.2 EM算法 174

7.8.3 COBWEB算法 174

7.8.4自组织神经网络 175

7.9应用实例分析 176

7.9.1镜头聚类 176

7.9.2文本聚类 180

7.10本章小结 188

思考题 188

第8章 关联规则发现 189

8.1引言 189

8.2关联规则发现知识基础 189

8.2.1基本概念 189

8.2.2评价方法 189

8.2.3注意事项 191

8.3主要技术方法及分析 192

8.4关联规则的基本算法 193

8.4.1 Apriori算法 193

8.4.2 FP-树频集算法 194

8.4.3 CIoSpan 195

8.5并行和分布式关联规则算法 200

8.5.1并行关联规则 200

8.5.2分布式关联规则 202

8.6多层次关联规则算法 203

8.7数量关联规则算法 204

8.8应用实例分析——蠕虫检测 205

8.9本章小结 212

思考题 212

第9章 统计预测方法 213

9.1引言 213

9.2统计预测方法知识基础 213

9.3主要技术方法及分析 214

9.4回归预测方法 215

9.4.1线性和多元回归 215

9.4.2非线性回归 215

9.5 Box-Jenkins回归 216

9.6隐马模型 217

9.6.1隐马尔可夫模型 218

9.6.2隐半马尔可夫模型 224

9.7应用实例分析 226

9.7.1 Ⅱ型糖尿病发病危险状态预测 226

9.7.2关键人物判定 231

9.8本章小结 239

思考题 239

参考文献 240

相关图书
作者其它书籍
返回顶部