《数据挖掘与知识发现》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:李雄飞,李军编著
  • 出 版 社:北京:高等教育出版社
  • 出版年份:2003
  • ISBN:7040133083
  • 页数:228 页
图书介绍:本书详尽地阐述了数据挖掘与知识发现领域中的一些基本理论和研究方法。介绍了KDD与数据挖掘的概念、数据挖掘对象、知识发现过程、研究方法以及相关研究领域和应用范围。作为知识发现的数据预处理工作,简要叙述了数据清理、数据约简、数据概念等级分层、多维数据模型等内容。书中较详细地介绍了粗糙集、模糊集、聚类分析、关联规则、人工神经网络、分类与预测等数据挖掘方法,最后还简要介绍了多媒体数据挖掘工作的有关进展。本书可以作为计算机科学与技术专业和信息科学方向高年级本科生和研究生的教材或参考书,也可供有关科技人员学习参考。

第一章 绪论 1

1.1 引言 1

目录 1

1.2 KDD与数据挖掘 2

1.2.1 KDD定义 2

1.2.2 KDD过程 3

1.2.3 数据库技术发展与数据挖掘 4

1.3 数据挖掘的对象与环境 6

1.3.1 数据与系统特征 6

1.3.2 数据结构 6

1.3.3 数据库系统 7

1.4.2 粗糙集 10

1.4 数据挖掘方法与相关领域 10

1.4.1 数据挖掘相关领域 10

1.4.3 聚类 11

1.4.4 关联规则 11

1.4.5 决策树 12

1.4.6 模糊集 13

1.4.7 规则归纳 13

1.4.8 进化计算 14

1.5 KDD系统与应用 15

本章小结 17

习题一 17

2.1.1 填补空缺值 18

2.1 数据清理 18

第二章 数据预处理与数据仓库 18

2.1.2 消除噪声数据 19

2.1 3实现数据一致性 20

2.2 数据集成与转换 20

2.2.1 数据集成 20

2.2.2 数据转换 21

2.3 数据归约与浓缩 22

2.3.1 数据立方体聚集 22

2.3.2 维归约 23

2.3.3 数据压缩 24

2.3.4 数值归约 25

2.4.1 概念分层的概念 28

2.4 概念分层 28

2.4.2 概念分层的类型 29

2.4.3 数值数据的概念分层与离散化 30

2.4.4 分类数据的概念分层 31

2.5 数据仓库与多维数据模型 32

2.5.1 数据仓库的概念 32

2.5.2 数据仓库中的数据组织 33

2.5.3 数据立方体 36

2.5.4 多维数据库模式 37

2.6 数据仓库与数据挖掘 39

2.6.1 数据仓库应用 39

2.6.2 数据挖掘和数据仓库的关系 40

习题二 41

本章小结 41

3.1 近似空间 43

3.1.1 近似空间与不可分辨关系 43

第三章 粗糙集 43

3.1.2 知识与知识库 44

3.2 近似与粗糙集 46

3.2.1 近似与粗糙集的基本概念 46

3.2.2 粗糙集的基本性质 48

3.3 粗糙集的特征描述 48

3.3.1 近似精度 48

33.2 粗糙集隶属函数 49

3.3 3拓扑特征 50

3.4.1 约简和核 51

3.4 知识约简 51

3.4.2 相对约简和相对核 52

3.5 知识的依赖性 53

3.6 信息系统 54

3.6.1 信息系统的定义 54

3.6.2 分辨矩阵与分辨函数 56

3.7 决策表 57

3.8 决策规则 60

3.9 扩展的粗糙集模型 61

3.9.1 可变精度粗糙集模型(VPRS) 61

3.9.2 相似模型 61

习题三 62

本章小结 62

第四章 模糊集 65

4.1 模糊集定义与隶属函数 65

4.1.1 模糊集定义与隶属函数 65

4.1.2 模糊集合的表示法 67

4.2 模糊集的基本运算 68

4.3 分解定理与扩展原理 70

4.4 模糊集的特征 73

4.5 模糊集的度量 74

4.5.1 模糊度 74

4.5.2 模糊集间的距离 75

4.6.1 模糊关系定义 76

4.6 模糊关系 76

4.5.3 模糊集的贴近度 76

4.6.2 模糊关系的运算与性质 77

4.6 3模糊等价关系与模糊相似关系 79

4.7 模糊聚类分析 79

4.7.1 模糊划分 80

4.7.2 模糊相似系数的标定方法 80

4.7.3 模糊聚类分析 83

4.7.4 传递闭包法 85

4.7.5 最大树法 86

4.7.6 模糊C-均值聚类(FCM) 88

4.8 模糊集与粗糙集 90

习题四 91

本章小结 91

第五章 聚类分析 93

5.1 聚类分析简介 93

5.2 聚类分析中的数据类型 95

5.3 划分方法 97

53.1 k-均值算法 97

5.3.2 k-中心点算法 98

5.3.3 EM算法 100

5.4 层次方法 102

5.4.1 凝聚的和分裂的层次聚类 102

5.4.2 利用层次方法进行平衡迭代归约和聚类 104

5.4.4 采用动态建模技术的层次聚类算法 105

5.4.3 利用代表点聚类 105

5.5 基于密度的方法 108

5.6 基于网格的方法 111

5.7 基于模型的聚类方法 114

5.8 孤立点分析 115

本章小结 116

习题五 116

第六章 关联规则 118

6.1 引言 118

6.2 关联规则基本模型 118

6.2.1 关联规则基本模型 118

6.2.2 Apriori算法 119

6.2.3 LIG算法 122

6.2.4 FP算法 128

6.3.1 多级关联规则 132

6.3 多级关联规则与多维关联规则 132

6.3.2 多维关联规则 134

6.4 关联规则价值衡量与发展 139

6.4.1 规则价值衡量 139

6.4.2 基于约束的关联规则 140

6.4.3 关联规则新进展 142

本章小结 144

习题六 144

7.1 人工神经元及人工神经网络模型 146

7.1.1 M-P模型 146

第七章 人工神经网络 146

7.1.2 人工神经元的形式化描述 147

7.1.3 神经网络的分类 149

7.1.4 人工神经网络的学习方式 149

7.2 前向神经网络 150

7.2.1 感知器 150

7.2.2 多层前向神经网络的BP算法 151

7.2.3 径向基函数神经网络 156

7.3 反馈神经网络 157

7.3.1 前向神经网络与反馈神经网络的比较 157

7.3.2 反馈神经网络模型 157

7.3.3 离散型Hopfie1d神经网络 159

7.3.4 连续型Hopfie1d神经网络 160

7.3.5 Boltzmann机 162

7.4 自组织竞争神经网络模型 163

7.5 基于人工神经网络的数据挖掘 166

本章小结 166

习题七 166

第八章 分类与预测 167

8.1 简介 167

8.2 决策树 167

8.2.1 决策树学习 167

8.2.2 决策树的剪枝 172

8.2.3 决策树算法的改进 173

8.2.4 决策树算法的可伸缩性 174

8.3.1 贝叶斯公式 175

8.3 贝叶斯分类 175

8.3.2 朴素贝叶斯分类 176

8.3.3 贝叶斯网络 178

8.3.4 学习贝叶斯网络 181

8.4 基于遗传算法分类 182

8.4.1 遗传算法的发展 182

8.4.2 遗传算法的基本原理 183

8.4.3 基本遗传算法 187

8.4.4 遗传算法的基本实现技术 189

8.5 分类法的评估 193

8.5.1 评估分类法的精度 193

8.6 预测 194

8.5.2 提高分类法的精度 194

8.6.1 时间序列预测模型 195

8.6.2 线性回归和多元回归 197

8.6.3 非线性回归 204

8.6.4 其他回归模型 204

8.6.5 马尔可夫链 204

本章小结 207

习题八 208

第九章 多媒体数据挖掘 210

9.1 简介 210

9.2 多媒体数据库 211

9.2.1 MM-DBMS体系结构 211

9.2.2 数据模型 212

9.2.3 MM-DBMS的功能 213

9.3 挖掘多媒体数据 215

9.3.1 概述 215

9.3.2 文本挖掘 215

9.3.3 图像挖掘 217

9.3.4 视频挖掘 218

9.3.5 音频挖掘 220

9.3.6 复合类型数据的挖掘 222

本章小结 223

习题九 223

参考文献 224

名词索引 227