数据挖掘与知识发现PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:李雄飞,李军编著
- 出 版 社:北京:高等教育出版社
- 出版年份:2003
- ISBN:7040133083
- 页数:228 页
第一章 绪论 1
1.1 引言 1
目录 1
1.2 KDD与数据挖掘 2
1.2.1 KDD定义 2
1.2.2 KDD过程 3
1.2.3 数据库技术发展与数据挖掘 4
1.3 数据挖掘的对象与环境 6
1.3.1 数据与系统特征 6
1.3.2 数据结构 6
1.3.3 数据库系统 7
1.4.2 粗糙集 10
1.4 数据挖掘方法与相关领域 10
1.4.1 数据挖掘相关领域 10
1.4.3 聚类 11
1.4.4 关联规则 11
1.4.5 决策树 12
1.4.6 模糊集 13
1.4.7 规则归纳 13
1.4.8 进化计算 14
1.5 KDD系统与应用 15
本章小结 17
习题一 17
2.1.1 填补空缺值 18
2.1 数据清理 18
第二章 数据预处理与数据仓库 18
2.1.2 消除噪声数据 19
2.1 3实现数据一致性 20
2.2 数据集成与转换 20
2.2.1 数据集成 20
2.2.2 数据转换 21
2.3 数据归约与浓缩 22
2.3.1 数据立方体聚集 22
2.3.2 维归约 23
2.3.3 数据压缩 24
2.3.4 数值归约 25
2.4.1 概念分层的概念 28
2.4 概念分层 28
2.4.2 概念分层的类型 29
2.4.3 数值数据的概念分层与离散化 30
2.4.4 分类数据的概念分层 31
2.5 数据仓库与多维数据模型 32
2.5.1 数据仓库的概念 32
2.5.2 数据仓库中的数据组织 33
2.5.3 数据立方体 36
2.5.4 多维数据库模式 37
2.6 数据仓库与数据挖掘 39
2.6.1 数据仓库应用 39
2.6.2 数据挖掘和数据仓库的关系 40
习题二 41
本章小结 41
3.1 近似空间 43
3.1.1 近似空间与不可分辨关系 43
第三章 粗糙集 43
3.1.2 知识与知识库 44
3.2 近似与粗糙集 46
3.2.1 近似与粗糙集的基本概念 46
3.2.2 粗糙集的基本性质 48
3.3 粗糙集的特征描述 48
3.3.1 近似精度 48
33.2 粗糙集隶属函数 49
3.3 3拓扑特征 50
3.4.1 约简和核 51
3.4 知识约简 51
3.4.2 相对约简和相对核 52
3.5 知识的依赖性 53
3.6 信息系统 54
3.6.1 信息系统的定义 54
3.6.2 分辨矩阵与分辨函数 56
3.7 决策表 57
3.8 决策规则 60
3.9 扩展的粗糙集模型 61
3.9.1 可变精度粗糙集模型(VPRS) 61
3.9.2 相似模型 61
习题三 62
本章小结 62
第四章 模糊集 65
4.1 模糊集定义与隶属函数 65
4.1.1 模糊集定义与隶属函数 65
4.1.2 模糊集合的表示法 67
4.2 模糊集的基本运算 68
4.3 分解定理与扩展原理 70
4.4 模糊集的特征 73
4.5 模糊集的度量 74
4.5.1 模糊度 74
4.5.2 模糊集间的距离 75
4.6.1 模糊关系定义 76
4.6 模糊关系 76
4.5.3 模糊集的贴近度 76
4.6.2 模糊关系的运算与性质 77
4.6 3模糊等价关系与模糊相似关系 79
4.7 模糊聚类分析 79
4.7.1 模糊划分 80
4.7.2 模糊相似系数的标定方法 80
4.7.3 模糊聚类分析 83
4.7.4 传递闭包法 85
4.7.5 最大树法 86
4.7.6 模糊C-均值聚类(FCM) 88
4.8 模糊集与粗糙集 90
习题四 91
本章小结 91
第五章 聚类分析 93
5.1 聚类分析简介 93
5.2 聚类分析中的数据类型 95
5.3 划分方法 97
53.1 k-均值算法 97
5.3.2 k-中心点算法 98
5.3.3 EM算法 100
5.4 层次方法 102
5.4.1 凝聚的和分裂的层次聚类 102
5.4.2 利用层次方法进行平衡迭代归约和聚类 104
5.4.4 采用动态建模技术的层次聚类算法 105
5.4.3 利用代表点聚类 105
5.5 基于密度的方法 108
5.6 基于网格的方法 111
5.7 基于模型的聚类方法 114
5.8 孤立点分析 115
本章小结 116
习题五 116
第六章 关联规则 118
6.1 引言 118
6.2 关联规则基本模型 118
6.2.1 关联规则基本模型 118
6.2.2 Apriori算法 119
6.2.3 LIG算法 122
6.2.4 FP算法 128
6.3.1 多级关联规则 132
6.3 多级关联规则与多维关联规则 132
6.3.2 多维关联规则 134
6.4 关联规则价值衡量与发展 139
6.4.1 规则价值衡量 139
6.4.2 基于约束的关联规则 140
6.4.3 关联规则新进展 142
本章小结 144
习题六 144
7.1 人工神经元及人工神经网络模型 146
7.1.1 M-P模型 146
第七章 人工神经网络 146
7.1.2 人工神经元的形式化描述 147
7.1.3 神经网络的分类 149
7.1.4 人工神经网络的学习方式 149
7.2 前向神经网络 150
7.2.1 感知器 150
7.2.2 多层前向神经网络的BP算法 151
7.2.3 径向基函数神经网络 156
7.3 反馈神经网络 157
7.3.1 前向神经网络与反馈神经网络的比较 157
7.3.2 反馈神经网络模型 157
7.3.3 离散型Hopfie1d神经网络 159
7.3.4 连续型Hopfie1d神经网络 160
7.3.5 Boltzmann机 162
7.4 自组织竞争神经网络模型 163
7.5 基于人工神经网络的数据挖掘 166
本章小结 166
习题七 166
第八章 分类与预测 167
8.1 简介 167
8.2 决策树 167
8.2.1 决策树学习 167
8.2.2 决策树的剪枝 172
8.2.3 决策树算法的改进 173
8.2.4 决策树算法的可伸缩性 174
8.3.1 贝叶斯公式 175
8.3 贝叶斯分类 175
8.3.2 朴素贝叶斯分类 176
8.3.3 贝叶斯网络 178
8.3.4 学习贝叶斯网络 181
8.4 基于遗传算法分类 182
8.4.1 遗传算法的发展 182
8.4.2 遗传算法的基本原理 183
8.4.3 基本遗传算法 187
8.4.4 遗传算法的基本实现技术 189
8.5 分类法的评估 193
8.5.1 评估分类法的精度 193
8.6 预测 194
8.5.2 提高分类法的精度 194
8.6.1 时间序列预测模型 195
8.6.2 线性回归和多元回归 197
8.6.3 非线性回归 204
8.6.4 其他回归模型 204
8.6.5 马尔可夫链 204
本章小结 207
习题八 208
第九章 多媒体数据挖掘 210
9.1 简介 210
9.2 多媒体数据库 211
9.2.1 MM-DBMS体系结构 211
9.2.2 数据模型 212
9.2.3 MM-DBMS的功能 213
9.3 挖掘多媒体数据 215
9.3.1 概述 215
9.3.2 文本挖掘 215
9.3.3 图像挖掘 217
9.3.4 视频挖掘 218
9.3.5 音频挖掘 220
9.3.6 复合类型数据的挖掘 222
本章小结 223
习题九 223
参考文献 224
名词索引 227
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《POPs知多少之溴系阻燃剂》生态环境部对外合作与交流中心 2019
- 《全国高等中医药行业“十三五”创新教材 中医药学概论》翟华强 2019
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《习近平总书记教育重要论述讲义》本书编写组 2020
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《高等数学试题与详解》西安电子科技大学高等数学教学团队 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《教育学考研应试宝典》徐影主编 2019
- 《语文教育教学实践探索》陈德收 2018
- 《家庭音乐素养教育》刘畅 2018