数据挖掘教程PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:邓纳姆(MargaretH.Dunham)著;郭崇慧,田凤占,靳晓明等译;陆玉昌审校
- 出 版 社:北京:清华大学出版社
- 出版年份:2005
- ISBN:7302105332
- 页数:280 页
第1部分 导论 3
第1章 概述 3
目录 3
1.1 基本数据挖掘任务 5
1.1.1 分类 5
1.1.2 回归 5
1.1.3 时间序列分析 6
1.1.4 预测 6
1.1.5 聚类 7
1.1.6 汇总 7
1.1.7 关联规则 7
1.2 数据挖掘与数据库中的知识发现 8
1.1.8 序列发现 8
1.2.1 数据挖掘的发展 10
1.3 数据挖掘问题 12
1.4 数据挖掘度量 13
1.5 数据挖掘的社会影响 14
1.6 从数据库观点看数据挖掘 14
1.7 数据挖掘的未来发展 15
1.8 练习 16
1.9 参考文献注释 17
第2章 相关概念 19
2.1 数据库/OLTP系统 19
2.2 模糊集和模糊逻辑 21
2.3 信息检索 23
2.4 决策支持系统 25
2.5 维数据建模 25
2.5.1 多维模式 27
2.5.2 索引 30
2.6 数据仓储 31
2.7 OLAP 34
2.8 Web搜索引擎 35
2.9 统计学 36
2.10 机器学习 37
2.11 模式匹配 38
2.14 参考文献注释 39
2.13 练习 39
2.12 小结 39
第3章 数据挖掘技术 41
3.1 引言 41
3.2 数据挖掘的统计方法 42
3.2.1 点估计 42
3.2.2 基于汇总的模型 45
3.2.3 贝叶斯定理 46
3.2.4 假设检验 48
3.2.5 回归和相关 49
3.3 相似性度量 50
3.4 决策树 51
3.5 神经网络 53
3.5.1 激励函数 56
3.6 遗传算法 57
3.7 练习 60
3.8 参考文献注释 61
第2部分 核心课题 65
第4章 分类 65
4.1 引言 65
4.1.1 分类中的问题 67
4.2 基于统计的算法 69
4.2.1 回归 69
4.2.2 贝叶斯分类 74
4.3.1 简单方法 76
4.3 基于距离的算法 76
4.3.2 K最近邻 77
4.4 基于决策树的算法 79
4.4.1 ID3 83
4.4.2 C4.5和C5.0 85
4.4.3 CART 87
4.4.4 可伸缩的决策树技术 88
4.5 基于神经网络的算法 88
4.5.1 传播 90
4.5.2 神经网络有指导学习 91
4.5.3 径向基函数网络 95
4.5.4 感知器 96
4.6 基于规则的算法 96
4.6.1 从决策树生成规则 97
4.6.2 从神经网络生成规则 98
4.6.3 不用决策树或神经网络生成规则 98
4.7 组合技术 101
4.8 小结 103
4.9 练习 103
4.10 参考文献注释 104
第5章 聚类 107
5.1 引言 107
5.2 相似性和距离度量 110
5.3 异常点 111
5.4 层次算法 112
5.4.1 凝聚算法 113
5.4.2 分裂聚类 117
5.5 划分算法 118
5.5.1 最小生成树 118
5.5.2 平方误差聚类算法 119
5.5.3 K均值聚类 120
5.5.4 最近邻算法 121
5.5.5 PAM算法 122
5.5.6 结合能量算法 125
5.5.7 基于遗传算法的聚类 125
5.5.8 基于神经网络的聚类 126
5.6 大型数据库聚类 128
5.6.1 BIRCH 129
5.6.2 DBSCAN 130
5.6.3 CURE算法 132
5.7 对类别属性进行聚类 135
5.8 比较 137
5.9 练习 138
5.10 参考文献注释 138
第6章 关联规则 141
6.1 引言 141
6.2 大项目集 144
6.3 基本算法 145
6.3.1 Apriori算法 145
6.3.2 抽样算法 149
6.3.3 划分 152
6.4.1 数据并行 154
6.4 并行和分布式算法 154
6.4.2 任务并行 155
6.5 方法比较 157
6.6 增量规则 158
6.7 高级关联规则技术 159
6.7.1 泛化关联规则 159
6.7.2 多层关联规则 160
6.7.3 数量关联规则 160
6.7.4 使用多个最小支持度 161
6.7.5 相关规则 162
6.8 度量规则的质量 162
6.10 参考文献注释 164
6.9 练习 164
第3部分 高级课题 169
第7章 Web挖掘 169
7.1 引言 169
7.2 Web内容挖掘 170
7.2.1 爬虫 171
7.2.2 Harvest系统 174
7.2.3 虚拟Web视图 174
7.2.4 个性化 175
7.3 Web结构挖掘 176
7.3.1 PageRank 177
7.3.2 Clever 177
7.4 Web使用挖掘 178
7.4.1 预处理 179
7.4.2 数据结构 181
7.4.3 模式发现 182
7.4.4 模式分析 187
7.5 练习 188
7.6 参考文献注释 188
第8章 空间数据挖掘 190
8.1 引言 190
8.2 空间数据概述 191
8.2.1 空间查询 191
8.2.2 空间数据结构 191
8.3 空间数据挖掘原语 195
8.2.3 主题地图 195
8.2.4 图像数据库 195
8.4 般化和特殊化 196
8.4.1 渐进求精 196
8.4.2 一般化 197
8.4.3 最近邻 199
8.4.4 STING 199
8.5 空间规则 201
8.5.1 空间关联规则 201
8.6 空间分类算法 203
8.6.1 对ID3的扩展 203
8.6.2 空间决策树 203
8.7 空间聚类算法 204
8.7.1 对CLARANS的扩展 205
8.7.2 SD(CLARANS) 206
8.7.3 DBCLASD 206
8.7.4 BANG 207
8.7.5 WaveCluster 208
8.7.6 近似 208
8.8 练习 209
8.9 参考文献注释 209
第9章 时序数据挖掘 211
9.1 引言 211
9.2 时序事件建模 213
9.3.1 时间序列分析 217
9.3 时间序列 217
9.3.2 趋势分析 218
9.3.3 变换 219
9.3.4 相似性 219
9.3.5 预测 220
9.4 模式检测 221
9.4.1 串匹配 222
9.5 时序序列 224
9.5.1 AprioriAll 225
9.5.2 SPADE 226
9.5.3 一般化 227
9.6 时序关联规则 229
9.5.4 特征抽取 229
9.6.1 事务间关联规则 230
9.6.2 情节规则 230
9.6.3 趋势依赖 231
9.6.4 序列关联规则 233
9.6.5 日历关联规则 233
9.7 练习 234
9.8 参考文献注释 234
附录A 数据挖掘产品 236
A.1 参考文献注释 252
附录B 参考文献 253
词汇表 268
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《激光加工实训技能指导理实一体化教程 下》王秀军,徐永红主编;刘波,刘克生副主编 2017
- 《AutoCAD 2019 循序渐进教程》雷焕平,吴昌松,陈兴奎主编 2019
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《Photoshop CC 2018基础教程》温培利,付华编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《英语自学进阶教程全6册 3》爱尔兰迪尔德丽出版社著 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019