国外计算机科学经典教材 数据挖掘 概念、模型、方法和算法 第2版PDF电子书下载
- 电子书积分:14 积分如何计算积分?
- 作 者:(美)坎塔尔季奇著;王晓海,吴志刚译
- 出 版 社:北京:清华大学出版社
- 出版年份:2013
- ISBN:9787302307143
- 页数:403 页
第1章 数据挖掘的概念 1
1.1 概述 1
1.2 数据挖掘的起源 3
1.3 数据挖掘过程 4
1.4 大型数据集 7
1.5 数据仓库 10
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败 13
1.7 本书结构安排 15
1.8 复习题 16
1.9 参考书目 17
第2章 数据准备 19
2.1 原始数据的表述 19
2.2 原始数据的特性 23
2.3 原始数据的转换 24
2.3.1 标准化 24
2.3.2 数据平整 25
2.3.3 差值和比率 25
2.4 丢失数据 26
2.5 时间相关数据 27
2.6 异常点分析 30
2.7 复习题 35
2.8 参考书目 38
第3章 数据归约 41
3.1 大型数据集的维度 41
3.2 特征归约 43
3.2.1 特征选择 44
3.2.2 特征提取 48
3.3 Relief算法 50
3.4 特征排列的熵度量 51
3.5 主成分分析 53
3.6 值归约 55
3.7 特征离散化:ChiMerge技术 58
3.8 案例归约 61
3.9 复习题 63
3.10 参考书目 64
第4章 从数据中学习 67
4.1 学习机器 68
4.2 统计学习原理 72
4.3 学习方法的类型 75
4.4 常见的学习任务 77
4.5 支持向量机 80
4.6 kNN:最近邻分类器 90
4.7 模型选择与泛化 92
4.8 模型的评估 95
4.9 90%准确的情形 100
4.9.1 保险欺诈检测 101
4.9.2 改进心脏护理 102
4.10 复习题 103
4.11 参考书目 104
第5章 统计方法 107
5.1 统计推断 107
5.2 评测数据集的差异 109
5.3 贝叶斯定理 112
5.4 预测回归 114
5.5 方差分析 118
5.6 对数回归 120
5.7 对数-线性模型 121
5.8 线性判别分析 124
5.9 复习题 126
5.10 参考书目 128
第6章 决策树和决策规则 131
6.1 决策树 132
6.2 C4.5算法:生成决策树 134
6.3 未知属性值 139
6.4 修剪决策树 142
6.5 C4.5算法:生成决策规则 143
6.6 CART算法和Gini指标 146
6.7 决策树和决策规则的局限性 148
6.8 复习题 150
6.9 参考书目 153
第7章 人工神经网络 155
7.1 人工神经元的模型 156
7.2 人工神经网络的结构 159
7.3 学习过程 161
7.4 使用ANN完成的学习任务 164
7.4.1 模式联想 164
7.4.2 模式识别 164
7.5 多层感知机 166
7.6 竞争网络和竞争学习 172
7.7 SOM 174
7.8 复习题 178
7.9 参考书目 180
第8章 集成学习 183
8.1 集成学习方法论 184
8.2 多学习器组合方案 187
8.3 bagging和boosting 188
8.4 AdaBoost算法 189
8.5 复习题 190
8.6 参考书目 193
第9章 聚类分析 195
9.1 聚类的概念 195
9.2 相似度的度量 198
9.3 凝聚层次聚类 203
9.4 分区聚类 206
9.5 增量聚类 208
9.6 DBSCAN算法 211
9.7 BIRCH算法 213
9.8 聚类验证 215
9.9 复习题 215
9.10 参考书目 218
第10章 关联规则 221
10.1 购物篮分析 222
10.2 Apriori算法 223
10.3 从频繁项集中得到关联规则 225
10.4 提高Apriori算法的效率 226
10.5 FP增长方法 227
10.6 关联分类方法 229
10.7 多维关联规则挖掘 231
10.8 复习题 232
10.9 参考书目 236
第11章 Web挖掘和文本挖掘 237
11.1 Web挖掘 237
11.2 Web内容、结构与使用挖掘 238
11.3 HITS和LOGSOM算法 240
11.4 挖掘路径遍历模式 245
11.5 PageRank算法 247
11.6 文本挖掘 249
11.7 潜在语义分析 252
11.8 复习题 255
11.9 参考书目 257
第12章 数据挖掘高级技术 259
12.1 图挖掘 259
12.2 时态数据挖掘 270
12.2.1 态数据表示 271
12.2.2 序列之间的相似性度量 274
12.2.3 时态数据模型 276
12.2.4 数据挖掘 277
12.3 空间数据挖掘(SDM) 281
12.4 分布式数据挖掘(DDM) 284
12.5 关联并不意味着存在因果关系 290
12.6 数据挖掘的隐私、安全及法律问题 295
12.7 复习题 299
12.8 参考书目 300
第13章 遗传算法 303
13.1 遗传算法的基本原理 304
13.2 用遗传算法进行优化 305
13.2.1 编码方案和初始化 306
13.2.2 适合度估计 306
13.2.3 选择 307
13.2.4 交叉 308
13.2.5 突变 308
13.3 遗传算法的简单例证 310
13.3.1 表述 310
13.3.2 初始群体 311
13.3.3 评价 311
13.3.4 交替 312
13.3.5 遗传算子 312
13.3.6 评价(第二次迭代) 313
13.4 图式 314
13.5 旅行推销员问题 316
13.6 使用遗传算法的机器学习 318
13.6.1 规则交换 320
13.6.2 规则概化 320
13.6.3 规则特化 321
13.6.4 规则分割 321
13.7 遗传算法用于聚类 321
13.8 复习题 323
13.9 参考书目 324
第14章 模糊集和模糊逻辑 327
14.1 模糊集 327
14.2 模糊集的运算 332
14.3 扩展原理和模糊关系 335
14.4 模糊逻辑和模糊推理系统 339
14.5 多因子评价 342
14.6 从数据中提取模糊模型 344
14.7 数据挖掘和模糊集 349
14.8 复习题 350
14.9 参考书目 352
第15章 可视化方法 353
15.1 感知和可视化 353
15.2 科学可视化和信息可视化 354
15.3 平行坐标 359
15.4 放射性可视化 361
15.5 使用自组织映射进行可视化 363
15.6 数据挖掘的可视化系统 365
15.7 复习题 368
15.8 参考书目 369
附录A 数据挖掘工具 371
附录B 数据挖掘应用 393
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《模型与认知》(美)乔纳森·A.瓦斯肯著,魏刘伟译 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019