数据挖掘 概念、模型、方法和算法PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:(美)Mehmed Kantardzic著;闪四清等译
- 出 版 社:北京:清华大学出版社
- 出版年份:2003
- ISBN:7302067775
- 页数:309 页
第1章 数据挖掘的概念 1
1.1 概述 1
1.2 数据挖掘的起源 3
1.3 数据挖掘过程 5
1.3.1 陈述问题和阐明假设 5
1.3.2 数据收集 6
1.3.3 数据预处理 6
1.3.4 模型评估 7
1.3.5 解释模型和得出结论 7
1.4 大型数据集 8
1.5 数据仓库 12
1.6 本书的结构 14
1.7 复习题 15
1.8 参考书目 16
第2章 数据准备 17
2.1 原始数据的表述 17
2.2 原始数据的特性 20
2.3 原始数据的转换 22
2.4 丢失数据 24
2.5 时间相关数据 25
2.6 异常点分析 29
2.7 复习题 32
2.8 参考书目 33
第3章 数据归约 35
3.1 大型数据集的维度 35
3.2 特征归约 37
3.3 特征排列的熵度量 41
3.4 主成分分析 43
3.5 值归约 45
3.6 特征离散化:ChiMerge技术 48
3.7 案例归约 51
3.8 复习题 54
3.9 参考书目 55
第4章 从数据中学习 57
4.1 机器学习 58
4.2 统计学习原理 62
4.3 学习方法的类型 67
4.4 常见的学习任务 68
4.5 模型估计 72
4.6 复习题 76
4.7 参考书目 77
第5章 统计方法 78
5.1 统计推断 78
5.2 评测数据集的差异 80
5.3 贝叶斯定理 82
5.4 预测回归 84
5.5 方差分析 89
5.6 对数回归 92
5.7 对数-线性模型 93
5.8 线性判别分析 96
5.9 复习题 98
5.10 参考书目 99
第6章 聚类分析 101
6.1 聚类概念 101
6.2 相似度的度量 104
6.3 凝聚层次聚类 108
6.4 分区聚类 112
6.5 增量聚类 114
6.6 复习题 117
6.7 参考书目 119
第7章 决策树和决策规则 120
7.1 决策树 121
7.2 C4.5算法:生成一个决策树 122
7.3 未知属性值 128
7.4 修剪决策树 132
7.5 C4.5算法:生成决策规则 133
7.6 决策树和决策规则的局限性 136
7.7 关联分类方法 137
7.8 复习题 140
7.9 参考书目 142
第8章 关联规则 144
8.1 购物篮分析 144
8.2 APRIORI算法 146
8.3 从频繁项集得到关联规则 148
8.4 提高APRIORI算法的效率 149
8.5 频繁模式增长方法(FP-增长方法) 151
8.6 多维关联规则挖掘 153
8.7 WEB挖掘 154
8.8 HITS和LOGSOM算法 156
8.9 挖掘路径遍历模式 161
8.10 文本挖掘 164
8.11 复习题 167
8.12 参考书目 169
第19章 人工神经网络 171
9.1 人工神经元的模型 172
9.2 人工神经网络的结构 176
9.3 学习过程 177
9.4 学习任务 181
9.5 多层感知机 183
9.6 竞争网络和竞争学习 189
9.7 复习题 193
9.8 参考书目 195
第10章 遗传算法 196
10.1 遗传算法的基本原理 197
10.2 用遗传算法进行优化 198
10.3 遗传算法的一个简单例证 203
10.4 图式(SCHEMATA) 208
10.5 旅行推销员问题 210
10.6 使用遗传算法的机器学习 212
10.7 复习题 216
10.8 参考书目 217
第11章 模糊集和模糊逻辑 219
11.1 模糊集 219
11.2 模糊集的运算 224
11.3 扩展原理和模糊关系 229
11.4 模糊逻辑和模糊推理系统 233
11.5 多因子评价 237
11.6 从数据中提取模糊模型 239
11.7 复习题 244
11.8 参考书目 246
第12章 可视化方法 247
12.1 感知和可视化 247
12.2 科学可视化和信息可视化 248
12.3 平行坐标 253
12.4 放射性可视化 256
12.5 KOHONEN自组织映射 258
12.6 数据挖掘的可视化系统 259
12.7 复习题 263
12.8 参考书目 264
第13章 参考书目 266
附录A 数据挖掘工具 281
附录B 数据挖掘应用 300
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《模型与认知》(美)乔纳森·A.瓦斯肯著,魏刘伟译 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019