《数据挖掘教程》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:(美)Richard J. Roiger,(美)Michael W. Geatz著;翁敬农译(州立明尼苏达大学)
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2003
  • ISBN:7302074569
  • 页数:362 页
图书介绍:本书为数据挖掘的基础教程。是作者多年来数据挖掘和专家系统课程教学经验的积累。它从商业角度介绍了数据挖掘的概念。进而通过13个数据挖掘示例帮助读者掌握其原理。本书最后还包括了结合专家系统和智能代理解决复杂问题的方法。

目录 3

第Ⅰ部分 数据挖掘基础 3

第1章 数据挖掘:初探 3

1.1 数据挖掘:定义 4

1.2 计算机可以学习什么 5

1.3 数据挖掘是否适合自身的问题 12

1.4 采用专家系统还是数据挖掘 14

1.5 一个简单的数据挖掘处理模型 15

1.6 为什么不进行简单的搜索 18

1.7 数据挖掘应用 19

1.8 本章小结 22

1.9 关键术语 22

1.10 练习 24

第2章 数据挖掘:深入讨论 27

2.1 数据挖掘策略 28

2.2 有指导的数据挖掘技术 33

2.3 关联规则 39

2.4 聚类技术 40

2.5 评估性能 41

2.6 本章小结 46

2.7 关键术语 47

2.8 练习 48

第3章 基本数据挖掘技术 53

3.1 决策树 54

3.2 生成关联规则 61

3.3 K-平均值算法 66

3.4 遗传学习 71

3.5 选择一种数据挖掘技术 77

3.6 本章小结 78

3.7 关键术语 79

3.8 练习 80

第4章 基于Excel的数据挖掘工具 83

4.1 iData分析器 84

4.2 ESX:一种多用途的数据挖掘工具 87

4.3 iDAV格式的数据挖掘 88

4.4 用于无指导聚类的5步法 90

4.5 用于有指导学习的6步法 99

4.6 生成规则技术 103

4.7 实例典型性 105

4.8 特别考虑和特性 106

4.9 本章小结 110

4.10 关键术语 110

4.11 练习 111

第Ⅱ部分 知识发现工具 117

第5章 数据库中的知识发现 117

5.1 一种KDD过程模型 118

5.3 步骤2:创建目标数据集 120

5.2 步骤1:目标定义 120

5.4 步骤3:数据预处理 121

5.5 步骤4:数据转换 123

5.6 步骤5:数据挖掘 127

5.7 步骤6:解释和评估 128

5.8 步骤7:采取行动 128

5.9 CRISP-DM过程模型 129

5.10 ESX实验 129

5.11 本章小结 135

5.12 关键术语 136

5.13 练习 137

第6章 数据仓库 141

6.1 操作型数据库 142

6.2 设计数据仓库 145

6.3 联机分析处理 150

6.4 用Excel数据透视表分析数据 154

6.5 本章小结 162

6.6 关键术语 162

6.7 练习 164

第7章 形式评估技术 167

7.1 评估对象 168

7.2 评估工具 169

7.3 计算检验集置信区间 174

7.4 比较有指导学习者模型 176

7.5 属性评估 178

7.6 无指导评估技术 182

7.7 评估具有数值输出的有指导模型 184

7.8 本章小结 185

7.9 关键术语 186

7.10 练习 187

第Ⅲ部分 高级数据挖掘技术 193

第8章 神经网络 193

8.1 前馈神经网络 194

8.2 神经网络训练:概念介绍 198

8.4 一般考虑 201

8.5 神经网络训练:详细说明 202

8.6 本章小结 206

8.7 关键术语 207

8.8 练习 208

第9章 使用iDA建立神经网络 209

9.1 反向传播学习的4步法 210

9.2 神经网络聚类4步法 218

9.3 使用ESX进行神经网络簇分析 223

9.4 本章小结 224

9.5 关键术语 225

9.6 练习 225

第10章 统计技术 229

10.1 线性回归分析 230

10.2 对数回归 235

10.3 贝叶斯分类器 238

10.4 聚类算法 244

10.5 启发式的还是统计的 251

10.6 本章小结 252

10.7 关键术语 253

10.8 练习 255

第11章 专门技术 259

11.1 时间序列分析 260

11.2 挖掘Web 264

11.3 挖掘文本数据 270

11.4 改进性能 271

11.5 本章小结 274

11.6 关键术语 275

11.7 练习 276

第Ⅳ部分 智能系统 281

第12章 基于规则的系统 281

12.1 探索人工智能 282

12.2 状态空间搜索的问题求解 285

12.3 专家系统 292

12.4 构造基于规则的系统 296

12.5 本章小结 303

12.6 关键术语 304

12.7 练习 305

第13章 基于规则的系统中不确定性的管理 309

13.1 不确定性:来源和解决方案 310

13.2 基于规则的模糊系统 312

13.3 不确定性的基于概率的方法 318

13.4 本章小结 323

13.5 关键术语 324

13.6 练习 325

第14章 智能代理 327

14.1 智能代理的特征 328

14.2 智能代理的分类 328

14.3 整合数据挖掘、专家系统和智能代理 329

14.4 本章小结 331

14.5 关键术语 331

14.6 练习 332

A.1 软件安装 333

附录A iDA软件 333

A.2 卸载iDA 334

A.3 软件局限性 335

A.4 软件使用指南 335

A.5 故障检测 335

A.6 软件支持 337

附录B 数据挖掘数据集 339

B.1 iDA数据集包 339

B.2 所要挖掘的数据集所在的Web站点 343

附录C 决策树属性选取 345

附录D 性能评估的统计 349

D.1 单值汇总统计 349

D.2 正态分布 350

D.3 比较有指导学习模型 350

D.4 数值输出的置信区间 352

D.5 比较具有数值输出的模型 353

附录E Excel数据透视表:Office 97 355

E.1 创建简单数据透视表 355

E.2 假设检验的数据透视表 358

E.3 创建多维数据透视图 359