数据仓库与数据挖掘教程 第2版PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:陈文伟编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2011
- ISBN:9787302259138
- 页数:304 页
第1章 数据仓库与数据挖掘概述 1
1.1 数据仓库的兴起 1
1.1.1 从数据库到数据仓库 1
1.1.2 从OLTP到OLAP 3
1.1.3 数据字典与元数据 4
1.1.4 数据仓库的定义与特点 6
1.2 数据挖掘的兴起 7
1.2.1 从机器学习到数据挖掘 7
1.2.2 数据挖掘含义 8
1.2.3 数据挖掘与OLAP的比较 8
1.2.4 数据挖掘与统计学 9
1.3 数据仓库和数据挖掘的结合 11
1.3.1 数据仓库和数据挖掘的区别与联系 11
1.3.2 基于数据仓库的决策支持系统 13
1.3.3 数据仓库与商业智能 14
习题1 16
第2章 数据仓库原理 18
2.1 数据仓库结构体系 18
2.1.1 数据仓库结构 18
2.1.2 数据集市及其结构 19
2.1.3 数据仓库系统结构 22
2.1.4 数据仓库的运行结构 24
2.2 数据仓库数据模型 24
2.2.1 星型模型 25
2.2.2 雪花模型 25
2.2.3 星网模型 26
2.2.4 第三范式 27
2.3 数据抽取、转换和装载 28
2.3.1 数据抽取 28
2.3.2 数据转换 29
2.3.3 数据装载 31
2.3.4 ETL工具 32
2.4 元数据 33
2.4.1 元数据的重要性 33
2.4.2 关于数据源的元数据 34
2.4.3 关于数据模型的元数据 35
2.4.4 关于数据仓库映射的元数据 35
2.4.5 关于数据仓库使用的元数据 37
习题2 37
第3章 联机分析处理 39
3.1 OLAP概念 39
3.1.1 OLAP的定义 39
3.1.2 OLAP准则 40
3.1.3 OLAP的基本概念 43
3.2 OLAP的数据模型 44
3.2.1 MOLAP数据模型 44
3.2.2 ROLAP数据模型 46
3.2.3 MOLAP与ROLAP的比较 46
3.2.4 HOLAP数据模型 49
3.3 多维数据的显示 49
3.3.1 多维数据显示方法 49
3.3.2 多维类型结构 50
3.3.3 多维数据的分析视图 50
3.4 OALP的多维数据分析 52
3.4.1 多维数据分析的基本操作 52
3.4.2 多维数据分析实例 54
3.4.3 广义OLAP功能 56
3.4.4 数据立方体 58
3.4.5 多维数据分析的MDX语言及其应用 62
习题3 65
第4章 数据仓库设计与开发 67
4.1 数据仓库分析与设计 67
4.1.1 需求分析 67
4.1.2 概念模型设计 68
4.1.3 逻辑模型设计 69
4.1.4 物理模型设计 75
4.1.5 数据仓库的索引技术 77
4.2 数据仓库开发 81
4.2.1 数据仓库开发过程 81
4.2.2 数据质量与数据清洗 87
4.2.3 数据粒度与维度建模 88
4.3 数据仓库技术与开发的困难 90
4.3.1 数据仓库技术 90
4.3.2 数据仓库开发的困难 93
习题4 94
第5章 数据仓库的决策支持 96
5.1 数据仓库的用户 96
5.1.1 数据仓库的信息使用者 96
5.1.2 数据仓库的探索者 98
5.2 数据仓库的决策支持与决策支持系统 99
5.2.1 查询与报表 100
5.2.2 多维分析与原因分析 101
5.2.3 预测未来 102
5.2.4 实时决策 103
5.2.5 自动决策 104
5.2.6 决策支持系统 104
5.3 数据仓库应用实例 105
5.3.1 航空公司数据仓库决策支持系统简例 105
5.3.2 统计业数据仓库系统 109
5.3.3 沃尔玛数据仓库系统 112
习题5 114
第6章 数据挖掘原理 116
6.1 数据挖掘综述 116
6.1.1 数据挖掘与知识发现 116
6.1.2 数据挖掘对象 117
6.1.3 数据挖掘任务 119
6.1.4 数据挖掘分类 122
6.1.5 不完全数据处理 123
6.1.6 数据库的数据浓缩 124
6.2 数据挖掘方法和技术 127
6.2.1 归纳学习的信息论方法 127
6.2.2 归纳学习的集合论方法 128
6.2.3 仿生物技术的神经网络方法 129
6.2.4 仿生物技术的遗传算法 129
6.2.5 数值数据的公式发现 130
6.2.6 可视化技术 130
6.3 数据挖掘的知识表示 131
6.3.1 规则知识 131
6.3.2 决策树知识 131
6.3.3 知识基(浓缩数据) 132
6.3.4 神经网络权值 132
6.3.5 公式知识 133
6.3.6 案例 133
习题6 133
第7章 信息论方法 135
7.1 信息论原理 135
7.1.1 信道模型和学习信道模型 136
7.1.2 信息熵与条件熵 136
7.1.3 互信息与信息增益 137
7.1.4 信道容量与译码准则 138
7.2 决策树方法 139
7.2.1 决策树概念 139
7.2.2 ID3方法基本思想 140
7.2.3 ID3算法 141
7.2.4 实例与讨论 142
7.2.5 C4.5方法 144
7.3 决策规则树方法 147
7.3.1 IBLE方法基本思想 147
7.3.2 IBLE算法 149
7.3.3 IBLE方法实例 151
习题7 157
第8章 集合论方法 159
8.1 粗糙集方法 159
8.1.1 粗糙集概念 159
8.1.2 属性约简的粗糙集理论 162
8.1.3 属性约简的粗糙集方法 165
8.1.4 粗糙集方法的规则获取 166
8.1.5 粗糙集方法的应用实例 166
8.2 K-均值聚类 169
8.2.1 聚类方法简介 169
8.2.2 K-均值聚类方法与实例 171
8.3 关联规则挖掘 172
8.3.1 关联规则的挖掘原理 173
8.3.2 Apriori算法基本思想 176
8.3.3 Apriori算法程序 179
8.3.4 基于FP-tree的关联规则挖掘算法 180
习题8 184
第9章 神经网络 186
9.1 神经网络概念与感知机 186
9.1.1 神经网络原理 186
9.1.2 感知机网络 187
9.1.3 感知机实例与讨论 190
9.2 反向传播网络 191
9.2.1 反向传播网络结构 191
9.2.2 BP网络学习公式推导 191
9.2.3 BP网络的典型实例 196
9.3 径向基函数网络 197
9.3.1 径向基函数RBF网络原理 197
9.3.2 RBF网络算法与分析 198
9.4 神经网络的几何意义 199
9.4.1 神经网络的超平面含义 199
9.4.2 异或问题的实例分析 202
习题9 204
第10章 遗传算法与进化计算 206
10.1 遗传算法 206
10.1.1 遗传算法基本原理 206
10.1.2 遗传算子 208
10.1.3 遗传算法简例 212
10.1.4 遗传算法的特点 214
10.2 基于遗传算法的分类学习系统 215
10.2.1 概述 215
10.2.2 遗传分类学习系统GCLS的基本原理 216
10.2.3 遗传分类学习系统GCLS的应用 220
10.3 进化计算 221
10.3.1 进化计算概述 221
10.3.2 进化策略与进化规划 222
10.3.3 进化计算小结 224
习题10 226
第11章 公式发现 227
11.1 公式发现概述 227
11.1.1 曲线拟合与发现学习 227
11.1.2 启发式与数据驱动启发式 229
11.2 科学定律重新发现系统 230
11.2.1 BACON系统基本原理 230
11.2.2 BACON系统实例 231
11.2.3 BACON系统的进展 234
11.3 经验公式发现系统 235
11.3.1 FDD系统基本原理 235
11.3.2 FDD.1系统 237
11.3.3 FDD.2系统 242
11.3.4 FDD.3系统 245
习题11 249
第12章 知识挖掘 251
12.1 变换规则的知识挖掘 251
12.1.1 适应变化环境的变换和变换规则 251
12.1.2 变换规则的知识挖掘的理论基础 253
12.1.3 变换规则的知识推理 255
12.1.4 变换规则链的知识挖掘 257
12.1.5 适应变化环境的变换规则元知识 260
12.2 软件进化规律的知识挖掘 264
12.2.1 数值计算的进化 264
12.2.2 计算机程序的进化 269
12.2.3 数据存储的进化 271
12.2.4 知识处理的进化 274
12.2.5 进化规律的知识挖掘 276
习题12 280
第13章 文本挖掘与Web挖掘 281
13.1 文本挖掘概述 281
13.1.1 文本挖掘的基本概念 281
13.1.2 文本特征的表示 282
13.1.3 文本特征的提取 283
13.2 文本挖掘 284
13.2.1 文本挖掘功能层次 284
13.2.2 文本关联分析 285
13.2.3 文本聚类 285
13.2.4 文本分类 286
13.3 Web挖掘 287
13.3.1 Web挖掘概述 287
13.3.2 Web内容挖掘 290
13.3.3 Web结构挖掘 291
13.3.4 Web应用(访问信息)挖掘 293
13.3.5 Web日志分析与实例 295
习题13 300
参考文献 302
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019