数据仓库与数据挖掘教程PDF电子书下载
- 电子书积分:14 积分如何计算积分?
- 作 者:黄德才编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2016
- ISBN:9787302434128
- 页数:407 页
第1章 绪论 1
1.1 数据仓库概述 1
1.1.1 从传统数据库到数据仓库 1
1.1.2 数据仓库的4个特征 6
1.1.3 数据仓库系统 8
1.1.4 数据仓库系统体系结构 9
1.1.5 数据仓库数据的粒度与组织 11
1.2 数据挖掘概述 13
1.2.1 数据挖掘产生的背景 13
1.2.2 数据挖掘与知识发现 14
1.2.3 数据挖掘的数据来源 14
1.2.4 数据挖掘的任务 16
1.2.5 数据挖掘的步骤 18
1.2.6 数据挖掘的应用 20
1.3 数据仓库与数据挖掘 22
1.3.1 数据仓库与数据挖掘的区别 22
1.3.2 数据仓库与数据挖掘的关系 23
1.4 教程章节组织与学时建议 24
习题1 26
第2章 数据仓库原理 27
2.1 多数据源问题 27
2.2 数据预处理 28
2.2.1 数据清洗 29
2.2.2 数据变换 33
2.2.3 数据归约 35
2.3 E-R模型 36
2.4 数据仓库的概念模型 37
2.4.1 多维数据模型 38
2.4.2 维度与粒度 41
2.5 数据仓库的逻辑模型 42
2.5.1 多维数据库系统 42
2.5.2 星形模型 45
2.5.3 雪花模型 48
2.6 数据仓库的物理模型 49
2.6.1 位图索引模型 49
2.6.2 广义索引模型 51
2.6.3 连接索引模型 51
2.6.4 RAID存储结构 52
习题2 54
第3章 数据仓库的设计开发应用 56
3.1 数据仓库设计的特点 56
3.2 数据仓库系统开发过程 57
3.3 数据仓库系统的规划 59
3.4 数据仓库的设计 63
3.4.1 需求分析 63
3.4.2 概念设计 66
3.4.3 逻辑设计 68
3.4.4 物理设计 73
3.5 数据仓库的实施 74
3.5.1 数据仓库的创建 75
3.5.2 数据的抽取、转换和加载 78
3.6 数据仓库系统的开发 79
3.6.1 开发任务 79
3.6.2 开发方法 80
3.6.3 系统测试 81
3.7 数据仓库系统的应用 81
3.7.1 用户培训 82
3.7.2 决策支持 82
3.7.3 维护评估 83
习题3 84
第4章 警务数据仓库的实现 85
4.1 SQL Server 2008 R2 85
4.1.1 SQL Server的服务功能 85
4.1.2 SQL Server Management Studio 86
4.1.3 Microsoft Visual Studio 87
4.2 创建集成服务项目与SSIS包 90
4.3 配置“旅馆_ETL”数据流任务 91
4.3.1 创建“旅馆_ETL”对象 91
4.3.2 配置“旅馆_ETL”参数 94
4.4 配置“人员_ETL”数据流任务 106
4.4.1 创建“人员_ETL”对象 106
4.4.2 配置“人员_ETL”参数 108
4.5 配置“时间_ETL”数据流任务 124
4.5.1 创建“时间_ETL”对象 124
4.5.2 配置“时间_ETL”参数 124
4.6 配置“入住_ETL”数据流任务 134
4.6.1 创建“入住_ETL”对象 134
4.6.2 配置“入住_ETL”参数 134
4.7 部署前面配置的SSIS包 140
4.7.1 将包另存到SSIS服务器 141
4.7.2 创建作业代理 143
习题4 147
第5章 联机分析处理技术 149
5.1 OLAP概述 149
5.1.1 OLAP的定义 149
5.1.2 OLAP的12条准则 150
5.1.3 OLAP的简要准则 152
5.1.4 OLAP系统的基本结构 152
5.2 OLAP的多维分析操作 153
5.2.1 切片 153
5.2.2 切块 155
5.2.3 旋转 156
5.2.4 钻取 156
5.3 OLAP系统的分类 157
5.3.1 多维OLAP 157
5.3.2 关系OLAP 158
5.3.3 MOLAP与ROLAP的比较 158
5.3.4 混合OLAP 158
5.4 OLAP、DW与DM的关系 159
5.4.1 OLAP、DW与DM的联系 159
5.4.2 OLAP、DW与DM的区别 160
5.4.3 OLAP与DW的关系 160
5.4.4 OLAP与DM的关系 161
5.5 DOLAM决策支持系统方案 161
习题5 163
第6章 警务数据仓库的OLAP应用 164
6.1 创建分析服务项目 164
6.1.1 进入商业智能开发平台 164
6.1.2 创建分析服务项目 165
6.2 配置项目的数据源 166
6.3 构建数据源视图 168
6.4 创建多维数据集 169
6.5 配置维的层次结构 170
6.5.1 配置日期维的层次 170
6.5.2 配置地址维的层次 182
6.5.3 配置人员维的层次 186
6.5.4 配置旅馆维的层次 191
6.6 添加人口来源地址维 197
6.7 分析服务项目的部署 199
6.8 浏览多维数据集 201
习题6 205
第7章 数据的属性与相似性 206
7.1 数据集的结构 206
7.1.1 二维表 206
7.1.2 数据矩阵 208
7.2 属性的类型 208
7.2.1 连续属性 209
7.2.2 离散属性 211
7.2.3 分类属性 211
7.2.4 二元属性 211
7.2.5 序数属性 212
7.2.6 数值属性 213
7.3 相似度与相异度 213
7.3.1 数值属性的距离 214
7.3.2 分类属性的相似度 216
7.3.3 余弦相似度 220
7.3.4 混合属性的相异度 221
习题7 226
第8章 关联规则挖掘 228
8.1 关联规则的概念 228
8.1.1 基本概念 228
8.1.2 项集的性质 230
8.2 关联规则的Apriori算法 231
8.2.1 发现频繁项集 231
8.2.2 产生关联规则 235
8.3 FP-增长算法 238
8.3.1 算法的背景 238
8.3.2 构造FP-树 238
8.3.3 生成频繁项集 241
8.4 关联规则的评价 245
8.4.1 支持度和置信度的不足 246
8.4.2 相关性分析 247
8.5 序列模式发现算法 248
8.5.1 序列模式的概念 248
8.5.2 类Apriori算法 250
8.6 关联规则其他算法 253
8.6.1 频繁项集算法优化 253
8.6.2 CLOSE算法 254
8.6.3 时态关联规则 255
8.6.4 含负项的关联规则 255
习题8 256
第9章 分类规则挖掘 258
9.1 分类问题概述 258
9.2 k-最近邻分类法 260
9.3 决策树分类方法 262
9.3.1 决策树生成框架 262
9.3.2 ID3分类方法 264
9.3.3 决策树的剪枝 270
9.3.4 C4.5 算法 271
9.4 贝叶斯分类方法 278
9.4.1 贝叶斯定理 279
9.4.2 朴素贝叶斯分类器 280
9.4.3 朴素贝叶斯分类方法的改进 283
9.5 其他分类方法 285
习题9 286
第10章 聚类分析方法 289
10.1 聚类分析原理 289
10.1.1 聚类分析概述 289
10.1.2 聚类的数学定义 290
10.1.3 簇的常见类型 291
10.1.4 聚类框架及性能要求 293
10.1.5 簇的距离 295
10.2 划分聚类算法 297
10.2.1 划分聚类框架 297
10.2.2 划分聚类的质量 297
10.2.3 k-means算法 298
10.2.4 空簇与离群点 301
10.2.5 k-中心点算法 302
10.3 层次聚类方法 306
10.3.1 层次聚类策略 306
10.3.2 AGNES算法 307
10.3.3 DIANA算法 309
10.4 密度聚类方法 312
10.4.1 基本概念 312
10.4.2 算法描述 315
10.4.3 计算实例 315
10.4.4 算法的性能分析 317
10.5 聚类的质量评价 317
10.5.1 簇的数目估计 318
10.5.2 外部质量评价 318
10.5.3 内部质量评价 319
10.6 离群点挖掘 320
10.6.1 相关问题概述 321
10.6.2 基于距离的方法 322
10.6.3 基于相对密度的方法 326
10.7 其他聚类方法 330
习题10 333
第11章 混合属性数据的聚类分析 335
11.1 混合属性数据集聚类 335
11.1.1 混合属性数据普遍存在 335
11.1.2 k-prototypes算法 336
11.1.3 k-prototypes算法的不足 338
11.2 改进的k-prototypes算法 339
11.2.1 加权频率最大原型 339
11.2.2 离散属性的频率相异度 340
11.2.3 改进的k-prototypes算法 342
11.3 强连通聚类融合算法 342
11.3.1 聚类融合方法 342
11.3.2 强连通聚类融合 343
11.3.3 聚类融合优化算法 346
习题11 349
第12章 数据流挖掘与聚类分析 350
12.1 数据流挖掘的概念 350
12.1.1 数据流的定义 350
12.1.2 数据流挖掘的任务 351
12.2 数据流处理技术 352
12.2.1 概要数据结构 352
12.2.2 时间倾斜技术 352
12.2.3 数据流聚类的要求 356
12.2.4 数据流聚类的一般步骤 357
12.3 两层数据流聚类框架 357
12.4 三层数据流聚类框架 359
12.5 最优2k-近邻聚类算法 359
12.5.1 算法设计动因 359
12.5.2 定义2k-最近邻集 360
12.5.3 在线2k-最近邻集生成 362
12.5.4 最优2k-近邻集算法 365
12.5.5 最优2k-近邻聚类算法 366
12.5.6 实例计算结果 368
习题12 369
第13章 不确定数据的聚类分析 370
13.1 不确定数据挖掘概述 370
13.1.1 不确定数据的产生 370
13.1.2 不确定数据的种类 371
13.1.3 不确定数据的聚类 372
13.2 基于相对密度的不确定数据聚类算法 374
13.2.1 基于相对密度的聚类思想 374
13.2.2 不确定相异度与k-最近邻集 375
13.2.3 不确定k-最近邻密度 376
13.2.4 RDBCAU算法描述 377
13.2.5 计算实例 378
13.3 不确定分类属性数据聚类算法 381
13.3.1 传统分类属性相似度 381
13.3.2 分类属性加权相似度 382
13.3.3 分类属性双重加权相似度 382
13.3.4 不确定分类属性双重加权相似度 384
13.3.5 基于连通分支的不确定分类属性聚类算法 385
习题13 386
第14章 量子计算与量子遗传聚类算法 388
14.1 量子计算与数据挖掘 388
14.1.1 量子计算的诞生 388
14.1.2 量子计算研究 389
14.1.3 量子数据挖掘算法 389
14.2 量子计算原理 390
14.2.1 量子态与量子比特 390
14.2.2 量子门与基本运算 391
14.2.3 量子纠缠特性 392
14.3 经典量子算法 393
14.3.1 量子傅里叶变换 393
14.3.2 Shor因子分解算法 393
14.3.3 Grover算法 393
14.4 基于3D角度编码的量子遗传算法 394
14.4.1 量子遗传算法 394
14.4.2 量子3D角度编码 395
14.4.3 解空间的映射 396
14.4.4 量子染色体更新 397
14.4.5 量子位的变异 398
14.4.6 QGAB3DC算法 398
14.5 量子遗传聚类算法 399
14.5.1 属性值q分位数与极差 399
14.5.2 基于极差的广义加权距离 400
14.5.3 量子遗传聚类算法 400
习题14 402
参考文献 404
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019