数据仓库与数据挖掘PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:李雄飞,杜钦生,吴昊编著
- 出 版 社:北京:机械工业出版社
- 出版年份:2013
- ISBN:9787111436751
- 页数:224 页
第1章 绪论 1
1.1引言 1
1.2数据仓库 2
1.2.1从数据库到数据仓库 4
1.2.2数据仓库的基本概念 6
1.2.3数据仓库的体系结构 7
1.3数据挖掘 8
1.3.1 KDD与数据挖掘 9
1.3.2数据库与数据挖掘发展历程 11
1.3.3数据挖掘的特征与对象 12
1.3.4数据挖掘相关领域 17
1.4数据仓库与数据挖掘的关系 18
1.5应用前景与发展趋势 18
本章小结 19
习题1 20
第2章 联机分析处理 21
2.1引言 21
2.2 OLAP的定义 21
2.3 OLAP的相关概念 22
2.4 OLAP与OLTP的关系和比较 23
2.5 OLAP准则 25
2.6多维数据分析方法 25
2.7关系数据的组织 27
2.8多维数据的存储方式 30
2.9 OLAP体系结构 32
2.10 OLAP的展现方式 34
2.11 OLAP工具的评价指标 35
2.12 OLAP的局限性 36
本章小结 37
习题2 37
第3章 数据仓库的设计与开发 39
3.1引言 39
3.2数据仓库的数据模型概述 39
3.3数据仓库的分析与设计 41
3.3.1需求分析 41
3.3.2概念模型设计 41
3.3.3逻辑模型设计 42
3.3.4物理模型设计 46
3.3.5数据仓库的索引技术 47
3.4数据仓库的开发 49
3.4.1风险因素 49
3.4.2数据仓库系统的生命周期 49
3.4.3建立数据仓库系统的思维模式 52
3.4.4数据仓库数据库的设计步骤 53
3.4.5数据质量与数据清洗 53
3.4.6数据粒度与维度建模 54
3.4.7选择数据仓库工具 55
3.4.8提高数据仓库性能 55
3.4.9数据仓库的安全性 56
3.5主要的数据仓库产品 57
本章小结 58
习题3 58
第4章 关联规则 60
4.1引言 60
4.2关联规则模型 61
4.3 Apriori算法 62
4.3.1发现频繁项集 62
4.3.2生成关联规则 67
4.4频繁模式增长算法 76
4.4.1建树方法 77
4.4.2用FP树挖掘频繁模式 78
4.5关联规则模型扩展 80
4.5.1多级关联规则 81
4.5.2多维关联规则 83
本章小结 86
习题4 86
第5章 粗糙集 88
5.1引言 88
5.2近似空间 89
5.2.1近似空间与不可分辨关系 89
5.2.2知识与知识库 90
5.3近似与粗糙集 91
5.3.1基本概念 91
5.3.2基本性质 93
5.4描述粗糙集的特征的方法 95
5.4.1近似精度 95
5.4.2拓扑特征 96
5.5信息系统 97
5.5.1信息系统的定义 97
5.5.2约简和核 99
5.5.3分辨矩阵与分辨函数 100
5.5.4信息系统约简 101
5.6决策表 103
5.6.1相对约简与知识依赖性 103
5.6.2决策表及其约简 105
5.6.3近似约简算法 110
5.6.4决策规则 111
本章小结 112
习题5 113
第6章 决策树 115
6.1引言 115
6.2构建决策树的理论问题 116
6.2.1为当前结点选择属性 117
6.2.2过拟合问题 120
6.3 ID3算法 123
6.3.1生成决策树的算法 123
6.3.2生成规则和决策 127
6.4决策树的剪枝 129
6.4.1预剪枝 129
6.4.2后剪枝 130
6.5 C4.5算法 133
本章小结 135
习题6 136
第7章 聚类分析 137
7.1引言 137
7.2聚类分析简介 137
7.2.1聚类分析 137
7.2.2聚类分析应用领域与算法特征 137
7.3数据类型、距离和相似系数 140
7.3.1数据类型 140
7.3.2距离和相似系数 141
7.4聚类方法与聚类分类 145
7.4.1聚类方法 145
7.4.2聚类方法的分类 146
7.5划分方法 147
7.5.1 k-均值算法 148
7.5.2 k-中心点算法 149
7.5.3关于参数K 151
7.5.4 EM聚类 152
7.6层次方法 156
7.6.1层次聚类中的距离度量 156
7.6.2分裂方法 157
7.6.3凝聚方法 157
7.7基于密度的方法 158
7.7.1 DBSCAN算法 158
7.7.2矢量感应聚类算法 160
7.8聚类评估 163
7.8.1假设检验 164
7.8.2聚类评估中的假设检验 166
7.8.3相对准则 169
本章小结 169
习题7 169
第8章 兴趣度量 171
8.1引言 171
8.2用于关联规则和分类规则的度量 173
8.2.1客观度量 174
8.2.2主观度量 181
8.2.3语义度量 184
8.3用于总结的度量 186
8.4分类器的兴趣度 189
本章小结 192
习题8 192
第9章 应用案例 194
9.1数据仓库应用案例 194
9.1.1案例一:网络购物数据仓库 194
9.1.2案例二:社会保障卡数据仓库 197
9.1.3案例三:医院信息系统数据仓库 202
9.2数据挖掘应用案例 207
9.2.1案例一:零售商系统货篮数据挖掘 207
9.2.2案例二:通信用户满意度指数评测 212
9.2.3案例三:城市环境质量评价 217
本章小结 220
参考文献 221
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019