数据仓库与数据挖掘技术 第2版PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:夏火松主编
- 出 版 社:北京:科学出版社
- 出版年份:2009
- ISBN:9787030129345
- 页数:295 页
第1章 数据仓库与数据挖掘概述 1
1.1 数据仓库引论 1
1.1.1 为什么要建立数据仓库 1
1.1.2 什么是数据仓库 2
1.1.3 数据仓库的特点 6
1.1.4 数据进入数据仓库的基本过程与建立数据仓库的步骤 10
1.1.5 分析数据仓库的内容 11
1.2 数据挖掘引论 12
1.2.1 为什么要进行数据挖掘 12
1.2.2 什么是数据挖掘 16
1.2.3 数据挖掘的特点 19
1.2.4 数据挖掘的基本过程与步骤 20
1.2.5 分析数据挖掘的内容 24
1.3 数据挖掘与数据仓库的关系 25
1.4 数据仓库与数据挖掘的应用 28
1.4.1 数据挖掘在零售业的应用 28
1.4.2 数据挖掘在商业银行中的应用 33
1.4.3 数据挖掘在电信部门的应用 36
1.4.4 数据挖掘在贝斯出口公司的应用 38
1.4.5 数据挖掘如何预测信用卡欺诈 38
1.4.6 数据挖掘在证券行业的应用 40
思考练习题 40
第2章 数据仓库的分析 42
2.1 数据仓库的需求分析模型 42
2.2 影响数据仓库成功的因素 43
2.3 数据仓库的生命周期 45
2.3.1 数据仓库计划与准备阶段 45
2.3.2 数据仓库的其他阶段 52
2.4 数据仓库的基本体系结构 53
2.5 数据仓库的逻辑结构 56
2.5.1 数据仓库中的粒度 56
2.5.2 数据仓库中的数据分割 57
2.5.3 数据仓库中的数据组织 57
2.5.4 数据仓库中的快照 58
2.5.5 数据仓库中的元数据 58
思考练习题 59
第3章 数据仓库的设计与实施 60
3.1 设计科学与数据仓库的设计 60
3.2 从数据库到数据仓库 61
3.3 面向主题的数据仓库设计 62
3.3.1 数据建模 62
3.3.2 星型连接 63
3.3.3 数据仓库的数据模型设计 70
3.4 开发数据仓库的物理设计 72
3.4.1 数据仓库设计工具的选择 72
3.4.2 物理数据模型设计 73
3.4.3 数据仓库中数据表的数量与规范化 74
3.5 数据仓库的实施 74
3.5.1 数据仓库的实施应注意的问题 74
3.5.2 在实施数据仓库过程中应避免的错误 75
3.5.3 数据仓库项目实施成功的要诀 77
思考练习题 81
第4章 信息分析的基本技术 83
4.1 自动信息分析的基本技术 83
4.1.1 智能代理 83
4.1.2 群体智能 85
4.1.3 小波分析 88
4.1.4 分形技术分析 91
4.2 联机分析 91
4.2.1 联机分析OLAP的基本术语 93
4.2.2 OLAP体系结构和处理的特性 94
4.2.3 OLAP多维数据结构与OLAP的分类 94
4.2.4 OLAP的多维数据分析方法 95
4.2.5 OLAP评价准则 97
4.2.6 OLAP的发展与流行的OLAP工具选择 100
4.3 Rough的信息分析技术 101
4.3.1 粗糙集理论的基本概念和理论基础 102
4.3.2 粗糙集在信息分析中的特征表示 103
思考练习题 105
第5章 数据挖掘过程 106
5.1 数据挖掘的方法与基本流程 106
5.1.1 SEMMA方法 106
5.1.2 数据挖掘的基本流程 107
5.2 确定主题和定义数据挖掘任务 108
5.2.1 确定主题 109
5.2.2 定义数据挖掘任务 110
5.3 数据预处理 111
5.3.1 数据的收集和准备 111
5.3.2 数据清理 112
5.3.3 数据集成 113
5.3.4 数据变换 114
5.3.5 数据归约 115
5.3.6 微软数据转换服务 115
5.4 数据挖掘的模型建立与理解 116
5.4.1 关于模型的准确性 118
5.4.2 关于模型的可理解性 118
5.4.3 关于模型的性能 119
5.4.4 描述和可视化 119
5.4.5 验证与评估 120
5.5 数据挖掘中常见的一些问题 122
5.5.1 商业用户提出的问题 122
5.5.2 技术问题 122
5.5.3 数据挖掘应用问题 122
5.5.4 实施数据挖掘项目考虑的问题 123
5.5.5 数据挖掘对社会的影响——有关隐私问题 123
5.6 事先无法预测的有价值知识 124
思考练习题 124
第6章 数据挖掘基本算法 125
6.1 分类规则挖掘 125
6.1.1 分类与估值 125
6.1.2 决策树 128
6.1.3 贝叶斯分类 135
6.2 预测分析与趋势分析规则 139
6.2.1 预言的基本方法 139
6.2.2 定量分析预测 140
6.2.3 预测的结果分析 142
6.2.4 趋势分析挖掘 143
6.3 数据挖掘的关联算法 144
6.3.1 关联规则的概念及分类 144
6.3.2 简单形式的关联规则算法(单维、单层和布尔关联规则) 148
6.3.3 多层和多维关联规则的挖掘 152
6.3.4 货篮子分析存在的问题 155
6.3.5 关联分析的其他算法 157
6.3.6 挖掘序列模式 160
6.4 数据挖掘的聚类算法 164
6.4.1 聚类分析的概念与分类 166
6.4.2 聚类分析中两个对象之间的相异度计算方法 171
6.4.3 划分方法 177
6.4.4 层次方法 181
6.4.5 基于密度的方法 186
6.4.6 基于网格的方法 188
6.4.7 基于模型的聚类方法 191
6.4.8 模糊聚类算法 192
6.5 数据挖掘的统计分析算法 193
6.5.1 辨别分析 193
6.5.2 回归建模 193
6.5.3 优点和缺点 194
6.6 数据挖掘的品种优化算法 194
6.6.1 品种优化 194
6.6.2 品种优化的算法 196
6.7 数据挖掘的进化算法 199
6.7.1 遗传算法 199
6.7.2 数据挖掘的神经网络算法 200
思考练习题 204
第7章 非结构化数据挖掘 206
7.1 文本挖掘 206
7.1.1 文本挖掘的一般过程与应用 207
7.1.2 文本表示与预处理 208
7.1.3 文本分类方法与文本聚类方法 212
7.1.4 自动摘要方法 213
7.2 Web数据挖掘 213
7.2.1 非结构化Web数据源 214
7.2.2 Web挖掘分类 219
7.2.3 Web内容挖掘 221
7.2.4 Web结构挖掘 222
7.2.5 Web访问挖掘 222
7.2.6 利用Web日志的聚类算法 225
7.2.7 电子商务中的Web挖掘 227
7.3 空间群数据挖掘 230
7.3.1 空间数据挖掘的概念 230
7.3.2 空间数据挖掘的分类 231
7.3.3 空间数据挖掘的体系结构 232
7.4 多媒体数据挖掘 232
7.4.1 多媒体数据挖掘的概念 232
7.4.2 多媒体数据挖掘的分类 233
7.4.3 多媒体数据挖掘的体系结构 233
思考练习题 234
第8章 离群数据挖掘 235
8.1 离群数据挖掘的概念 235
8.2 离群数据挖掘的分类 236
8.3 离群数据挖掘的算法 237
8.3.1 基于统计的方法 237
8.3.2 基于距离的离群数据方法 239
8.3.3 基于偏离的离群数据挖掘 241
8.3.4 高维数据的离群数据挖掘 243
8.3.5 基于小波的离群数据挖掘 244
8.4 市场营销离群数据挖掘 247
8.4.1 市场营销离群数据的特点 247
8.4.2 基于分形的市场营销离群数据挖掘模型 248
思考练习题 250
第9章 数据挖掘语言与工具的选择 251
9.1 数据挖掘语言及其标准化 251
9.1.1 数据挖掘语言的分类 251
9.1.2 分析与评价 257
9.2 数据挖掘的研究热点 257
9.3 数据挖掘工具的选择 258
9.3.1 评价数据挖掘工具的优劣指标 259
9.3.2 通用数据挖掘产品与工具 260
9.3.3 国内的数据挖掘产品与工具 273
9.3.4 数据可视化工具的选择 275
9.3.5 数据挖掘网站与可获得的数据挖掘算法源代码 276
思考练习题 278
第10章 知识管理与知识管理系统 279
10.1 知识管理 279
10.1.1 知识 279
10.1.2 知识管理的定义 280
10.1.3 有效的知识管理 281
10.2 知识管理系统 284
10.2.1 知识管理共享的条件 285
10.2.2 知识管理共享的困难 285
10.2.3 知识管理的激励机制 286
10.2.4 知识管理的体系结构 289
思考练习题 291
附录 数据挖掘产品部分信息 292
参考文献 294
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《小牛顿科学故事馆 医学的故事》小牛顿科学教育公司编辑团队 2018
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019