数据仓库与数据挖掘PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:安淑芝等编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2005
- ISBN:7302106886
- 页数:207 页
第1章 绪论 1
1.1 初识数据挖掘 1
1.1.1 数据挖掘的产生 1
1.1.2 数据挖掘的应用价值 1
目录 1
1.2 初识数据仓库 2
1.2.1 数据仓库的产生 2
1.1.4 数据挖掘的定义 2
1.1.3 数据挖掘的发展过程 2
1.2.2 数据仓库的应用价值 3
1.2.3 数据仓库的发展过程 4
1.2.4 数据仓库的定义 4
1.2.5 数据仓库与数据挖掘的关系 4
1.3 进一步理解数据挖掘 5
1.3.1 数据挖掘的功能 5
1.3.2 数据挖掘常用技术 6
1.3.3 数据挖掘的过程 10
1.4.1 应用领域 11
1.4 数据挖掘应用实例 11
1.4.2 典型案例 13
1.5 数据挖掘的发展趋势 16
1.5.1 数据挖掘研究方向 16
1.5.2 数据挖掘应用的热点 16
小结 17
习题 17
第2章 数据仓库 18
2.1 进一步深入理解数据仓库的定义 18
2.1.1 数据仓库的数据是面向主题的 19
2.1.2 数据仓库的数据是集成的 22
2.1.3 数据仓库的数据是不可更新的 22
2.1.4 数据仓库的数据是随时间不断变化的 22
2.2 数据仓库的结构 23
2.2.1 元数据 23
2.2.2 粒度的概念 26
2.2.3 分割问题 27
2.2.4 数据仓库中的数据组织形式 28
2.4 数据仓库的清理 30
2.3 数据仓库的说明——标准手册 30
2.5 数据仓库系统的设计 31
2.5.1 数据仓库系统设计方法 31
2.5.2 数据仓库设计的三级数据模型 33
2.5.3 提高数据仓库的性能 36
2.5.4 数据仓库设计步骤 38
2.6 数据仓库数据的访问 45
2.6.1 数据仓库数据的直接访问 46
2.6.2 数据仓库数据的间接访问 46
2.7 数据仓库的应用 48
2.7.1 数据仓库的主要应用领域 49
2.7.2 数据仓库应用实例 49
小结 52
习题 52
3.1 数据预处理的目的 53
3.1.1 原始数据中存在的问题 53
第3章 数据预处理 53
3.1.2 数据预处理的方法和功能 54
3.2 数据清理 54
3.2.1 处理空缺值 55
3.2.2 噪声数据的处理 56
3.3 数据集成和变换 59
3.3.1 数据集成 59
3.3.2 数据变换 62
3.4.2 数据立方体聚集 64
3.4.1 数据归约的方法 64
3.4 数据归约 64
3.4.3 维归约 65
3.4.4 数据压缩 67
3.4.5 数值归约 67
3.4.6 离散化与概念分层生成 70
小结 75
习题 76
4.1.2 广义知识的发现方法 78
4.1.1 广义知识的概念 78
4.1 广义知识 78
第4章 数据挖掘发现知识的类型 78
4.2 关联知识 80
4.2.1 关联知识的概念 80
4.2.2 关联知识的发现方法 80
4.2.3 关联规则应用实例 81
4.3 分类知识 82
4.3.1 分类知识的概念 82
4.3.2 分类知识的发现方法 82
4.3.3 分类知识应用实例 83
4.4 预测型知识 84
4.4.1 预测型知识的概念 84
4.4.2 预测型知识的发现方法 84
4.4.3 预测型知识应用实例 85
4.5 偏差型知识 86
4.5.1 偏差型知识的概念 86
4.5.2 偏差型知识的发现方法 86
习题 89
小结 89
第5章 数据挖掘中常用算法 90
5.1 神经网络算法 90
5.1.1 神经网络的概念 90
5.1.2 神经网络的计算机模型 93
5.1.3 定义神经网络拓扑 98
5.1.4 基于神经网络的算法 99
5.2 使用候选项集找频繁项集(Apriori)算法 101
5.2.1 关联规则的分类 101
5.2.2 Apriori算法 102
5.2.3 从频繁项集产生关联规则 104
5.3 决策树算法 104
5.3.1 信息论的基本原理 104
5.3.2 ID3算法 107
5.3.3 树剪枝 111
5.3.4 由决策树提取分类规则 112
5.4.1 聚类分析的概念 113
5.4 聚类分析 113
5.4.2 聚类分析中的数据类型 115
5.4.3 几种主要的聚类分析方法 120
5.4.4 聚类分析算法 122
小结 124
习题 125
第6章 数据挖掘的工具及其应用 126
6.1 SQL Server 2000数据挖掘工具应用 126
6.1.1 安装要求 126
6.1.2 安装过程 127
6.1.3 Analysis Services功能介绍 129
6.1.4 Analysis Services的优点 129
6.1.5 创建数据挖掘模型 130
6.1.6 查看和分析挖掘结果 143
6.1.7 聚类模型 149
6.2.1 安装SPSS Clementine 151
6.2.2 SPSS Clementine 8.0工作环境介绍 151
6.2 SPSS数据挖掘工具应用 151
6.2.3 Clementine应用的结构 152
6.2.4 Clementine的使用 162
6.2.5 挖掘模型的建立和执行 164
小结 177
习题 177
第7章 数据挖掘应用实例 178
7.1 实例背景 178
7.2.2 决策树的概念 179
7.2.1 数据挖掘中的分类算法 179
7.2 决策树算法 179
7.3 实例开发 181
7.3.1 实例开发前的准备 181
7.3.2 实例的系统结构 183
7.3.3 决策树算法模块 184
7.3.4 算法的程序实现 186
7.4 核心源程序 192
小结 206
参考文献 207
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019