数据仓库、挖掘和可视化 核心概念PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:(美)George M.Marakas著;敖富江译
- 出 版 社:北京:清华大学出版社
- 出版年份:2004
- ISBN:7302092613
- 页数:285 页
第1章 数据挖掘、数据仓库和数据可视化概述 1
目录 1
1.1 现代数据仓库 4
1.2 数据仓库的作用和结构 5
1.3 数据仓库可以完成的工作 7
1.3.1 快捷的信息交付 7
1.3.2 企业内/外的数据集成 8
1.3.3 从历史趋势展望未来 8
1.3.4 用新方式浏览数据的工具 8
1.3.5 免受IS部门资源限制 8
1.3.6 对日常工作有何意义 9
1.3.8 是否存在数据仓库无法完成的工作 10
1.3.7 没有什么是免费的 10
1.4 数据仓库的成本 11
1.4.1 不定成本 12
1.4.2 成本合理性 12
1.4.3 没有数据仓库时如何访问信息 12
1.4.4 存在数据仓库时如何访问信息 13
1.4.5 成本的差距 14
1.4.6 多报表 15
1.4.7 普通用户和高级用户 15
1.4.8 普通用户、高级用户与成本合理性 15
1.4.9 数据集市和数据仓库 16
1.6 数据挖掘的起源 18
1.5 数据挖掘的基础 18
1.7 数据勘查和数据挖掘的方法 22
1.7.1 数据相关 23
1.7.2 数据仓库和数据挖掘/数据勘查 27
1.7.3 最大的挑战——数据容量 28
1.8 数据可视化的基础 29
1.8.1 数据可视化背后的历史 30
1.8.2 走在知识前沿的数据可视化 34
1.9 小结 34
第2章 数据仓库 39
2.1 存储、仓库和集市 41
2.1.1 数据存储器 42
2.1.4 DW环境 43
2.1.2 数据集市 43
2.1.3 元数据 43
2.1.5 DW的特征 44
2.1.6 数据冗余问题 48
2.2 数据仓库体系结构 49
2.2.1 操作型数据库层和外部数据库层 50
2.2.2 信息访问层 50
2.2.3 数据访问层 50
2.2.4 元数据层 50
2.2.5 过程管理层 51
2.2.6 应用通信层 51
2.2.7 物理DW层 51
2.2.8 数据分段层 51
2.2.9 数据仓库技术 52
2.3 描述数据的数据——元数据 53
2.3.1 “抽象”的概念 53
2.3.2 数据的键 54
2.3.3 运转中的元数据 54
2.3.4 一致性——避免事实出现多个版本 55
2.3.5 同意事实的一个版本 55
2.4 元数据的提取 56
2.5 实现数据仓库 59
2.5.1 过失1:“如果创建了仓库,它们的用途就自然显现出来了” 59
2.5.2 过失2:遗漏了体系结构框架 59
2.5.4 过失4:没有使用正确的工具 60
2.5.3 过失3:理解用文档对假设进行说明的重要性 60
2.5.5 过失5:滥用生命周期 61
2.5.6 过失6:忽略了数据冲突问题 61
2.5.7 过失7:没有从失败中吸取经验教训 61
2.6 数据仓库技术 61
2.7 小结 63
第3章 数据挖掘和数据可视化 66
3.1 数据挖掘的概念 69
3.1.1 验证型分析与挖掘型分析 71
3.1.2 DM的逐渐普及 71
3.1.3 使用DM进行更精确的个人预测 72
3.2 联机分析处理 72
3.2.1 MOLAP 73
3.2.2 ROLAP 74
3.3 用于数据挖掘的技术 76
3.3.1 分类 76
3.3.2 关联 77
3.3.3 序列 77
3.3.4 聚类 78
3.3.5 DM技术 78
3.3.6 KDD过程 79
3.3.7 新型DM应用 81
3.4 市场购物篮分析:DM算法之王 82
3.4.1 市场购物篮分析的优点 83
3.4.2 市场购物篮分析的关联规则 84
3.4.3 利用虚项进行市场购物篮分析 88
3.4.4 使用这些结果 91
3.5 DM目前的限制和面临的挑战 92
3.5.1 标识出遗漏信息 92
3.5.2 数据噪声和遗漏值 93
3.5.3 大型数据库和高维度 93
3.6 数据可视化 93
3.6.1 历史 95
3.6.2 人类视觉感知和数据可视化 95
3.6.3 地理信息系统 98
3.6.4数据可视化技术的应用 99
3.7 Siftware技术 100
3.7.1 Red Brick 100
3.7.2 Oracle 102
3.7.4 Sybase 103
3.7.3 Informix 103
3.7.5 Silicon Graphics 104
3.7.6 IBM 104
3.8 小结 105
第4章 机器学习 121
4.1 模糊逻辑和语义模糊性 123
4.1.1 语义模糊性 123
4.1.2 模糊逻辑的基础 124
4.1.3 模糊与概率 126
4.1.4 模糊逻辑的优缺点 126
4.2 人工神经网络 128
4.2.1 神经计算的基础 129
4.2.2 人工神经网络的训练 132
4.2.3 人工神经网络学习范式 133
4.2.4 神经计算的优点和局限性 135
4.3 遗传算法与遗传进化网络 137
4.3.1 最优理论 137
4.3.2 介绍遗传算法 138
4.3.3 遗传算法的优点和局限性 143
4.4 机器学习的应用 144
4.4.1 机器学习的应用领域 144
4.4.2 机器学习系统的未来 147
4.5 小结 148
第5章 执行信息系统 155
5.1 EIS的概念 157
5.1.1 典型的EIS会话 158
5.1.2 EIS无法完成的工作 159
5.2 EIS历史 159
5.3 高级执行官与众不同的原因 160
5.3.1 执行官的信息需求 160
5.3.2 执行信息的类型和源 163
5.4 EIS组件 165
5.4.1 硬件组件 166
5.4.2 软件组件 167
5.4.3 目前的EIS技术 168
5.5 使EIS开始工作 169
5.5.1 EIS开发框架 169
5.5.2 一些需要避免的EIS局限和缺陷 172
5.5.3 失败是无法接受的 173
5.6 执行官决策和EIS的未来 174
5.6.1 转化条件 174
5.6.2 未来的EIS 175
5.7 小结 177
第6章 设计并构造数据仓库 182
6.1 DW设计的企业模型方法 184
6.1.1 定义EM 184
6.1.2 自上而下的DW设计 185
6.1.3 自下而上的DW设计 185
6.1.4 企业集成的概念 185
6.2 DW项目规划 187
6.2.1 DW项目定义和就绪度评估 187
6.2.2 克服DW就绪度的不足 190
6.2.3 定义新建DW项目的作用域 192
6.2.4 为DW项目定义商业认证 193
6.2.5 使DW项目成为商业案例所面临的问题 193
6.2.6 经济可行性分析 195
6.2.7 经济可行性指标 199
6.2.8 开发DW项目规划 203
6.3 指定分析和设计工具 205
6.3.1 DW逻辑设计的维度建模方法 205
6.3.2 设计DW事实表 208
6.4 DW体系结构规范和开发 209
6.4.3 通用业务规则 210
6.4.4 通用语义 210
6.4.2 通用维 210
6.4.1 通用源 210
6.4.5 通用度量单位 211
6.4.6 DW体系结构关键组件区域 212
6.4.7 开发DW技术体系结构 214
6.5 DW项目的成功因素 215
6.6 小结 216
第7章 数据挖掘、数据仓库和数据可视化的未来 219
7.1 数据仓库的未来 223
7.1.1 规章约束 223
7.1.2 非结构化数据的存储 223
7.1.3 World Wide Web 224
7.2.1 可选存储器 226
7.2 可选存储器和数据仓库 226
7.2.2 使可选存储器工作 228
7.3 数据仓库的趋势 229
7.4 数据挖掘的未来 232
7.4.1 在个性化和隐私之间权衡 232
7.4.2 “信息是自然资源”的概念 235
7.4.3 大型数据集的爆炸 236
7.5 使用数据挖掘保护隐私 237
7.5.1 目前的IDS系统如何检测入侵 237
7.5.2 目前的IDS系统具有的弊端 237
7.5.3 我们在寻找什么 238
7.5.5 入侵检测DM所面临的困难 239
7.5.4 DM如何提供帮助 239
7.6 影响DM未来的趋势 240
7.6.1 数据趋势 240
7.6.2 硬件趋势 240
7.6.3 网络趋势 240
7.6.4 业务趋势 241
7.6.5 对DM的未来所预期的可能情况 241
7.7 数据可视化的未来 242
7.7.1 武器性能和安全仿真 242
7.7.2 医学损伤治疗 243
7.7.3 未来将会展现的技术能力 244
7.7.4 未来的医学外伤场景展望 245
7.8 未来可视化应用的各个组件 246
7.9 小结 247
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《飞扬 第十七届新概念作文获奖者范本 B卷》省登宇主编 2015
- 《金匮要略核心知识点全攻略》温成平,曹灵勇 2019
- 《基于核心素养提升的美术综合教学》麻丽娟主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《增强“四个意识” 向核心看齐》欧黎明,于建荣 2017
- 《基于核心素养的有效学习与学业评价策略 初中政治》李亚莉主编 2018
- 《汉语言文学本科专业核心课程研究导引教材 古代汉语》马蓝婕责任编辑;(中国)魏宜辉 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019