第1章 商务智能、数据分析和决策支持概述 1
1.1 开篇小插曲:Magpie Sensing公司使用分析技术高效而安全地管理疫苗供应链 1
1.2 变化的商业环境和计算机决策支持 3
1.3 商务智能架构 4
1.3.1 BI的定义 5
1.3.2 BI的简史 5
1.3.3 BI的架构 5
1.3.4 BI的起源和驱动力 6
1.3.5 BI中的多媒体练习 8
1.4 智能产生、使用与商务智能治理 8
1.4.1 智能产生和使用的循环过程 8
1.4.2 智能与窃取 9
1.5 事务处理与分析处理 9
1.6 成功的BI实施 10
1.6.1 典型的BI用户群体 10
1.6.2 合理规划与业务战略的统一 11
1.6.3 实时的、随需应变的BI是可以实现的 11
1.6.4 开发或收购BI系统 12
1.6.5 理由和成本-收益分析 12
1.6.6 安全和隐私保护 12
1.6.7 系统和应用的集成 12
1.7 数据分析概述 13
1.7.1 描述性分析 14
1.7.2 预测性分析 15
1.7.3 规范性分析 16
1.7.4 应用于不同领域的数据分析 19
1.7.5 数据分析还是数据科学 19
1.8 大数据分析简介 20
1.9 本书的安排 21
1.10 资源、链接和Teradata大学网络连接 22
1.10.1 资源和链接 22
1.10.2 供应商、产品和演示 22
1.10.3 期刊 22
1.10.4 Teradata大学网络连接 23
1.10.5 本书的网站 23
本章要点 23
关键词 23
问题讨论 23
练习 24
章末应用案例 25
参考文献 26
第2章 数据仓库 28
2.1 开篇小插曲:卡普里岛赌场利用企业数据仓库获胜 28
2.2 数据仓库的定义和概念 30
2.2.1 什么是数据仓库 30
2.2.2 数据仓库历史透视 30
2.2.3 数据仓库的特点 32
2.2.4 数据集市 33
2.2.5 操作数据存储 33
2.2.6 企业数据仓库 33
2.2 元数据 35
2.3 数据仓库流程概述 36
2.4 数据仓库架构 38
2.4.1 可选的数据仓库架构 40
2.4.2 哪种架构最好 42
2.5 数据集成以及提取、转换和加载过程 43
2.5.1 数据集成 44
2.5.2 提取、转换和加载 46
2.6 数据仓库的开发 47
2.6.1 数据仓库开发方法 50
2.6.2 数据仓库开发的其他思考 53
2.6.3 数据仓库中的数据表示 53
2.6.4 数据仓库中的数据分析 54
2.6.5 OLAP和OLTP 54
2.6.6 OLAP操作 55
2.7 数据仓库的实施问题 57
2.8 实时数据仓库 60
2.9 数据仓库管理、安全问题和未来趋势 64
2.10 资源、链接和Teradata大学网络连接 68
2.10.1 资源和链接 68
2.10.2 案例 68
2.10.3 供应商、产品和演示 68
2.10.4 期刊 68
2.10.5 其他参考文献 69
2.10.6 Teradata大学网络连接 69
本章要点 69
关键词 69
问题讨论 70
练习 70
章末应用案例 72
参考文献 74
第3章 业务报表、可视化分析与企业绩效管理 77
3.1 开篇小插曲:自助服务的报表环境为企业用户节省上百万美元 77
3.2 业务报表的定义和概念 80
3.2.1 什么是业务报表 81
3.2.2 业务报表系统的组件 84
3.3 数据与信息可视化 85
3.4 不同类型的图表 89
3.4.1 基本图表 89
3.4.2 专用图表 90
3.5 数据可视化与可视化分析的出现 92
3.5.1 可视化分析 93
3.5.2 高性能可视化分析环境 95
3.6 绩效仪表盘 97
3.6.1 仪表盘设计 98
3.6.2 在仪表盘中寻找什么 100
3.6.3 仪表盘设计的最佳实践 101
3.6.4 根据行业标准建立KPI基准 101
3.6.5 利用上下文元数据封装仪表盘度量 101
3.6.6 通过可用性专家检验仪表盘设计 101
3.6.7 在仪表盘中指定警报和异常的优先级 101
3.6.8 使用用户评论丰富的仪表盘 102
3.6.9 在3个不同层次展示信息 102
3.6.10 使用仪表盘设计准则选择正确的可视化方式 102
3.6.11 提供指导性分析 102
3.7 企业绩效管理 102
3.8 绩效度量 105
3.8.1 关键绩效指标 106
3.8.2 绩效度量系统 107
3.9 平衡记分卡 107
3.9.1 4个视角 107
3.9.2 平衡在BSC中的意义 108
3.9.3 仪表盘与平衡记分卡 109
3.10 作为绩效度量系统的六西格玛 109
3.10.1 DMAIC绩效模型 110
3.10.2 平衡记分卡与六西格玛 110
3.10.3 有效的绩效度量 111
本章要点 113
关键词 114
问题讨论 114
练习 115
章末应用案例 116
参考文献 118
第4章 数据挖掘 119
4.1 开篇小插曲:坎贝拉公司将高级分析和数据挖掘应用于更多客户 119
4.2 数据挖掘概念和应用 121
4.2.1 定义、特征和优势 122
4.2.2 数据挖掘原理 127
4.2.3 数据挖掘与统计学 130
4.3 数据挖掘应用 131
4.4 数据挖掘过程 133
4.4.1 步骤1:业务理解 134
4.4.2 步骤2:数据理解 134
4.4.3 步骤3:数据准备 135
4.4.4 步骤4:建模 137
4.4.5 步骤5:测试和评估 137
4.4.6 步骤6:部署 137
4.4.7 其他标准化的数据挖掘过程和方法 139
4.5 数据挖掘方法 140
4.5.1 分类 140
4.5.2 估算分类模型的准确率 141
4.5.3 数据挖掘聚类分析 146
4.5.4 关联规则挖掘 148
4.6 数据挖掘软件工具 151
4.7 数据挖掘的隐私问题、谬误和隐患 156
4.7.1 数据挖掘和隐私问题 156
4.7.2 数据挖掘谬误和隐患 157
本章要点 158
关键词 159
问题讨论 160
练习 160
章末应用案例 162
参考文献 163
第5章 文本与Web分析 164
5.1 开篇小插曲:《危险边缘》上的人机大战:Watson的故事 164
5.2 文本分析和文本挖掘概述 166
5.3 自然语言处理 170
5.4 文本挖掘应用 174
5.4.1 营销应用 174
5.4.2 安全应用 174
5.4.3 生物医学应用 177
5.4.4 学术应用 178
5.5 文本挖掘过程 180
5.5.1 任务1:建立语料库 180
5.5.2 任务2:创建词项-文档矩阵 181
5.5.3 任务3:提取知识 182
5.6 情感分析 186
5.6.1 情感分析应用 189
5.6.2 情感分析过程 190
5.6.3 极性识别方法 191
5.6.4 使用词典 191
5.6.5 使用训练文档集 192
5.6.6 识别句子和短语的语义倾向 192
5.6.7 识别文档的语义倾向 193
5.7 Web挖掘概述 193
5.8 搜索引擎 197
5.8.1 搜索引擎剖析 198
5.8.2 开发环 198
5.8.3 网络爬虫 198
5.8.4 文档索引器 198
5.8.5 响应环 199
5.8.6 查询分析器 199
5.8.7 文档匹配器/排名器 199
5.8.8 搜索引擎优化 200
5.8.9 搜索引擎优化的方法 201
5.9 Web使用挖掘(Web分析) 203
5.9.1 Web分析技术 204
5.9.2 Web分析度量 206
5.9.3 网站可用性 206
5.9.4 流量来源 207
5.9.5 访客特征 208
5.9.6 转化统计 208
5.10 社交分析 209
5.10.1 社交网络分析 210
5.10.2 社交网络分析度量 211
5.10.3 联系 212
5.10.4 分布 212
5.10.5 分割 213
5.10.6 社交媒体分析 213
5.10.7 人们如何使用社交媒体 214
5.10.8 评估社交媒体的影响 215
5.10.9 社交媒体分析的最佳实践 216
本章要点 218
关键词 219
问题讨论 220
练习 220
章末应用案例 221
参考文献 223
第6章 大数据与分析 225
6.1 开篇小插曲:当大数据遇上大数据科学 225
6.2 大数据的定义 228
6.3 大数据分析基础 233
6.4 大数据技术 237
6.4.1 MapReduce 237
6.4.2 为什么使用MapReduce 238
6.4.3 Hadoop 238
6.4.4 Hadoop如何工作 238
6.4.5 Hadoop技术组件 239
6.4.6 Hadoop:利与弊 240
6.4.7 NoSQL 241
6.5 数据科学家 243
6.6 大数据和数据仓库 248
6.6.1 Hadoop的使用案例 248
6.6.2 数据仓库的使用案例 249
6.6.3 灰色区域(任意一个都能胜任) 250
6.6.4 Hadoop和数据仓库共存 250
6.7 大数据供应商 252
6.8 大数据与流分析 258
6.8.1 流分析与持久性分析 259
6.8.2 关键事件处理 260
6.8.3 数据流挖掘 260
6.9 流分析的应用 261
6.9.1 电子商务 261
6.9.2 电信 261
6.9.3 法律实施与网络安全 263
6.9.4 电力行业 263
6.9.5 金融服务 263
6.9.6 健康科学 263
6.9.7 政府 264
本章要点 264
关键词 264
问题讨论 265
练习 265
章末应用案例 266
参考文献 268
第7章 业务分析:趋势与前景 269
7.1 开篇小插曲:俄克拉荷马州天然气及电力公司利用数据分析促进智能能源使用 269
7.2 为组织提供基于位置的分析 270
7.2.1 地理空间分析 271
7.2.2 实时位置智能 273
7.3 面向消费者的分析应用 275
7.4 推荐引擎 277
7.5 Web 2.0革命和在线社交网络 278
7.5.1 Web 2.0的典型特征 279
7.5.2 社交网络 279
7.5.3 定义和基本信息 279
7.5.4 商业和企业社交网络 280
7.6 云计算与商务智能 281
7.6.1 面向服务的DSS 282
7.6.2 数据即服务 283
7.6.3 信息即服务 284
7.6.4 分析即服务 284
7.7 数据分析对组织的影响 286
7.7.1 新的组织结构 286
7.7.2 重构业务流程和虚拟团队 286
7.7.3 工作满意度 287
7.7.4 工作压力和焦虑 287
7.7.5 分析工具对管理人员活动和绩效的影响 287
7.8 法律、隐私和道德问题 288
7.8.1 法律问题 288
7.8.2 隐私 289
7.8.3 最近涉及隐私和数据分析的技术问题 290
7.8.4 决策中的道德问题和支持 291
7.9 数据分析生态系统 291
7.9.1 数据分析行业的类别 292
7.9.2 数据基础设施供应商 292
7.9.3 数据仓库行业 293
7.9.4 中间件/BI平台行业 293
7.9.5 数据聚合商与分发商 293
7.9.6 专注于分析的软件开发者 293
7.9.7 报表和分析 294
7.9.8 预测性分析 294
7.9.9 规范性分析 294
7.9.10 特定行业或通用的应用开发者、系统集成者 295
7.9.11 分析工具的用户组织 296
7.9.12 行业分析师和影响者 297
7.9.13 教育机构和认证机构 297
本章要点 298
关键词 298
问题讨论 299
练习 299
章末应用案例 300
参考文献 301
索引 303