第1章 通过大数据管理企业 1
1.1 引言 1
1.2 挑战 2
1.3 正在发生的现象 2
1.4 社交网络 3
1.5 个性化服务和社群 3
1.6 科技驱动和商业分析 4
1.7 从数字到大数据 4
1.7.1 我们是如何走到这一步的? 4
1.7.2 为什么它如此重要? 9
1.7.3 科技的升级换代如何满足需求? 10
1.8 重新定义组织结构 11
1.8.1 关于重新定义 11
1.8.2 一些挑战 12
1.8.3 一些机遇 12
1.8.4 重塑的机会 13
1.9 为大数据时代做好准备 16
1.9.1 科学、技术、工程和数学 16
1.10 一些建议 17
1.11 参考文献 18
第2章 杰克和大数据豆茎:利用充满潜力的市场商机 19
2.1 你认识杰克吗? 19
2.2 来自大数据的挑战 20
2.3 当老问题遇上新问题 24
2.4 五个驱动力 25
2.4.1 全局视角 25
2.4.2 由内及外 27
2.4.3 由外及内 29
2.4.4 兼容并蓄 29
2.4.5 建立互信 32
2.5 收获与回报 33
2.5.1 增加15%~30%的市场投资回报率 34
2.5.2 提升10%~15%的客户毛利润 35
2.5.3 改善5%~7%的定价 36
2.6 什么才是你通往成功的豆茎? 37
第3章 大数据商务分析前沿:网络市场中的模式和案例 39
3.1 简介 39
3.2 大数据分析 41
3.2.1 计算机擅长的工作 41
3.2.2 计算机不是万能的 44
3.2.3 传统商务智能和大数据 45
3.2.4 模型必须由人来设计 46
3.2.5 模型也需要测量 48
3.2.6 数据越大,模型越好 48
3.2.7 大数据和Hadoop 49
3.3 网络营销案例学习 50
3.3.1 wine.com一对一邮箱 50
3.3.2 雅虎网络市场细分分析 53
3.3.3 雅虎邮箱保留 54
3.3.4 潜在客户评分 55
3.3.5 客户终身价值 56
3.3.6 广告表现优化 58
3.3.7 收入预测 58
3.3.8 Ask.com的搜索引擎营销 59
3.4 一些建模经验 61
3.5 结论 62
3.6 参考文献 64
第4章 数据的内在价值 65
4.1 介绍 65
4.2 数据历史简介 67
4.3 交易数据 68
4.4 个人信息 69
4.5 行为数据 71
4.6 数据的成本 72
4.7 数据的价值 73
4.8 微分值 74
4.9 结合数据 76
4.10 贬值的价值 76
4.11 数据的美元价值 77
4.12 结论 78
4.12 参考文献 80
第5章 从大数据中发现重要价值:开启高效能分析的力量 82
5.1 高效能分析:机遇和挑战 83
5.2 核心1:网格计算——充分利用你硬件环境里的容量 88
5.2.1 灵活性与成本优势 88
5.2.2 突破分析:从“天”到“分” 89
5.3 核心2:数据库内部处理——快速了解 89
5.3.1 计算1.2 万亿行数据 89
5.3.2 了解该获取哪些关系 91
5.3.3 更快的执行,更高的效率 92
5.4 核心3:内存分析 92
5.4.1 对市场偏好和趋势迅速做出反应 92
5.4.2 从167个小时到84秒 93
5.4.3 应对复杂的挑战 94
5.5 利用高效能分析取得成功究竟需要些什么? 95
5.6 结论 97
第6章 竞争者、情报和大数据 98
6.1 引言 98
6.2 知识管理、知识资本,以及竞争情报 99
6.3 大数据 101
6.4 战略保护系数以及大数据 102
6.5 结论 109
6.6 参考文献 110
第7章 用大数据拯救生命:揭开电子化健康记录隐藏的潜在信息 112
7.1 幸存下来的败血症患者 114
7.2 收集数据的新方法 116
7.3 时间问题 117
7.4 合规性评估 119
7.5 早期诊断 120
7.6 下一阶段:连续监测 121
7.7 解读医生和护士的注意事项 122
7.8 未来展望 123
第8章 创新模式和大数据 125
8.1 引言 125
8.2 大数据背景 126
8.2.1 作为一种自然资源的大数据 127
8.2.2 作为一种大的数字库存的大数据 127
8.2.3 作为一种对过去更加颗粒化视图的大数据 129
8.2.4 大数据和组织的挑战 129
8.2.5 大数据在过程创新中的角色 130
8.3 P-TRIZ:可重复过程的创新 131
8.4 符号 132
8.5 P-TRIZ方法和技术的例子 134
8.6 结论 139
8.7 参考文献 139
第9章 美国交通部门的大数据 141
第10章 将大数据作为决策过程的核心 147
10.1 背景 147
10.2 铁三角:技能、信任和使用权 149
10.3 人才 150
10.3.1 功能与职责——金发女孩准则 151
10.3.2 要达成目的,不能以此为开始 153
10.3.3 过犹不及 154
10.4 流程 156
10.4.1 像钟表发条一样规律 156
10.4.2 半途而废,还不如不开头 157
10.4.3 增值而非增扰 158
10.4.4 重写历史 159
10.5 技术 160
10.5.1 用户有差别 161
10.6 结论 163
第11章 从多元时间数据中提取有用的信息 164
11.1 引言 164
11.2 实例应用:公共卫生 167
11.3 实例应用:临床信息学 172
11.4 实例应用:金融 174
11.5 实例应用:设备管理 175
11.6 结论 181
11.7 致谢 181
11.8 参考文献 182
第12章 大规模时间序列预测 184
12.1 引言 184
12.2 背景 185
12.2.1 R与数据分析 185
12.2.2 相关工作 186
12.3 Map:并行应用 187
12.3.1 设计目的 187
12.3.2 实施概况 187
12.3.3 R的词法作用域和序列化 188
12.3.4 工作日程安排 190
12.3.5 错误的处理和返回值 191
12.4 简化 191
12.4.1 数据存储和序列化 192
12.4.2 Dremel中的分布式结果整合 192
12.5 应用于预测 193
12.5.1 谷歌预测 193
12.5.2 预测方法论概览 194
12.6 预测置信区间 196
12.6.1 迭代预测法 196
12.6.2 比萨饼搜索轨迹的1000条实现 197
12.7 预测评价和R MapReduce 197
12.8 实验结果 199
12.9 结论 200
12.10 致谢 200
12.11 参考文献 201
第13章 使用大数据和分析来解锁慷慨 203
13.1 引言 203
13.2 大数据环境 204
13.3 慷慨行为分析 205
13.3.1 慷慨是天生的 206
13.3.2 慷慨基于信任 206
13.4 必须考虑捐赠者的要求 208
13.5 为什么大数据在解决这一问题中占据了一席之地? 209
13.6 大数据及分析是如何解锁慷慨的? 210
13.6.1 步骤一:利用人口统计与调查数据来丰富数据 211
13.6.2 步骤二:用大数据来丰富交易数据 212
13.6.3 步骤三:融合数据然后建立一个单支持者视图 215
13.6.4 步骤四:为数据建模和建立他们为什么捐献的模型 215
13.6.5 步骤五:学习和响应 217
13.7 结论 217
第14章 大数据在医疗保健中的应用 219
14.1 引言 219
14.2 健康大数据的类型 222
14.3 临床服务数据 222
14.4 公共卫生调查和监测信息 226
14.5 医学研究数据 227
14.6 以消费者为中心的信息 229
14.7 创建分析工具,为临床提供信息和业务决策 231
14.8 在大数据文化下取得成功 234
14.9 参考文献 235
第15章 大数据:结构化和非结构化 238
15.1 引言 238
15.2 轻量级和重量级的语义学 238
15.3 商用NLP系统 241
15.3.1 技术方法 246
15.3.2 实施和系统集成 248
15.3.3 歧义与语境 250
15.4 未来的方向 252
15.5 附录 253