第1章 大数据与数据分析 1
1.1 概述 1
1.1.1 大数据的含义 2
1.1.2 大数据的定义 2
1.1.3 大数据的特征 3
1.1.4 大数据与云计算 5
1.1.5 大数据与商业模式变革 5
1.1.6 大数据带来的问题 6
1.2 大数据与云计算 8
1.3 大数据与电子商务 14
1.3.1 电子商务催生大数据 15
1.3.2 数据分析给电子商务带来更多机会 15
1.3.3 网站分析与应用 17
1.4 大数据与物联网 18
1.4.1 物联网的含义 18
1.4.2 物联网与大数据的关系 19
1.4.3 美国物联网应用 19
1.5 移动互联网与智能终端 20
1.6 大数据应用的机会与挑战 23
1.6.1 挖出“潜伏”的数据价值 24
1.6.2 大数据面临的挑战 27
1.6.3 大数据思维 30
1.7 银行业大数据应用 36
第2章 互联网数据存储 37
2.1 大数据对数据存储的要求 37
2.1.1 数据存储面临的问题 38
2.1.2 与大数据存储基础设施相关的属性 39
2.1.3 数据存储技术面临的挑战 41
2.1.4 存储技术趋势预测与分析 42
2.2 存储技术 44
2.2.1 DAS存储 46
2.2.2 RAID存储 46
2.2.3 NAS 48
2.2.4 SAN 50
2.2.5 IP网络存储 51
2.2.6 iSCSI 52
2.2.7 存储技术比较 54
2.3 云存储技术 56
2.3.1 云存储技术与传统存储技术 56
2.3.2 云存储的优点 57
2.3.3 云存储的分类 58
2.3.4 云存储的技术基础 60
2.3.5 云存储系统的结构模型 61
2.3.6 云存储的用途 62
2.4 大数据存储解决方案 63
2.4.1 戴尔的流动文件系统 64
2.4.2 华为的集群存储系统 65
2.4.3 戴尔的自动分层存储 66
2.4.4 EMC的闪存存储技术 68
第3章 互联网数据分析工具 70
3.1 数据分析概述 70
3.1.1 数据分析过程 72
3.1.2 数据分析框架的主要事件 73
3.2 数据分析与数据挖掘 74
3.2.1 数据挖掘的任务 75
3.2.2 数据挖掘的过程 77
3.2.3 数据挖掘的主要算法 78
3.2.4 数据挖掘的应用领域 81
3.2.5 数据挖掘和OLAP 83
3.3 关联分析 84
3.3.1 关联规则挖掘过程 84
3.3.2 关联规则分类 85
3.3.3 关联规则算法 86
3.3.4 关联规则应用 87
3.4 聚类分析 88
3.5 分类分析 93
3.5.1 决策树 93
3.5.2 其他分类算法 95
3.6 时间序列分析 99
3.6.1 时间序列的构成要素 100
3.6.2 时间序列的分类 101
3.6.3 预测方法 102
3.6.4 确定性时间序列分析 104
3.6.5 随机性时间序列分析 107
第4章 商务网站数据分析与应用 109
4.1 概述 111
4.1.1 商业活动与商业数据 111
4.1.2 电子商务数据的特点 112
4.1.3 商务数据的挖掘利用 113
4.2 网站数据分析 115
4.2.1 为什么需要数据分析 115
4.2.2 网站数据分析的内容 115
4.2.3 怎么做数据分析 115
4.3 网站数据分析的指标体系 117
4.3.1 相关术语介绍 117
4.3.2 网站数据分析的指标分类 122
4.3.3 数据分析的内容指标体系 126
4.3.4 网站分析的商业指标 130
4.3.5 网站数据分析的应用价值 132
4.4 网站流量数据的获取 133
4.4.1 监听网络数据包 133
4.4.2 分析服务器日志 134
4.4.3 添加页面脚本 134
4.4.4 三种方法的比较 134
4.5 网站数据分析技术 135
4.5.1 数据收集系统 137
4.5.2 数据转发系统 139
4.5.3 实时数据分析系统 140
4.5.4 离线数据平台系统 143
4.6 数据分析应用 145
4.6.1 网站优化 146
4.6.2 个性化推荐 146
4.6.3 网页设计优化 150
4.6.4 服务提升与优化 152
4.6.5 网络营销 153
4.7 案例分析 155
第5章 政府网站数据分析及应用 161
5.1 电子政务概述 161
5.1.1 电子政务的含义 161
5.1.2 电子政务价值 163
5.1.3 电子政务环境下的政府信息资源 164
5.1.4 政务网站信息分类 166
5.2 政务网站信息分类 169
5.3 政府数据仓库与数据挖掘 170
5.3.1 政务元数据标准 170
5.3.2 电子政务数据仓库 171
5.3.3 电子政务数据挖掘 173
5.4 电子政务网站数据分析方法 174
5.5 数据分析与政府执行力 179
5.5.1 服务满意度测评 179
5.5.2 主动服务 181
5.5.3 民生热点分析 184
5.5.4 服务流程优化 184
5.6 案例分析 189
第6章 物联网数据分析与应用 193
6.1 物联网概述 193
6.1.1 物联网的概念与实质 193
6.1.2 物联网的兴起与发展状况 194
6.1.3 物联网的应用 195
6.1.4 物联网在我国的应用现状 196
6.1.5 应用模式 197
6.2 物联网技术 197
6.2.1 条码技术 197
6.2.2 RFID技术 200
6.2.3 全球数据同步 203
6.3 物联网数据分析与处理 206
6.3.1 物联网系统中数据的特点 206
6.3.2 物联网数据处理模型 207
6.3.3 物联网与大数据分析 209
6.4 物联网数据分析应用 212
6.4.1 智能家居 212
6.4.2 远程医疗 213
6.4.3 老人关怀 214
6.4.4 药品安全监控 214
6.4.5 零售、物流、供应链管理 214
6.4.6 食品追踪 215
6.4.7 农业育种 215
6.5 物联网数据挖掘 215
6.5.1 物联网数据挖掘的关键问题 216
6.5.2 物联网环境数据挖掘存在的挑战 216
6.5.3 基于云计算的物联网数据挖掘模型 216
6.5.4 功能模块 218
6.6 应用案例 218
第7章 移动商务数据分析与应用 221
7.1 移动商务概述 221
7.1.1 移动商务的概念及分类 221
7.1.2 移动商务的特点 222
7.1.3 移动电子商务的体系与产业链 224
7.2 移动商务的应用 226
7.3 移动商务数据分析技术 230
7.3.1 无线与移动技术 230
7.3.2 数据仓库技术 230
7.3.3 联机事务处理与联机分析处理 231
7.3.4 知识发现技术 231
7.3.5 信息聚合技术 231
7.3.6 智能技术 231
7.4 移动商务中的数据挖掘技术 232
7.4.1 数据挖掘基本流程 232
7.4.2 关联规则在移动商务客户价值挖掘中的应用案例 232
7.5 位置信息分析与应用 235
7.5.1 位置服务的含义 235
7.5.2 定位技术 238
7.5.3 基于位置服务的推荐算法 241
7.5.4 LBS与物流优化 244
7.6 移动商务发展中的问题 248
7.6.1 技术应用阻力 248
7.6.2 商业模式仍需摸索 249
第8章 微博数据分析与应用 251
8.1 微博概述 252
8.1.1 微博的定义 253
8.1.2 微博的特点 254
8.1.3 中外微博的文化差异 255
8.1.4 微博代表 257
8.2 微博应用 259
8.3 微博数据分析技术 262
8.3.1 文本信息抽取技术 263
8.3.2 微博文本处理 263
8.3.3 微博舆情分析 264
8.3.4 基于语义分析的微博文本挖掘技术 265
8.3.5 用户影响力计算的相关算法 269
8.3.6 适于演化的微博信息的数据表达模型 274
8.3.7 适于微博信息的大规模数据集划分方法 274
8.4 企业微博数据分析及应用 276
8.4.1 微博营销:数据分析的应用 276
8.4.2 微应用 278
8.4.3 企业机构话题营销 278
8.4.4 微博营销数据分析案例 279
8.5 政务微博数据分析及应用 281
8.5.1 政务微博的特点 281
8.5.2 政务微博应用存在的问题 282
8.5.3 政务微博应用面临的挑战 282
8.5.4 政务微博的数据分析和应用 284
8.6 大众微博的舆情分析 288
8.6.1 舆情分析的内容 288
8.6.2 新浪微博对网络舆情生成和传播的影响 290
8.6.3 大众网络舆情的作用 291
8.7 微博营销案例 292
参考文献 297