第1章 大数据技术及其相关政策 1
1.1 大数据产生的背景 1
1.2 大数据的概念和特征 3
1.2.1 大数据的概念 3
1.2.2 大数据的特征 3
1.3 大数据技术发展趋势 4
1.3.1 大数据带来的决策方式的革命 4
1.3.2 大数据面临的挑战及其对应的技术概览 7
1.3.3 大数据架构下的人才需求及产业结构 12
1.4 大数据近期政策及其响应 15
1.5 本章小结 18
参考文献 18
作者简介 19
第2章 大数据的开放式创新 20
2.1 开放数据 21
2.2 基于数据安全流通和定价的数据市场 23
2.3 开放的基础设施 26
2.4 开放的社会化分析服务 28
2.5 跨越领域界限的开放数据思维 30
2.6 本章小结 31
参考文献 31
作者简介 32
第3章 流动的大数据 33
3.1 大数据的哲学思考 33
3.2 三个案例看互联网 34
3.3 “爽”的体验与流动性 35
3.4 从个体到关系:笛卡儿两分法的破灭 38
3.5 本章小结 40
相关工作与扩展阅读 40
参考文献 41
作者简介 41
第4章 大数据技术架构与发展趋势 42
4.1 大数据技术概览 42
4.2 Hadoop生态系统 46
4.3 Spark生态系统 54
4.4 Spark和Hadoop的性能对比 60
4.5 大数据技术前景及未来 62
4.6 本章小结 64
相关工作与扩展阅读 65
参考文献 66
作者简介 67
第5章 大数据语义分析关键技术 68
5.1 引言 68
5.2 国内外研究现状及发展动态分析 71
5.2.1 语义计算 71
5.2.2 文本表示 72
5.2.3 语义知识本体构建 73
5.2.4 情感分析 74
5.3 技术框架 76
5.3.1 信息客体表示模型 77
5.3.2 跨语言本体概念空间的大数据自动构建 78
5.3.3 知识抽取与大数据关联分析 79
5.3.4 社会个体的语义表示与群体发现 79
5.3.5 基于知识本体的语义计算与情感量化分析 80
5.3.6 面向公共安全事件的群体态势推演 81
5.4 关键科学问题与技术特色 82
5.5 研究方法 84
5.6 技术路线 85
5.6.1 信息客体表示模型 85
5.6.2 跨语言本体概念空间的大数据自动构建 86
5.6.3 知识抽取与大数据关联分析 87
5.6.4 社会个体的语义表示与群体发现 89
5.6.5 基于知识本体的语义计算与情感量化分析 90
5.6.6 面向公共安全事件的群体态势推演 91
5.7 基于知识本体大数据语义分析技术的应用实践 93
5.7.1 NLPIR大数据搜索与挖掘共享平台 93
5.7.2 JZSearch语义精准搜索引擎 101
参考文献 108
作者简介 111
第6章 社会网络大数据的情感分析与情绪感知技术 112
6.1 概述 112
6.2 国内外相关研究进展 115
6.3 基于微博热点话题的情感分析及其应用 117
6.4 基于多维度分析的群体情感摘要抽取及其应用 121
6.5 基于统计学习的情绪分类及其时序变化分析应用 125
6.6 未来研究方向 129
6.7 本章小结 130
参考文献 130
作者简介 132
第7章 大数据时代的数据挖掘与可视化传播 133
7.1 大数据时代来临 133
7.2 大数据的基本特征 134
7.3 大数据挖掘与应用 136
7.4 大数据与小数据 139
7.5 数据挖掘的基本原理与方法 140
7.6 大数据时代的数据可视化技术 144
7.7 大数据挖掘和数据可视化工具 148
作者简介 155
第8章 大规模社会多媒体数据搜索与处理 156
8.1 社会多媒体简介 156
8.1.1 社会多媒体的发展 156
8.1.2 社会多媒体的特点和挑战 158
8.2 大规模社会多媒体数据的搜索 160
8.3 社会多媒体搜索模式 161
8.3.1 基于开放API的搜索 161
8.3.2 基于页面的搜索 161
8.3.3 基于语义模式的搜索 162
8.4 社会多媒体的在线实时搜索架构 165
8.4.1 在线分布式实时搜索 166
8.4.2 反封堵管理模块 167
8.5 大规模社会多媒体的基本处理技术 168
8.5.1 社会多媒体存储计算 169
8.5.2 社会多媒体数据的特征学习 172
8.6 大规模社会多媒体数据的挖掘与应用 176
8.6.1 以用户为中心的社会多媒体建模 178
8.6.2 以内容为中心的社会多媒体建模 180
8.6.3 基于用户和内容的关联挖掘 183
8.7 本章小结 186
参考文献 186
作者简介 188
第9章 第四范式下的大数据分析模型构建 189
9.1 第四范式的提出 189
9.2 第四范式真的不需要理论吗 190
9.2.1 总体问题 190
9.2.2 因果关系问题 191
9.2.3 效度低 191
9.3 如何用理论模型来架构网络数据 191
9.4 传播学理论的应用 198
9.5 简单的效果分析模型——品牌明星代言调查 201
9.6 本章小结 203
作者简介 204
第10章 大数据视角下的新媒体指数 205
10.1 新媒体指数简介 205
10.2 大数据视角下的新媒体指数详述 205
10.2.1 从信息源看新媒体指数 205
10.2.2 从信息分析方法看新媒体指数 207
10.2.3 从数据应用场景看新媒体指数 209
10.3 本章小结 210
作者简介 211
第11章 企业级数据仓库向大数据基础设施转型中的若干问题 212
11.1 扩容与换代叠加 213
11.2 迁移与新需求交织 213
11.3 设备轻型化、平台开源化与团队重构同步 214
11.4 “互联网+”与非结构化数据爆炸 214
作者简介 215
第12章 金融行业大数据综述 216
12.1 金融行业大数据相关政策 216
12.1.1 中央政府的相关政策 216
12.1.2 地方政府的相关政策 217
12.2 金融大数据的定义与概述 217
12.3 金融大数据的市场分析 219
12.4 金融大数据支撑的业务 220
12.4.1 第三方支付 220
12.4.2 P2P业务 222
12.4.3 互联网征信 223
12.4.4 众筹 225
12.4.5 互联网银行 226
12.5 主要互联网金融公司介绍 227
12.5.1 阿里巴巴 227
12.5.2 腾讯 228
12.5.3 百度 229
12.5.4 大象金服 230
作者简介 234
第13章 金融行业大数据应用 234
13.1 导言 234
13.2 大数据技术在金融行业的实际应用 234
13.2.1 第一类应用:个体公司内部数据的动员 235
13.2.2 第二类应用:行业数据平台 237
13.2.3 第三类应用:行业外部数据在金融行业的应用 239
13.2.4 金融行业数据从关系型数据库向大数据技术平台的迁移 242
13.3 金融行业的应用对大数据技术提出严格的要求 242
13.4 本章小结 248
作者简介 249
第14章 智慧旅游大数据应用 250
14.1 导言 250
14.2 旅游舆情分析 251
14.2.1 中国旅游目的地网络舆情指数 251
14.2.2 舆情分析方法 252
14.2.3 舆情热点分析 254
14.3 基于大数据的游客行为分析 255
14.3.1 旅游大数据预测 256
14.3.2 电商OTA数据分析 258
14.3.3 交通数据分析 258
14.4 基于运营商的LBS数据的游客轨迹分析及用户画像 259
14.4.1 游客画像监测 259
14.4.2 游客轨迹分析 261
14.5 本章小结 262
作者简介 262