《大数据理论与工程实践》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:陆晟,刘振川,汪关盛编著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2018
  • ISBN:9787115496836
  • 页数:300 页
图书介绍:本书不是大数据技术手册,也不是某种具体技术的说明。而是在面对具体的应用场景时的技术考虑和可能的权衡。在实际应用中,很多时候没有绝对的好或者不好,只有适合不适合的差异。甚至大部分情况下,任何选择都需要付出代价,而针对这种收益和代价的衡量和评估、考虑才是本书所关注的。

第1章 概述 1

大数据处理的特征 3

基本处理模型 5

工程角度的大数据历史 8

大数据的基本处理框架 10

大数据的技术实施方法 13

第2章 数据 21

数据存储 23

数据寻址 28

列式存储 34

键值对高速缓存 43

持久化的高速缓存 54

大数据表 65

第3章 计算资源 73

集群总线 75

资源调度 91

资源控制 96

第4章 计算模型 107

MapReduce 109

SQL类查询 113

流式计算 117

图计算 123

第5章 大数据应用 131

搜索信息匹配 134

搜索信息排名 138

文档相似性判定 145

文档主题生成 150

用户画像 161

广告投放决策 173

基数计算 189

第6章 数据治理 197

元数据管理 200

主数据管理 205

数据标准 207

数据管理成熟度评估 211

数据资产 218

数据治理的组织构架 228

第7章 大数据和人工智能 231

大数据和计算机视觉 234

大数据和语音识别 257

大数据和博弈 282

术语表 289

作者介绍 295