序 1
前言 3
第1章 企业数据分析基础 7
数据分析管道 7
数据湖 8
Lambda架构 9
Kappa架构 11
在Lambda和Kappa间进行选择 12
Azure分析管道 12
数据分析场景介绍 15
示例代码和示例数据集 16
小结 21
第2章 将数据导入Azure 22
摄取加载层 22
批量数据加载 24
硬盘传送 24
流数据加载 78
小结 80
第3章 在Azure中存储摄取的数据 81
文件存储 81
队列存储 97
小结 124
第4章 Azure中的实时数据处理 125
流处理 125
在Azure中每次处理一个元组 131
小结 174
第5章 Azure中的实时微批处理 176
Azure中的微批处理 176
小结 207
第6章 Azure中的批处理 208
HDInsight上的MapReduce批处理 210
HDInsight上的Hive批处理 214
HDInsight上的Pig批处理 228
HDInsight上的Spark批处理 229
使用SQL数据仓库的批处理 237
使用数据湖分析的批处理 247
Azure Batch批处理 258
小结 260
第7章 Azure中的交互式查询 261
Azure SQL数据仓库的可交互式查询 263
Hive和Tez交互式查询 269
Spark SQL交互式查询 277
USQL交互式查询 281
小结 284
第8章 Azure中的冷\热访问服务层 285
Azure Redis缓存 287
Document DB 294
SQL数据库 300
SQL数据仓库 308
HDInsight上的HBase 309
Azure搜索 314
小结 315
第9章 智能和机器学习 316
Azure机器学习 319
HDInsight上的R服务 321
SQL R服务 321
Microsoft认知服务 322
小结 334
第10章 Azure中的元数据管理 335
使用Azure数据目录管理元数据 335
小结 350
第11章 保护在Azure中的数据 351
身份和访问管理 351
数据保护 353
审计 355
小结 356
第12章 执行数据分析 357
使用Power BI进行分析 357
在蓝色天际机场场景中使用Power BI批量分析报表 368
展望 372