当前位置:首页 > 工业技术
精通Azure数据分析
精通Azure数据分析

精通Azure数据分析PDF电子书下载

工业技术

  • 电子书积分:13 积分如何计算积分?
  • 作 者:(美)Zoiner Tejada(佐伊纳·特哈达)
  • 出 版 社:北京:中国电力出版社
  • 出版年份:2018
  • ISBN:9787519820978
  • 页数:373 页
图书介绍:本书介绍包括数据湖和Lambda架构在内的基本架构概念,同时结合示例代码详细解释数据分析管道中的各个阶段。为了帮助你在数据分析的各个阶段能选择适当的Azure服务,还通过一个案例场景对全书内容进行了扩展,对书中所涉及的各项Azure服务,以示例代码的形式展示了它们在现实世界的真实用例。本书的主要内容有:理解如何存储超大规模数据。设计并实施可提供快速的“热”查询和精确的“冷”结果的解决方案。以批量数据处理、实时微批量或一次处理一个元组的方式处理实时数据。将机器学习与你的数据管道相集成。数据资产的管理、治理和安全。使用示例代码,这些代码由C#、Scala、Java,以及在现代数据分析管道中服务所使用的原生语言所编写。
《精通Azure数据分析》目录

序 1

前言 3

第1章 企业数据分析基础 7

数据分析管道 7

数据湖 8

Lambda架构 9

Kappa架构 11

在Lambda和Kappa间进行选择 12

Azure分析管道 12

数据分析场景介绍 15

示例代码和示例数据集 16

小结 21

第2章 将数据导入Azure 22

摄取加载层 22

批量数据加载 24

硬盘传送 24

流数据加载 78

小结 80

第3章 在Azure中存储摄取的数据 81

文件存储 81

队列存储 97

小结 124

第4章 Azure中的实时数据处理 125

流处理 125

在Azure中每次处理一个元组 131

小结 174

第5章 Azure中的实时微批处理 176

Azure中的微批处理 176

小结 207

第6章 Azure中的批处理 208

HDInsight上的MapReduce批处理 210

HDInsight上的Hive批处理 214

HDInsight上的Pig批处理 228

HDInsight上的Spark批处理 229

使用SQL数据仓库的批处理 237

使用数据湖分析的批处理 247

Azure Batch批处理 258

小结 260

第7章 Azure中的交互式查询 261

Azure SQL数据仓库的可交互式查询 263

Hive和Tez交互式查询 269

Spark SQL交互式查询 277

USQL交互式查询 281

小结 284

第8章 Azure中的冷\热访问服务层 285

Azure Redis缓存 287

Document DB 294

SQL数据库 300

SQL数据仓库 308

HDInsight上的HBase 309

Azure搜索 314

小结 315

第9章 智能和机器学习 316

Azure机器学习 319

HDInsight上的R服务 321

SQL R服务 321

Microsoft认知服务 322

小结 334

第10章 Azure中的元数据管理 335

使用Azure数据目录管理元数据 335

小结 350

第11章 保护在Azure中的数据 351

身份和访问管理 351

数据保护 353

审计 355

小结 356

第12章 执行数据分析 357

使用Power BI进行分析 357

在蓝色天际机场场景中使用Power BI批量分析报表 368

展望 372

相关图书
作者其它书籍
返回顶部