《Python绝技 运用Python成为顶级数据工程师》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:黄文青编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2018
  • ISBN:9787121336546
  • 页数:206 页
图书介绍:Python 简洁易懂的语法、丰富的类库、以及与大数据组件的无缝集成等诸多特点,使得其成为当前数据工程师的首选编程语言。当然,只是掌握Python还完全不足以成为顶级的数据工程师,因此,本书介绍数据处理知识体系,并以Python实现相关代码示例,力求让读者能使用Python完成数据处理的各个环节。本书的第一章和第二章,简要说明了数据处理领域的基本概念,旨在让读者对数据处理工作有宏观的了解。第二章到第五章,主要讲述了数据分析理论。此处按照难易程度,将其划分成三个部分,即“基础分析”、“数据挖掘”、“深度学习”。第六章,针对大数据分析,介绍了在工程实施过程中的需要用到的“工程组件”、“架构模式”,并以一个具体的案例,说明整个数据工程的实施流程。

1概述 1

1.1 何为数据工程师 1

1.2 数据分析的流程 3

1.3 数据分析的工具 11

1.4 大数据的思与辨 14

2关于Python 17

2.1 为什么是Python 17

2.2 常用基础库 19

2.2.1 Numpy 19

2.2.2 Pandas 26

2.2.3 Scipy 37

2.2.4 Matplotlib 38

3基础分析 43

3.1 场景分析与建模策略 43

3.1.1 统计量 43

3.1.2 概率分布 48

3.2 实例讲解 55

3.2.1 谁的成绩更优秀 55

3.2.2 应该库存多少水果 57

4数据挖掘 60

4.1 场景分析与建模策略 60

4.1.1 分类 61

4.1.2 聚类 76

4.1.3 回归 86

4.1.4 关联规则 90

4.2 数据挖掘的重要概念 93

4.2.1 数据预处理 93

4.2.2 评估与验证 97

4.2.3 Bagging与Adaboost 99

4.2.4 梯度下降与牛顿法 102

4.3 实例讲解 105

4.3.1 信用卡欺诈监测 105

4.3.2 员工离职预判 110

5深度学习 114

5.1 场景分析与建模策略 115

5.1.1 感知机 115

5.1.2 自编码器 119

5.1.3 限制玻尔兹曼机 123

5.1.4 深度信念神经网络 127

5.1.5 卷积神经网络 129

5.2 人工智能应用概况 137

5.2.1 深度学习的历史 137

5.2.2 人工智能的杰作 140

5.3 实例讲解 146

5.3.1 学习识别手写数字 146

5.3.2 让机器认识一只猫 151

6大数据分析 160

6.1 常用组件介绍 160

6.1.1 数据传输 160

6.1.2 数据存储 165

6.1.3 数据计算 174

6.1.4 数据展示 180

6.2 大数据处理架构 188

6.2.1 Lambda架构 189

6.2.2 Kappa架构 192

6.2.3 ELK架构 193

6.3 项目设计 194

参考文献 202