《人工智能与大数据技术导论》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:杨正洪,郭良越,刘玮著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2019
  • ISBN:9787302517986
  • 页数:472 页
图书介绍:本书共10章,内容包括人工智能概述、AI产业、数据、机器学习、机器学习算法、深度学习、机器视觉技术、语音技术、知识图谱、数据挖掘与分析等。附录给出极有参考价值的大数据与人工智能产业参考资料。

第1章 人工智能概述 1

1.1 AI是什么 1

1.1.1火热的AI 2

1.1.2 AI的驱动因素 3

1.2 AI技术的成熟度 4

1.2.1视觉识别 4

1.2.2自然语言理解 5

1.2.3机器人 7

1.2.4自动驾驶 8

1.2.5机器学习 9

1.2.6游戏 10

1.3美国AI巨头分析 11

1.4国内AI现状 16

1.5 AI与云计算和大数据的关系 17

1.6 AI技术路线 17

1.7 AI国家战略 18

1.8 AI的历史发展 19

第2章 AI产业 24

2.1基础层 25

2.1.1芯片产业 25

2.1.2 GPU 27

2.1.3 FPGA 28

2.1.4 ASIC 28

2.1.5 TPU 29

2.1.6亚马逊的芯片 31

2.1.7芯片产业小结 32

2.1.8传感器 33

2.1.9传感器小结 35

2.2技术层 37

2.2.1机器学习 37

2.2.2语音识别与自然语言处理 39

2.2.3计算机视觉 42

2.3应用层 44

2.3.1安防 44

2.3.2金融 45

2.3.3制造业 47

2.3.4智能家居 48

2.3.5医疗 48

2.3.6自动驾驶 50

2.4 AI产业发展趋势分析 55

第3章 数据 58

3.1什么是大数据 59

3.1.1大数据的特征 59

3.1.2大数据的误区 60

3.1.3大数据交易难点 60

3.1.4大数据的来源 62

3.1.5数据关联 63

3.1.6大数据生产链 64

3.1.7大数据怎么用 64

3.2国内大数据现状 65

3.2.1政策持续完善 66

3.2.2技术和应用逐步落地 66

3.2.3数据产生价值难 67

3.2.4问题与机遇并存 67

3.3大数据的计算模式 68

3.3.1流式计算的应用场景 69

3.3.2流式大数据的特征 70

3.3.3流式计算关键技术 72

3.4大数据技术 74

3.4.1数据技术的演进 75

3.4.2分布式计算系统概述 76

3.4.3 Hadoop 77

3.4.4 Spark 80

3.4.5 Storm系统 82

3.4.6 Kafka系统 84

3.4.7各类技术平台比较 86

3.5数据平台 88

3.5.1数据存储和计算 89

3.5.2数据质量 92

3.5.3数据管理 97

3.5.4数据目录 99

3.5.5数据安全管控 100

3.5.6数据准备 102

3.5.7数据整合 107

3.5.8数据服务 107

3.5.9数据开发 107

3.5.10数据平台总结 108

3.6大数据的商用途径 109

3.6.1数据化 109

3.6.2算法化 109

3.6.3应用化(产品化) 110

3.6.4生态化 111

3.7大数据产业 112

3.7.1大数据产业界定 112

3.7.2大数据技术发展的推动力 114

3.7.3重点行业的大数据应用 117

3.7.4大数据应用发展趋势 123

3.7.5大数据的产业链构成分析 123

3.8政府大数据案例分析 125

3.8.1政府有哪些数据资源 126

3.8.2政府大数据应用案例 126

3.8.3政府大数据面临的挑战 130

3.8.4政府大数据应用启示 131

第4章 机器学习概述 133

4.1走进机器学习 133

4.1.1什么是机器学习 133

4.1.2机器学习的感性认识 133

4.1.3机器学习的本质 134

4.1.4对机器学习的全面认识 135

4.1.5机器学习、深度学习与人工智能 136

4.1.6机器学习、数据挖掘与数据分析 137

4.2机器学习的基本概念 139

4.2.1数据集、特征和标签 139

4.2.2监督式学习和非监督式学习 140

4.2.3强化学习和迁移学习 140

4.2.4特征数据类型 141

4.2.5训练集、验证集和测试集 141

4.2.6机器学习的任务流程 142

4.3数据预处理 142

4.3.1探索性分析 143

4.3.2数据清洗 143

4.3.3特征工程 145

第5章 模型 146

5.1什么是模型 146

5.2误差和MSE 148

5.3模型的训练 149

5.3.1模型与算法的区别 149

5.3.2迭代法 150

5.4梯度下降法 151

5.4.1步长 152

5.4.2优化步长 152

5.4.3三类梯度下降法 153

5.4.4梯度下降的详细算法 154

5.5模型的拟合效果 155

5.5.1欠拟合与过拟合 155

5.5.2过拟合的处理方法 156

5.6模型的评估与改进 157

5.6.1机器学习模型的评估 157

5.6.2机器学习算法与人类比较 158

5.6.3改进策略 159

5.7机器学习的实现框架 160

5.7.1 Python 160

5.7.2 scikit-learn 161

5.7.3 Spark MLlib 163

第6章 机器学习算法 164

6.1算法概述 164

6.1.1线性回归 165

6.1.2逻辑回归 165

6.1.3线性判别分析 166

6.1.4分类与回归树分析 167

6.1.5朴素贝叶斯 167

6.1.6 K最近邻算法 168

6.1.7学习矢量量化 168

6.1.8支持向量机 169

6.1.9 Bagging和随机森林 170

6.1.10 Boosting和AdaBoost 170

6.2支持向量机算法 171

6.3逻辑回归算法 173

6.4 KNN算法 175

6.4.1超参数k 175

6.4.2 KNN实例:波士顿房价预测 177

6.4.3算法评价 179

6.5决策树算法 179

6.6集成算法 182

6.6.1集成算法简述 182

6.6.2集成算法之Bagging 183

6.6.3集成算法之Boosting 184

6.7聚类算法 185

6.7.1 K均值聚类 185

6.7.2均值漂移聚类 186

6.7.3基于密度的聚类方法 187

6.7.4用高斯混合模型的最大期望聚类 188

6.7.5凝聚层次聚类 189

6.7.6图团体检测 190

6.8机器学习算法总结 192

第7章 深度学习 193

7.1走进深度学习 193

7.1.1深度学习为何崛起 194

7.1.2从逻辑回归到浅层神经网络 194

7.1.3深度神经网络 196

7.1.4正向传播 197

7.1.5激活函数 197

7.2神经网络的训练 197

7.2.1神经网络的参数 197

7.2.2向量化 198

7.2.3价值函数 198

7.2.4梯度下降和反向传播 198

7.3神经网络的优化和改进 199

7.3.1神经网络的优化策略 199

7.3.2正则化方法 201

7.4卷积神经网络 203

7.4.1卷积运算 203

7.4.2卷积层 204

7.4.3 CNN实例 205

7.5深度学习的优势 210

7.6深度学习的实现框架 211

第8章 TensorFlow 213

8.1 TensorFlow工具包 213

8.1.1 tf estimator API 214

8.1.2 Pandas速成 214

8.1.3必要的Python知识 216

8.2第一个TensorFlow程序 219

8.2.1装载数据 220

8.2.2探索数据 221

8.2.3训练模型 221

8.2.4评估模型 223

8.2.5优化模型 225

8.2.6合成特征 231

8.2.7离群值处理 234

8.3过拟合处理 237

8.3.1训练集和测试集 238

8.3.2验证集 239

8.3.3过拟合实例 240

8.4特征工程 249

8.4.1数值型数据 249

8.4.2字符串数据和one-hot编码 250

8.4.3枚举数据(分类数据) 250

8.4.4好特征 250

8.4.5数据清洗 251

8.4.6分箱(分桶)技术 252

8.4.7特征工程实例 253

第9章 TensorFlow高级知识 263

9.1特征交叉 263

9.1.1什么是特征交叉 263

9.1.2 FTRL实践 265

9.1.3分桶(分箱)代码实例 268

9.1.4特征交叉代码实例 271

9.2 L2正则化 274

9.3逻辑回归 276

9.4分类 279

9.4.1评价指标——准确率 279

9.4.2评价指标——精确率 281

9.4.3指标——召回率 281

9.4.4评价指标之综合考虑 282

9.4.5 ROC曲线 284

9.4.6预测偏差 285

9.4.7分类代码实例 286

9.5 L1正则化 298

第10章 神经网络 308

10.1什么是神经网络 308

10.1.1隐藏层 308

10.1.2激活函数 309

10.1.3 ReLU 310

10.1.4实例代码 311

10.2训练神经网络 320

10.2.1正向传播算法 320

10.2.2反向传播算法 322

10.2.3标准化特征值 324

10.2.4丢弃正则化 324

10.2.5代码实例 325

10.3多类别神经网络 340

10.3.1一对多方法 340

10.3.2 Softmax 341

10.3.3代码实例 343

10.4嵌套 357

10.4.1协同过滤 358

10.4.2稀疏数据 359

10.4.3获取嵌套 360

10.4.4代码实例 360

第11章 知识图谱 372

11.1什么是知识图谱 372

11.1.1知识图谱的定义 373

11.1.2知识图谱的架构 373

11.1.3开放知识图谱 374

11.1.4知识图谱在行业数据分析中的应用 376

11.2知识图谱构建的关键技术 377

11.2.1知识提取 378

11.2.2语义类抽取 379

11.2.3属性和属性值抽取 381

11.2.4关系抽取 382

11.2.5知识表示 382

11.2.6知识融合 383

11.3知识计算及应用 384

11.4企业知识图谱建设 384

第12章 数据挖掘 387

12.1什么是数据挖掘 387

12.1.1数据挖掘技术产生的背景 387

12.1.2数据挖掘与数据分析的区别 387

12.2数据挖掘技术(方法) 388

12.2.1分类 388

12.2.2聚类 389

12.2.3回归分析 389

12.2.4关联规则 389

12.2.5神经网络方法 390

12.2.6 Web数据挖掘 390

12.2.7特征分析 390

12.2.8偏差分析 391

12.3大数据思维 391

12.3.1信度与效度思维 391

12.3.2分类思维 391

12.3.3漏斗思维 392

12.3.4逻辑树思维 392

12.3.5时间序列思维 393

12.3.6指数化思维 393

12.3.7循环/闭环思维 394

第13章 银行业大数据和人工智能 395

13.1四大行的进展 396

13.1.1建设银行 396

13.1.2工商银行 396

13.1.3农业银行 398

13.1.4中国银行 398

13.2其他银行 399

13.2.1广发银行 399

13.2.2江苏银行 400

13.3金融宏观大数据分析 404

13.4小结 407

13.4.1大数据给银行带来的机遇与挑战 407

13.4.2银行大数据体系建设的思考 409

第14章 医疗大数据和人工智能 412

14.1医疗大数据的特点 412

14.2医疗大数据处理模型 413

14.3医疗大数据的AI应用 416

14.3.1智能辅助诊疗 416

14.3.2影像数据分析与影像智能诊断 416

14.3.3合理用药 416

14.3.4远程监控 417

14.3.5精准医疗 417

14.3.6成本与疗效分析 417

14.3.7绩效管理 417

14.3.8医院控费 417

14.3.9医疗质量分析 418

14.4人工智能的医疗应用场景 418

14.5人工智能要当“医生” 420

14.6医院大数据 421

14.7机器学习在医疗行业中的应用实例分析 422

第15章 公安大数据和人工智能 424

15.1公安大数据的特点 424

15.2建设流程 425

15.3公安大数据管理平台 426

15.3.1公安大数据建模 427

15.3.2公安大数据汇集 428

15.3.3公安大数据服务 428

15.4公安大数据挖掘分析 428

15.5公安大数据AI应用 429

15.6小结 430

第16章 工农业大数据和人工智能 431

16.1中国制造2025 432

16.2工业大数据 433

16.2.1工业大数据面临三大制约因素 433

16.2.2工业大数据应用的四大发展趋势 434

16.2.3发展工业大数据 434

16.3 AI+制造 435

16.4农业大数据 435

16.4.1发展现状 435

16.4.2农业大数据目标 435

16.4.3农业大数据建设任务 436

16.4.4农产品质量安全追溯 437

附录A 国内人工智能企业名单 438

附录B 大数据和人工智能网上资料 441

附录C 本书中采用的人工智能中英文术语 444

附录D 术语列表 446