第1章 人工智能概述 1
1.1 AI是什么 1
1.1.1火热的AI 2
1.1.2 AI的驱动因素 3
1.2 AI技术的成熟度 4
1.2.1视觉识别 4
1.2.2自然语言理解 5
1.2.3机器人 7
1.2.4自动驾驶 8
1.2.5机器学习 9
1.2.6游戏 10
1.3美国AI巨头分析 11
1.4国内AI现状 16
1.5 AI与云计算和大数据的关系 17
1.6 AI技术路线 17
1.7 AI国家战略 18
1.8 AI的历史发展 19
第2章 AI产业 24
2.1基础层 25
2.1.1芯片产业 25
2.1.2 GPU 27
2.1.3 FPGA 28
2.1.4 ASIC 28
2.1.5 TPU 29
2.1.6亚马逊的芯片 31
2.1.7芯片产业小结 32
2.1.8传感器 33
2.1.9传感器小结 35
2.2技术层 37
2.2.1机器学习 37
2.2.2语音识别与自然语言处理 39
2.2.3计算机视觉 42
2.3应用层 44
2.3.1安防 44
2.3.2金融 45
2.3.3制造业 47
2.3.4智能家居 48
2.3.5医疗 48
2.3.6自动驾驶 50
2.4 AI产业发展趋势分析 55
第3章 数据 58
3.1什么是大数据 59
3.1.1大数据的特征 59
3.1.2大数据的误区 60
3.1.3大数据交易难点 60
3.1.4大数据的来源 62
3.1.5数据关联 63
3.1.6大数据生产链 64
3.1.7大数据怎么用 64
3.2国内大数据现状 65
3.2.1政策持续完善 66
3.2.2技术和应用逐步落地 66
3.2.3数据产生价值难 67
3.2.4问题与机遇并存 67
3.3大数据的计算模式 68
3.3.1流式计算的应用场景 69
3.3.2流式大数据的特征 70
3.3.3流式计算关键技术 72
3.4大数据技术 74
3.4.1数据技术的演进 75
3.4.2分布式计算系统概述 76
3.4.3 Hadoop 77
3.4.4 Spark 80
3.4.5 Storm系统 82
3.4.6 Kafka系统 84
3.4.7各类技术平台比较 86
3.5数据平台 88
3.5.1数据存储和计算 89
3.5.2数据质量 92
3.5.3数据管理 97
3.5.4数据目录 99
3.5.5数据安全管控 100
3.5.6数据准备 102
3.5.7数据整合 107
3.5.8数据服务 107
3.5.9数据开发 107
3.5.10数据平台总结 108
3.6大数据的商用途径 109
3.6.1数据化 109
3.6.2算法化 109
3.6.3应用化(产品化) 110
3.6.4生态化 111
3.7大数据产业 112
3.7.1大数据产业界定 112
3.7.2大数据技术发展的推动力 114
3.7.3重点行业的大数据应用 117
3.7.4大数据应用发展趋势 123
3.7.5大数据的产业链构成分析 123
3.8政府大数据案例分析 125
3.8.1政府有哪些数据资源 126
3.8.2政府大数据应用案例 126
3.8.3政府大数据面临的挑战 130
3.8.4政府大数据应用启示 131
第4章 机器学习概述 133
4.1走进机器学习 133
4.1.1什么是机器学习 133
4.1.2机器学习的感性认识 133
4.1.3机器学习的本质 134
4.1.4对机器学习的全面认识 135
4.1.5机器学习、深度学习与人工智能 136
4.1.6机器学习、数据挖掘与数据分析 137
4.2机器学习的基本概念 139
4.2.1数据集、特征和标签 139
4.2.2监督式学习和非监督式学习 140
4.2.3强化学习和迁移学习 140
4.2.4特征数据类型 141
4.2.5训练集、验证集和测试集 141
4.2.6机器学习的任务流程 142
4.3数据预处理 142
4.3.1探索性分析 143
4.3.2数据清洗 143
4.3.3特征工程 145
第5章 模型 146
5.1什么是模型 146
5.2误差和MSE 148
5.3模型的训练 149
5.3.1模型与算法的区别 149
5.3.2迭代法 150
5.4梯度下降法 151
5.4.1步长 152
5.4.2优化步长 152
5.4.3三类梯度下降法 153
5.4.4梯度下降的详细算法 154
5.5模型的拟合效果 155
5.5.1欠拟合与过拟合 155
5.5.2过拟合的处理方法 156
5.6模型的评估与改进 157
5.6.1机器学习模型的评估 157
5.6.2机器学习算法与人类比较 158
5.6.3改进策略 159
5.7机器学习的实现框架 160
5.7.1 Python 160
5.7.2 scikit-learn 161
5.7.3 Spark MLlib 163
第6章 机器学习算法 164
6.1算法概述 164
6.1.1线性回归 165
6.1.2逻辑回归 165
6.1.3线性判别分析 166
6.1.4分类与回归树分析 167
6.1.5朴素贝叶斯 167
6.1.6 K最近邻算法 168
6.1.7学习矢量量化 168
6.1.8支持向量机 169
6.1.9 Bagging和随机森林 170
6.1.10 Boosting和AdaBoost 170
6.2支持向量机算法 171
6.3逻辑回归算法 173
6.4 KNN算法 175
6.4.1超参数k 175
6.4.2 KNN实例:波士顿房价预测 177
6.4.3算法评价 179
6.5决策树算法 179
6.6集成算法 182
6.6.1集成算法简述 182
6.6.2集成算法之Bagging 183
6.6.3集成算法之Boosting 184
6.7聚类算法 185
6.7.1 K均值聚类 185
6.7.2均值漂移聚类 186
6.7.3基于密度的聚类方法 187
6.7.4用高斯混合模型的最大期望聚类 188
6.7.5凝聚层次聚类 189
6.7.6图团体检测 190
6.8机器学习算法总结 192
第7章 深度学习 193
7.1走进深度学习 193
7.1.1深度学习为何崛起 194
7.1.2从逻辑回归到浅层神经网络 194
7.1.3深度神经网络 196
7.1.4正向传播 197
7.1.5激活函数 197
7.2神经网络的训练 197
7.2.1神经网络的参数 197
7.2.2向量化 198
7.2.3价值函数 198
7.2.4梯度下降和反向传播 198
7.3神经网络的优化和改进 199
7.3.1神经网络的优化策略 199
7.3.2正则化方法 201
7.4卷积神经网络 203
7.4.1卷积运算 203
7.4.2卷积层 204
7.4.3 CNN实例 205
7.5深度学习的优势 210
7.6深度学习的实现框架 211
第8章 TensorFlow 213
8.1 TensorFlow工具包 213
8.1.1 tf estimator API 214
8.1.2 Pandas速成 214
8.1.3必要的Python知识 216
8.2第一个TensorFlow程序 219
8.2.1装载数据 220
8.2.2探索数据 221
8.2.3训练模型 221
8.2.4评估模型 223
8.2.5优化模型 225
8.2.6合成特征 231
8.2.7离群值处理 234
8.3过拟合处理 237
8.3.1训练集和测试集 238
8.3.2验证集 239
8.3.3过拟合实例 240
8.4特征工程 249
8.4.1数值型数据 249
8.4.2字符串数据和one-hot编码 250
8.4.3枚举数据(分类数据) 250
8.4.4好特征 250
8.4.5数据清洗 251
8.4.6分箱(分桶)技术 252
8.4.7特征工程实例 253
第9章 TensorFlow高级知识 263
9.1特征交叉 263
9.1.1什么是特征交叉 263
9.1.2 FTRL实践 265
9.1.3分桶(分箱)代码实例 268
9.1.4特征交叉代码实例 271
9.2 L2正则化 274
9.3逻辑回归 276
9.4分类 279
9.4.1评价指标——准确率 279
9.4.2评价指标——精确率 281
9.4.3指标——召回率 281
9.4.4评价指标之综合考虑 282
9.4.5 ROC曲线 284
9.4.6预测偏差 285
9.4.7分类代码实例 286
9.5 L1正则化 298
第10章 神经网络 308
10.1什么是神经网络 308
10.1.1隐藏层 308
10.1.2激活函数 309
10.1.3 ReLU 310
10.1.4实例代码 311
10.2训练神经网络 320
10.2.1正向传播算法 320
10.2.2反向传播算法 322
10.2.3标准化特征值 324
10.2.4丢弃正则化 324
10.2.5代码实例 325
10.3多类别神经网络 340
10.3.1一对多方法 340
10.3.2 Softmax 341
10.3.3代码实例 343
10.4嵌套 357
10.4.1协同过滤 358
10.4.2稀疏数据 359
10.4.3获取嵌套 360
10.4.4代码实例 360
第11章 知识图谱 372
11.1什么是知识图谱 372
11.1.1知识图谱的定义 373
11.1.2知识图谱的架构 373
11.1.3开放知识图谱 374
11.1.4知识图谱在行业数据分析中的应用 376
11.2知识图谱构建的关键技术 377
11.2.1知识提取 378
11.2.2语义类抽取 379
11.2.3属性和属性值抽取 381
11.2.4关系抽取 382
11.2.5知识表示 382
11.2.6知识融合 383
11.3知识计算及应用 384
11.4企业知识图谱建设 384
第12章 数据挖掘 387
12.1什么是数据挖掘 387
12.1.1数据挖掘技术产生的背景 387
12.1.2数据挖掘与数据分析的区别 387
12.2数据挖掘技术(方法) 388
12.2.1分类 388
12.2.2聚类 389
12.2.3回归分析 389
12.2.4关联规则 389
12.2.5神经网络方法 390
12.2.6 Web数据挖掘 390
12.2.7特征分析 390
12.2.8偏差分析 391
12.3大数据思维 391
12.3.1信度与效度思维 391
12.3.2分类思维 391
12.3.3漏斗思维 392
12.3.4逻辑树思维 392
12.3.5时间序列思维 393
12.3.6指数化思维 393
12.3.7循环/闭环思维 394
第13章 银行业大数据和人工智能 395
13.1四大行的进展 396
13.1.1建设银行 396
13.1.2工商银行 396
13.1.3农业银行 398
13.1.4中国银行 398
13.2其他银行 399
13.2.1广发银行 399
13.2.2江苏银行 400
13.3金融宏观大数据分析 404
13.4小结 407
13.4.1大数据给银行带来的机遇与挑战 407
13.4.2银行大数据体系建设的思考 409
第14章 医疗大数据和人工智能 412
14.1医疗大数据的特点 412
14.2医疗大数据处理模型 413
14.3医疗大数据的AI应用 416
14.3.1智能辅助诊疗 416
14.3.2影像数据分析与影像智能诊断 416
14.3.3合理用药 416
14.3.4远程监控 417
14.3.5精准医疗 417
14.3.6成本与疗效分析 417
14.3.7绩效管理 417
14.3.8医院控费 417
14.3.9医疗质量分析 418
14.4人工智能的医疗应用场景 418
14.5人工智能要当“医生” 420
14.6医院大数据 421
14.7机器学习在医疗行业中的应用实例分析 422
第15章 公安大数据和人工智能 424
15.1公安大数据的特点 424
15.2建设流程 425
15.3公安大数据管理平台 426
15.3.1公安大数据建模 427
15.3.2公安大数据汇集 428
15.3.3公安大数据服务 428
15.4公安大数据挖掘分析 428
15.5公安大数据AI应用 429
15.6小结 430
第16章 工农业大数据和人工智能 431
16.1中国制造2025 432
16.2工业大数据 433
16.2.1工业大数据面临三大制约因素 433
16.2.2工业大数据应用的四大发展趋势 434
16.2.3发展工业大数据 434
16.3 AI+制造 435
16.4农业大数据 435
16.4.1发展现状 435
16.4.2农业大数据目标 435
16.4.3农业大数据建设任务 436
16.4.4农产品质量安全追溯 437
附录A 国内人工智能企业名单 438
附录B 大数据和人工智能网上资料 441
附录C 本书中采用的人工智能中英文术语 444
附录D 术语列表 446