实用机器学习PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(美)亨里克·布林克(Henrik Brink),(美)约瑟夫W.理查兹(Joseph W.Richards),(美)马克·弗特罗夫(Mark Fetherolf)著
- 出 版 社:北京:机械工业出版社
- 出版年份:2017
- ISBN:9787111569220
- 页数:207 页
第1部分 机器学习工作流程 3
第1章 什么是机器学习 3
1.1 理解机器学习 3
1.2 使用数据进行决策 6
1.2.1 传统方法 6
1.2.2 机器学习方法 9
1.2.3 机器学习的五大优势 12
1.2.4 面临的挑战 12
1.3 跟踪机器学习流程:从数据到部署 13
1.3.1 数据集合和预处理 13
1.3.2 数据构建模型 14
1.3.3 模型性能评估 16
1.3.4 模型性能优化 16
1.4 提高模型性能的高级技巧 17
1.4.1 数据预处理和特征工程 17
1.4.2 用在线算法持续改进模型 18
1.4.3 具有数据量和速度的规模化模型 18
1.5 总结 19
1.6 本章术语 19
第2章 实用数据处理 20
2.1 起步:数据收集 21
2.1.1 应包含哪些特征 22
2.1.2 如何获得目标变量的真实值 23
2.1.3 需要多少训练数据 24
2.1.4 训练集是否有足够的代表性 26
2.2 数据预处理 26
2.2.1 分类特征 27
2.2.2 缺失数据处理 28
2.2.3 简单特征工程 31
2.2.4 数据规范化 32
2.3 数据可视化 33
2.3.1 马赛克图 34
2.3.2 盒图 35
2.3.3 密度图 37
2.3.4 散点图 38
2.4 总结 38
2.5 本章术语 39
第3章 建模和预测 40
3.1 基础机器学习建模 40
3.1.1 寻找输入和目标间的关系 41
3.1.2 寻求好模型的目的 42
3.1.3 建模方法类型 43
3.1.4 有监督和无监督学习 44
3.2 分类:把数据预测到桶中 45
3.2.1 构建分类器并预测 46
3.2.2 非线性数据与复杂分类 49
3.2.3 多类别分类 51
3.3 回归:预测数值型数据 52
3.3.1 构建回归器并预测 54
3.3.2 对复杂的非线性数据进行回归 56
3.4 总结 57
3.5 本章术语 58
第4章 模型评估与优化 59
4.1 模型泛化:评估新数据的预测准确性 60
4.1.1 问题:过度拟合与乐观模型 60
4.1.2 解决方案:交叉验证 62
4.1.3 交叉验证的注意事项 65
4.2 分类模型评估 66
4.2.1 分类精度和混淆矩阵 68
4.2.2 准确度权衡与ROC曲线 68
4.2.3 多类别分类 71
4.3 回归模型评估 74
4.3.1 使用简单回归性能指标 75
4.3.2 检验残差 76
4.4 参数调整优化模型 77
4.4.1 机器学习算法和它们的调整参数 77
4.4.2 网格搜索 78
4.5 总结 81
4.6 本章术语 82
第5章 基础特征工程 83
5.1 动机:为什么特征工程很有用 83
5.1.1 什么是特征工程 83
5.1.2 使用特征工程的5个原因 84
5.1.3 特征工程与领域专业知识 85
5.2 基本特征工程过程 86
5.2.1 实例:事件推荐 86
5.2.2 处理日期和时间特征 87
5.2.3 处理简单文本特征 89
5.3 特征选择 91
5.3.1 前向选择和反向消除 93
5.3.2 数据探索的特征选择 94
5.3.3 实用特征选择实例 95
5.4 总结 98
5.5 本章术语 98
第2部分 实际应用 103
第6章 案例:NYC出租车数据 103
6.1 数据:NYC出租车旅程和收费信息 103
6.1.1 数据可视化 104
6.1.2 定义问题并准备数据 107
6.2 建模 109
6.2.1 基本线性模型 109
6.2.2 非线性分类器 111
6.2.3 包含分类特征 112
6.2.4 包含日期-时间特征 113
6.2.5 模型的启示 114
6.3 总结 115
6.4 本章术语 116
第7章 高级特征工程 117
7.1 高级文本特征 117
7.1.1 词袋模型 117
7.1.2 主题建模 119
7.1.3 内容拓展 122
7.2 图像特征 123
7.2.1 简单图像特征 123
7.2.2 提取物体和形状 125
7.3 时间序列特征 128
7.3.1 时间序列数据的类型 128
7.3.2 时间序列数据的预测 130
7.3.3 经典时间序列特征 131
7.3.4 事件流的特征工程 135
7.4 总结 135
7.5 本章术语 136
第8章 NLP高级案例:电影评论情感预测 138
8.1 研究数据和应用场景 138
8.1.1 数据集初探 139
8.1.2 检查数据 139
8.1.3 应用场景有哪些 140
8.2 提取基本NLP特征并构建初始模型 142
8.2.1 词袋特征 143
8.2.2 用朴素贝叶斯算法构建模型 144
8.2.3 tf-idf算法规范词袋特征 147
8.2.4 优化模型参数 148
8.3 高级算法和模型部署的考虑 152
8.3.1 word2vec特征 152
8.3.2 随机森林模型 154
8.4 总结 156
8.5 本章术语 156
第9章 扩展机器学习流程 157
9.1 扩展前需考虑的问题 157
9.1.1 识别关键点 158
9.1.2 选取训练数据子样本代替扩展性 159
9.1.3 可扩展的数据管理系统 160
9.2 机器学习建模流程扩展 162
9.3 预测扩展 165
9.3.1 预测容量扩展 166
9.3.2 预测速度扩展 166
9.4 总结 168
9.5 本章术语 169
第10章 案例:数字显示广告 170
10.1 显示广告 170
10.2 数字广告数据 171
10.3 特征工程和建模策略 172
10.4 数据大小和形状 173
10.5 奇异值分解 175
10.6 资源估计和优化 177
10.7 建模 178
10.8 K近邻算法 178
10.9 随机森林算法 180
10.10 其他实用考虑 181
10.11 总结 182
10.12 本章术语 183
10.13 摘要和结论 183
附录 常用机器学习算法 185
名词术语中英文对照 187
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《深度学习与飞桨PaddlePaddle Fluid实战》于祥 2019
- 《全国普通高等中医药院校药学类专业“十三五”规划教材 第二轮规划教材 有机化学学习指导 第2版》赵骏 2018
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《全国职业院校工业机器人技术专业规划教材 工业机器人现场编程》(中国)项万明 2019
- 《基于核心素养的有效学习与学业评价策略 初中政治》李亚莉主编 2018
- 《人体寄生虫学学习指导与习题集 供基础 临床 预防 口腔医学类专业用 第2版》诸欣平,苏川 2018
- 《大学信息技术基础学习与实验指导教程》安世虎主编 2019
- 《牛津中国心理学手册 上 认知与学习》(美)迈克尔·哈里斯·邦德主编;赵俊华,张春妹译 2019
- 《基于核心素养的有效学习与学业评价策略 初中英语》高婉妮主编 2018
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019