Python机器学习基础教程PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:(德)安德里亚斯·穆勒著;张亮译
- 出 版 社:北京:人民邮电出版社
- 出版年份:2018
- ISBN:9787115475619
- 页数:285 页
第1章 引言 1
1.1为何选择机器学习 1
1.1.1机器学习能够解决的问题 2
1.1.2熟悉任务和数据 4
1.2为何选择Python 4
1.3 scikit-learn 4
1.4必要的库和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2与Python 3的对比 9
1.6本书用到的版本 10
1.7第一个应用:鸢尾花分类 11
1.7.1初识数据 12
1.7.2衡量模型是否成功:训练数据与测试数据 14
1.7.3要事第一:观察数据 15
1.7.4构建第一个模型:k近邻算法 16
1.7.5做出预测 17
1.7.6评估模型 18
1.8小结与展望 19
第2章 监督学习 21
2.1分类与回归 21
2.2泛化、过拟合与欠拟合 22
2.3监督学习算法 24
2.3.1一些样本数据集 25
2.3.2 k近邻 28
2.3.3线性模型 35
2.3.4朴素贝叶斯分类器 53
2.3.5决策树 54
2.3.6决策树集成 64
2.3.7核支持向量机 71
2.3.8神经网络(深度学习) 80
2.4分类器的不确定度估计 91
2.4.1决策函数 91
2.4.2预测概率 94
2.4.3多分类问题的不确定度 96
2.5小结与展望 98
第3章 无监督学习与预处理 100
3.1无监督学习的类型 100
3.2无监督学习的挑战 101
3.3预处理与缩放 101
3.3.1不同类型的预处理 102
3.3.2应用数据变换 102
3.3.3对训练数据和测试数据进行相同的缩放 104
3.3.4预处理对监督学习的作用 106
3.4降维、特征提取与流形学习 107
3.4.1主成分分析 107
3.4.2非负矩阵分解 120
3.4.3用t-SNE进行流形学习 126
3.5聚类 130
3.5.1 k均值聚类 130
3.5.2凝聚聚类 140
3.5.3 DBSCAN 143
3.5.4聚类算法的对比与评估 147
3.5.5聚类方法小结 159
3.6小结与展望 159
第4章 数据表示与特征工程 161
4.1分类变量 161
4.1.1 One-Hot编码(虚拟变量) 162
4.1.2数字可以编码分类变量 166
4.2分箱、离散化、线性模型与树 168
4.3交互特征与多项式特征 171
4.4单变量非线性变换 178
4.5自动化特征选择 181
4.5.1单变量统计 181
4.5.2基于模型的特征选择 183
4.5.3迭代特征选择 184
4.6利用专家知识 185
4.7小结与展望 192
第5章 模型评估与改进 193
5.1交叉验证 194
5.1.1 scikit-learn中的交叉验证 194
5.1.2交叉验证的优点 195
5.1.3分层K折交叉验证和其他策略 196
5.2网格搜索 200
5.2.1简单网格搜索 201
5.2.2参数过拟合的风险与验证集 202
5.2.3带交叉验证的网格搜索 203
5.3评估指标与评分 213
5.3.1牢记最终目标 213
5.3.2二分类指标 214
5.3.3多分类指标 230
5.3.4回归指标 232
5.3.5在模型选择中使用评估指标 232
5.4小结与展望 234
第6章 算法链与管道 236
6.1用预处理进行参数选择 237
6.2构建管道 238
6.3在网格搜索中使用管道 239
6.4通用的管道接口 242
6.4.1用make_pipeline方便地创建管道 243
6.4.2访问步骤属性 244
6.4.3访问网格搜索管道中的属性 244
6.5网格搜索预处理步骤与模型参数 246
6.6网格搜索选择使用哪个模型 248
6.7小结与展望 249
第7章 处理文本数据 250
7.1用字符串表示的数据类型 250
7.2示例应用:电影评论的情感分析 252
7.3将文本数据表示为词袋 254
7.3.1将词袋应用于玩具数据集 255
7.3.2将词袋应用于电影评论 256
7.4停用词 259
7.5用tf-idf缩放数据 260
7.6研究模型系数 263
7.7多个单词的词袋(n元分词) 263
7.8高级分词、词干提取与词形还原 267
7.9主题建模与文档聚类 270
7.10小结与展望 277
第8章 全书总结 278
8.1处理机器学习问题 278
8.2从原型到生产 279
8.3 测试生产系统 280
8.4构建你自己的估计器 280
8.5下一步怎么走 281
8.5.1理论 281
8.5.2其他机器学习框架和包 281
8.5.3排序、推荐系统与其他学习类型 282
8.5.4概率建模、推断与概率编程 282
8.5.5神经网络 283
8.5.6推广到更大的数据集 283
8.5.7磨练你的技术 284
8.6总结 284
关于作者 285
关于封面 285
- 《市政工程基础》杨岚编著 2009
- 《零基础学会素描》王金著 2019
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《生物质甘油共气化制氢基础研究》赵丽霞 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《激光加工实训技能指导理实一体化教程 下》王秀军,徐永红主编;刘波,刘克生副主编 2017
- 《AutoCAD 2019 循序渐进教程》雷焕平,吴昌松,陈兴奎主编 2019
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《花时间 我的第一堂花艺课 插花基础技法篇》(日)花时间编辑部编;陈洁责编;冯莹莹译 2020
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《人民院士》吴娜著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《中国人民的心》杨朔著;夕琳编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中华人民共和国成立70周年优秀文学作品精选 短篇小说卷 上 全2册》贺邵俊主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《中华人民共和国成立70周年优秀文学作品精选 中篇小说卷 下 全3册》洪治纲主编 2019