前言 1
第1章 可能近似正确的软件 5
正确地编写软件 6
编写正确的软件 10
本书计划 16
第2章快速介绍机器学习 18
什么是机器学习 18
有监督学习 18
无监督学习 19
强化学习 20
机器学习能完成什么 20
本书中使用的数学符号 21
结论 22
第3章K最近邻算法 23
如何确定是否想购买一栋房子 23
房子的价格究竟几何 24
愉悦回归 24
什么是邻域 25
K最近邻算法简介 26
K先生最近的邻居 26
距离 27
维度灾难 33
如何选择K 34
给西雅图的房子估价 37
结论 43
第4章朴素贝叶斯分类 44
通过贝叶斯定理来发现欺诈订单 44
条件概率 45
概率符号 45
反向条件概率(又名贝叶斯定理) 47
朴素贝叶斯分类器 47
贝叶斯推理之朴素 48
伪计数 49
垃圾邮件过滤器 50
标记化和上下文 55
结论 67
第5章决策树和随机森林 68
蘑菇的细微差别 69
使用民间定理实现蘑菇分类 70
找到最佳切换点 71
修剪树 74
结论 83
第6章 隐马尔可夫模型 84
使用状态机来跟踪用户行为 84
输出/观测隐含状态 86
使用马尔可夫假设化简 87
隐马尔可夫模型 88
评估:前向-后向算法 89
通过维特比算法解码 93
学习问题 94
词性标注与布朗语库 94
结论 105
第7章支持向量机 106
客户满意度作为语言的函数 107
SVM背后的理论 108
情绪分析器 113
聚合情绪 124
将情绪映射到底线 126
结论 127
第8章神经网络 128
什么是神经网络 129
神经网络史 129
布尔逻辑 129
感知器 130
如何构建前馈神经网络 130
构建神经网络 144
使用神经网络来对语言分类 145
结论 154
第9章聚类 155
无任何偏差的研究数据 155
用户群组 156
测试群集映射 157
K均值聚类 159
最大期望(EM)聚类 161
不可能性定理 163
案例:音乐归类 164
结论 174
第10章模型改进与数据提取 175
辩论俱乐部 175
选择更好的数据 176
最小冗余最大相关性的特征选择 181
特征变换与矩阵分解 183
结论 189
第11章将这些方法融合在一起:结论 191
机器学习算法回顾 191
如何使用这些信息来解决问题 193
下一步做什么 193