第1章 文字和语言vs数字和信息 1
第2章 自然语言处理——从规则到统计 15
第3章 统计语言模型 27
第4章 谈谈分词 41
第5章 隐含马尔可夫模型 50
第6章 信息的度量和作用 60
第7章 贾里尼克和现代语言处理 72
第8章 简单之美——布尔代数和搜索引擎 82
第9章 图论和网络爬虫 89
第10章 PageRank——Google的民主表决式网页排名技术 98
第11章 如何确定网页和查询的相关性 104
第12章 有限状态机和动态规划——地图与本地搜索的核心技术 111
第13章 Google AK-47的设计者——阿米特·辛格博士 121
第14章 余弦定理和新闻的分类 127
第15章 矩阵运算和文本处理中的两个分类问题 136
第16章 信息指纹及其应用 142
第17章 由电视剧《暗算》所想到的——谈谈密码学的数学原理 153
第18章 闪光的不一定是金子——谈谈搜索引擎反作弊问题和搜索结果的权威性问题 162
第19章 谈谈数学模型的重要性 171
第20章 不要把鸡蛋放到一个篮子里——谈谈最大熵模型 177
第21章 拼音输入法的数学原理 186
第22章 自然语言处理的教父马库斯和他的优秀弟子们 197
第23章 布隆过滤器 204
第24章 马尔可夫链的扩展——贝叶斯网络 209
第25章 条件随机场、文法分析及其他 217
第26章 维特比和他的维特比算法 227
第27章 上帝的算法——期望最大化算法 238
第28章 逻辑回归和搜索广告 244
第29章 各个击破算法和Google云计算的基础 249
第30章 Google大脑和人工神经网络 254
第31章 大数据的威力——谈谈数据的重要性 273
附录 计算复杂度 295
第二版后记 299
索引 302