《集体智慧编程》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:(美)TOBYSEGARAN著;莫映,王开福译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2015
  • ISBN:9787121254437
  • 页数:336 页
图书介绍:无论是有意还是无意,越来越多投身于互联网的人们已经制造出了相当多的数据,这给了我们无数潜在的机会来洞悉用户体验、商业营销、个人偏好和通常所谓的人类行为。本书的目的是要带领你超越以数据库为后端的简单应用系统,并告诉你如何利用自己和他人每天搜集到的信息来编写更为智能的程序。

第1章 集体智慧导言 1

什么是集体智慧 2

什么是机器学习 3

机器学习的局限 4

真实生活中的例子 5

学习型算法的其他用途 5

第2章 提供推荐 7

协作型过滤 7

搜集偏好 8

寻找相近的用户 9

推荐物品 15

匹配商品 17

构建一个基于del.icio.us的链接推荐系统 19

基于物品的过滤 22

使用MovieLens数据集 25

基于用户进行过滤还是基于物品进行过滤 27

练习 28

第3章 发现群组 29

监督学习和无监督学习 29

单词向量 30

分级聚类 33

绘制树状图 38

列聚类 40

K-均值聚类 42

针对偏好的聚类 44

以二维形式展现数据 49

有关聚类的其他事宜 53

练习 53

第4章 搜索与排名 54

搜索引擎的组成 54

一个简单的爬虫程序 56

建立索引 58

查询 63

基于内容的排名 64

利用外部回指链接 69

从点击行为中学习 74

练习 84

第5章 优化 86

组团旅游 87

描述题解 88

成本函数 89

随机搜索 91

爬山法 92

模拟退火算法 95

遗传算法 97

真实的航班搜索 101

涉及偏好的优化 106

网络可视化 110

其他可能的应用场合 115

练习 116

第6章 文档过滤 117

过滤垃圾信息 117

文档和单词 118

对分类器进行训练 119

计算概率 121

朴素分类器 123

费舍尔方法 127

将经过训练的分类器持久化 132

过滤博客订阅源 134

对特征检测的改进 136

使用Akismet 138

替代方法 139

练习 140

第7章 决策树建模 142

预测注册用户 142

引入决策树 144

对树进行训练 145

选择最合适的拆分方案 147

以递归方式构造树 149

决策树的显示 151

对新的观测数据进行分类 153

决策树的剪枝 154

处理缺失数据 156

处理数值型结果 158

对住房价格进行建模 158

对“热度”评价进行建模 161

什么时候使用决策树 164

练习 165

第8章 构建价格模型 167

构造一个样本数据集 167

k-最近邻算法 169

为近邻分配权重 172

交叉验证 176

不同类型的变量 178

对缩放结果进行优化 181

不对称分布 183

使用真实数据——eBayAPI 189

何时使用k-最近邻算法 195

练习 196

第9章 高阶分类:核方法与SVM 197

婚介数据集 197

数据中的难点 199

基本的线性分类 202

分类特征 205

对数据进行缩放处理 209

理解核方法 211

支持向量机 215

使用LIBSVM 217

基于Facebook的匹配 219

练习 225

第10章 寻找独立特征 226

搜集一组新闻 227

先前的方法 231

非负矩阵因式分解 232

结果呈现 240

利用股票市场的数据 243

练习 248

第11章 智能进化 250

什么是遗传编程 250

将程序以树形方式表示 253

构造初始种群 257

测试题解 259

对程序进行变异 260

交叉 263

构筑环境 265

一个简单的游戏 268

更多可能性 273

练习 276

第12章 算法总结 277

贝叶斯分类器 277

决策树分类器 281

神经网络 285

支持向量机 289

k-最近邻 293

聚类 296

多维缩放 300

非负矩阵因式分解 302

优化 304

附录A:第三方函数库 309

附录B:数学公式 316

索引 323