《机器学习 实用案例解析》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)康威著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2013
  • ISBN:9787111417316
  • 页数:288 页
图书介绍:本书比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还讨论了一些有生命力的新理论、新方法。全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。本书讨论的案例从分类讲到回归,然后讨论了聚类、降维、最优化问题等。这些案例包括分类:垃圾邮件识别,排序:智能收件箱,回归模型:预测网页访问量,正则化:文本回归,最优化:密码破解,无监督学习:构建股票市场指数,空间相似度:用投票记录对美国参议员聚类,推荐系统:给用户推荐R语言包,社交网络分析:在Twitter上感兴趣的人,模型比较:给你的问题找到最佳算法。各章对原理的叙述力求概念清晰、表达准确,突出理论联系实际,富有启发性,易于理解。在探索这些案例的过程中用到的基本工具就是R统计编程语言。R语言非常适合用于机器学习的案例研究,因为它是一种用于数据分析的高水平、功能性脚本语言。 本书可作为高等院校计算机、自动化、电子和通信等专业研究生和高年级本科生的参考书。本书内容对从事人工智能、机器学习、数据挖掘、模式识别等相关领域研究的科技人员具有较好的参考价值。

前言 1

第1章使用R语言 9

R与机器学习 10

第2章数据分析 36

分析与验证 36

什么是数据 37

推断数据的类型 40

推断数据的含义 42

数值摘要表 43

均值、中位数、众数 44

分位数 46

标准差和方差 47

可视化分析数据 49

列相关的可视化 68

第3章分类:垃圾过滤 77

非此即彼:二分类 77

漫谈条件概率 81

试写第一个贝叶斯垃圾分类器 82

第4章排序:智能收件箱 97

次序未知时该如何排序 97

按优先级给邮件排序 98

实现一个智能收件箱 102

第5章回归模型:预测网页访问量 128

回归模型简介 128

预测网页流量 142

定义相关性 152

第6章正则化:文本回归 155

数据列之间的非线性关系:超越直线 155

避免过拟合的方法 164

文本回归 174

第7章优化:密码破译 182

优化简介 182

岭回归 188

密码破译优化问题 193

第8章PCA:构建股票市场指数 203

无监督学习 203

主成分分析 204

第9章MDS:可视化地研究参议员相似性 212

基于相似性聚类 212

如何对美国参议员做聚类 219

第10章kNN:推荐系统 229

k近邻算法 229

R语言程序包安装数据 235

第11章分析社交图谱 239

社交网络分析 239

用黑客的方法研究Twitter的社交关系图数据 244

分析Twitter社交网络 252

第12章模型比较 270

SVM:支持向量机 270

算法比较 280

参考文献 287