《机器学习原理及应用》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:陈海虹
  • 出 版 社:成都:电子科技大学出版社
  • 出版年份:2017
  • ISBN:9787564748166
  • 页数:364 页
图书介绍:本书为配合大数据产业发展需要,主要介绍了什么是机器学习,机器学习的发展历程及研究现状、分类、应用前景,机器学习的基础理论,人工神经网络,主流的机器学习模型,机器学习方法,大数据时代的数据挖掘与机器学习,机器学习实用案例解析等内容。全书充分反映了机器学习的主要内容体系,结合最新的科技发展成果,注重理论的实际应用。本书可作为机械、电子、自动化等专业大学生的选修课程用书或参考书,也可作为从事大数据、人工智能研究和开发的科学工作者和工程技术人员的参考书,并且适合广大人工智能爱好者阅读。

第1章 绪论 1

1.1 什么是机器学习 1

1.2 机器学习的发展历程及研究现状 2

1.2.1 机器学习的发展历程 2

1.2.2 机器学习的研究现状 3

1.3 机器学习的分类 10

1.3.1 基于学习策略的分类 11

1.3.2 基于学习方法的分类 11

1.3.3 基于学习方式的分类 11

1.3.4 基于数据形式的分类 12

1.3.5 基于学习目标的分类 12

1.4 机器学习的应用前景 12

1.4.1 数据分析与挖掘 12

1.4.2 模式识别 13

1.4.3 在生物信息学上的应用 14

1.4.4 更广阔的领域 15

第2章 机器学习基础理论 17

2.1 引言 17

2.2 线性建模 18

2.2.1 定义模型 18

2.2.2 模型假设 18

2.2.3 理想模型的定义 19

2.2.4 最小二乘解 21

2.3 向量和矩阵 23

2.4 线性模型的非线性响应 25

2.5 泛化与过拟合 26

2.5.1 验证数据 26

2.5.2 交叉验证 27

2.5.3 K折交叉验证的计算缩放 27

2.6 噪声 28

2.7 随机变量和概率 29

2.7.1 随机变量 30

2.7.2 概率和概率分布 31

2.7.3 概率的加法 32

2.7.4 条件概率 33

2.7.5 联合概率 34

2.7.6 边缘化 35

2.7.7 贝叶斯规则 37

2.7.8 期望值 38

2.8 常见的离散分布 40

2.8.1 伯努利分布 40

2.8.2 二项分布 40

2.8.3 多项分布 41

2.9 连续型随机变量—概率密度函数 41

2.10 常见的连续概率密度函数 43

2.10.1 均匀密度函数 43

2.10.2 β密度函数 44

2.10.3 斯密度函数 45

2.10.4 多元高斯 46

2.11 似然估计 48

2.11.1 数据集的似然值 48

2.11.2 最大似然 49

2.11.3 最大似然解的特点 51

2.11.4 最大似然法适用于复杂模型 53

2.12 噪声对参数估计的影响 54

2.12.1 参数估计的影响 54

2.12.2 参数估计的不确定性 55

2.13 预测值的变异性 56

2.13.1 预测值变异性示例 57

2.13.2 估计值的期望值 59

2.14 评估假设 61

2.14.1 动机 61

2.14.2 估计假设精度 62

2.14.3 采样理论基础 65

2.14.4 推导置信区间的一般方法 72

2.14.5 两个假设错误率间的差异 74

2.14.6 学习算法比较 76

第3章 人工神经网络 81

3.1 概述 82

3.1.1 什么是人工神经网络 82

3.1.2 神经网络的基本特点与功能 83

3.2 神经网络的应用领域介绍 85

3.3 生物神经网络基础 88

3.3.1 生物神经元的结构 89

3.3.2 生物神经元的信息处理机理 90

3.4 人工神经网络模型及其性能 92

3.4.1 人工神经元模型 92

3.4.2 人工神经网络模型 97

3.5 神经网络学习 105

3.5.1 Hebb学习规则 107

3.5.2 离散感知器学习规则 108

3.5.3 连续感知器学习规则 109

3.5.4 最小均方学习规则 110

3.5.5 相关学习规则 111

3.5.6 胜者为王学习规则 111

3.5.7 外星学习规则 111

3.6 神经网络系统设计与软硬件实现 112

3.6.1 神经网络系统总体设计 113

3.6.2 神经网络的软件实现 119

3.6.3 神经网络的高级开发环境 120

3.6.4 神经网络的硬件实现 127

第4章 主流的机器学习模型 140

4.1 树模型 140

4.1.1 决策树 143

4.1.2 作为减小方差的树学习方法 144

4.2 概率模型 149

4.2.1 正态分布及其几何意义 150

4.2.2 属性数据的概率模型 151

4.2.3 通过优化条件似然实现鉴别式学习 153

4.3 支持向量机 153

4.3.1 SVM的基本思想 154

4.3.2 非线性支持向量机 159

4.3.3 支持向量机的学习算法 161

4.3.4 支持向量机的应用研究现状 163

第5章 机器学习方法 167

5.1 机器学习的历史 167

5.2 监督学习 168

5.2.1 未标记样本 168

5.2.2 生成式方法 170

5.2.3 阅读材料 172

5.3 集成学习 173

5.3.1 个体与集成 173

5.3.2 Bagging与随机森林 175

5.4 规则学习 177

5.4.1 基本概念 177

5.4.2 序贯覆盖 179

5.4.3 剪枝优化 181

5.4.4 阅读材料 183

5.5 基于支持向量机的强化学习 184

5.5.1 半监督SVM 184

5.5.2 核学习 185

5.5.3 SVM 186

5.6 基于SVM的强化学习 188

5.6.1 基于SVM的Q学习结构 188

5.6.2 基于滚动时间窗机制的SVM 189

5.6.3 算法步骤 191

5.6.4 仿真研究 191

5.7 流形学习与图谱学习 192

5.7.1 流形学习的基本概念 193

5.7.2 流形学习的降维方法分类 193

5.7.3 构建关系矩阵的方法 194

5.8 李群机器学习 200

5.8.1 李群机器学习的基本概念 200

5.8.2 李群机器学习的泛化能力假设公理该公理 201

5.8.3 李群机器学习的学习模型 202

第6章 大数据时代的数据挖掘与机器学习 205

6.1 概论 205

6.2 机器学习与数据挖掘 206

6.2.1 无处不在的机器学习与数据挖掘 207

6.2.2 机器学习与数据挖掘大发展历程 209

6.3 数据挖掘工具 214

6.3.1 Weka 214

6.3.2 Java和JVM语音 214

6.3.3 R语言 216

6.3.4 Python 217

6.3.5 SAS 218

6.3.6 数据挖掘工具Weka和R的比较分析 219

6.4 基于数据挖掘和机器学习的木马检测系统 221

6.4.1 网页木马概述 222

6.4.2 网页木马检测系统需求分析 224

6.4.3 网页木马检测系统设计 226

6.4.4 木马检测系统设计小结 242

6.5 机器学习技术在数据挖掘中的商业应用研究 243

6.5.1 技术制造商案例研究 243

6.5.2 在线品牌管理的案例研究 245

6.5.3 移动应用推荐的案例研究 247

第7章 机器学习实用案例解析 250

7.1 数据分析 250

7.1.1 分析与验证 250

7.1.2 什么是数据 251

7.1.3 数据推断的类型 253

7.1.4 推断数据的含义 254

7.1.5 数值摘要表 255

7.1.6 均值、中位数、众数 255

7.1.7 分位数 257

7.1.8 标准差和方差 258

7.2 智能收件箱 260

7.2.1 次序未知时该如何排序 260

7.2.2 按优先级给邮件排序 262

7.2.3 文本分析——经典的垃圾邮件过滤系统 262

7.3 搜狗输入法案例解析 265

7.3.1 语义搜索引擎的底层技术和原理 265

7.3.2 顺序分析——搜狗输入法的智能纠错系统 267

7.3.3 搜狗输入法的王牌词库和智能算法 267

7.3.4 频繁树模式和顺序分析算法 268

7.4 基于机器学习的行人检测 270

7.4.1 基于机器学习的行人检测综述 270

7.4.2 基于整体特征的检测方法 271

7.4.3 基于boostedcascade的物体检测 276

7.4.4 基于boostedcascade的行人检测 281

7.5 机器学习在运动合成与分析中的应用 286

7.5.1 运动合成中的回归与函数逼近 286

7.5.2 降维在运动合成中的应用 288

7.5.3 分类在运动合成中的应用 290

7.5.4 聚类在运动合成中的应用 291

7.5.5 决策在运动合成中的应用 292

参考文献 294