《大数据经典算法简介》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:胡文生
  • 出 版 社:成都:电子科技大学出版社
  • 出版年份:2017
  • ISBN:9787564748159
  • 页数:141 页
图书介绍:本书主要介绍了大数据分析中常见的算法,主要包括回归分析,方差分析,聚类分析,主成分分析,因子分析,判别分析,遗传算法,决策树算法,关联规则算法,人工神经网络十大经典方法。本书可以作为大数据方向的科普读物,更可以当做数据仓库实际应用的指导书。

第一章 回归分析 1

1.1 一元线性回归分析 1

1.1.1 一元线性回归模型 1

1.1.2 参数估计 2

1.1.3 案例分析 3

1.2 多元线性回归分析 6

1.2.1 多元线性回归模型 6

1.2.2 参数估计 7

1.2.3 案例分析 8

1.3 逐步回归分析 11

1.3.1 最优回归方程的选择 11

1.3.2 最优回归方程的计算 13

1.3.3 案例分析 14

1.4 回归诊断 22

1.4.1 残差是否服从正态分布 22

1.4.2 显著性检验 24

1.4.3 多重共线性 25

1.5 非线性回归分析 26

1.5.1 多项式回归分析模型 26

1.5.2 多项式回归分析案例 27

1.5.3 正态回归分析模型 29

1.5.4 非线性回归族 29

第二章 方差分析 31

2.1 单因素方差分析 31

2.1.1 单因素方差分析的统计模型 31

2.1.2 方差分析的检验方法 35

2.1.3 案例分析 37

2.2 双因素方差分析 39

2.2.1 双因素方差分析的统计模型 39

2.2.2 双因素方差分析的检验方法 41

2.2.3 案例分析 45

第三章 聚类分析 48

3.1 聚类分析方法简介 48

3.2 距离与相似系数 48

3.2.1 数据的变换 48

3.2.2 样品间的距离 50

3.2.3 变量间的相似系数 51

3.3 系统聚类法 51

3.3.1 系统聚类法的基本步骤 51

3.3.2 系统聚类分析方法 51

3.4 案例分析 54

3.4.1 案例分析(一) 54

3.4.1 案例分析(二) 55

第四章 主成分分析 59

4.1 主成分分析的数学模型 59

4.1.1 主成分分析的数学模型 59

4.1.2 主成分分析的几何解释 60

4.2 主成分分析的步骤 62

4.2.1 主成分的导出 62

4.2.2 主成分分析的计算步骤 64

4.3 案例分析 65

第五章 因子分析 68

5.1 因子模型 68

5.1.1 正交因子模型 68

5.1.2 正交因子模型中各个量的统计意义 69

5.2 因子载荷主成分估计方法 70

5.3 因子得分 71

5.4 案例分析 72

第六章 判别分析 85

6.1 距离判别法 85

6.1.1 两总体的距离判别 85

6.1.2 多总体的距离判别 88

6.2 贝叶斯判别法 89

6.2.1 基本知识 89

6.2.2 正态总体的贝叶斯判别法 90

第七章 遗传算法简介 93

7.1 遗传算法的历程 93

7.2 遗传算法的应用 94

7.3 遗传算法的基本工作原理 95

7.4 遗传算法的具体实现过程 97

第八章 决策树算法介绍 108

8.1 决策树的基本概念 108

8.2 决策树的基本算法 109

8.3 常见的几种决策树算法 110

8.3.1 CL5算法 110

8.3.2 ID3算法 111

8.3.3 C4.5算法 112

8.3.4 CART算法 113

8.4 决策树算法的具体应用 114

第九章 关联规则算法简介 120

9.1 关联规则的基本概念 120

9.2 关联规则的算法描述 121

9.2.1 Apriori算法 121

9.2.2 FP算法 122

9.3 关联规则的算法典型应用 124

第十章 人工神经网络简介 127

10.1 人工神经网络概述 127

10.2 人工神经网络的组织结构 129

10.3 常见的几种人工神经网络介绍 131

10.3.1 BP神经网络 131

10.3.2 RBF神经网络 134

10.3.3 自组织特征映射(SOM)神经网络 136

参考文献 139

统计学方面的参考文献 139

数据挖掘方面的参考文献 140