《数据挖掘算法及其工程应用》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:章兢,张小刚等编著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2006
  • ISBN:7111191269
  • 页数:194 页
图书介绍:本书介绍了各类数据挖掘算法为核心。

第1章 数据挖掘综述 1

1.1 数据挖掘的概念和定义 1

1.2 数据挖掘的历史及发展 2

1.3 数据挖掘研究内容及功能 2

1.4 数据挖掘常用技术及工具 4

1.5 数据挖掘应用热点 6

参考文献 10

第2章 数理统计方法 11

2.1 数据挖掘与数理统计的关系 11

2.2 数理统计与数据库技术的结合 12

2.3 回归分析的基本概念 13

2.4 线性回归方程 14

2.5 线性相关的显著性检验 15

2.5.1 线性回归的方差分析 16

2.5.2 相关系数的显著性检验 17

2.6 非线性回归分析 19

2.6.1 化非线性回归为线性回归 19

2.6.2 多项式回归 19

2.7 多元线性回归分析 19

2.7.1 多元线性回归方程 19

2.7.2 多元线性回归的方差分析 21

2.8 一般情况下的回归分析 23

2.8.1 一般情况下的回归方程 23

2.8.2 一般情况下的参数估计 24

2.9 逐步回归分析的软件设计 24

2.10 锻模设计准则的制定 25

2.10.1 研究的内容 25

2.10.2 资料收集与数据处理 25

2.10.3 飞边尺寸设计准则的制定 27

2.10.4 飞边金属消耗设计准则的制定 30

2.11 小结 33

参考文献 33

第3章 决策树学习算法 34

3.1 决策树概述 34

3.1.1 决策树构造与分类 35

3.1.2 决策树的应用 37

3.1.3 决策树发展趋势 38

3.2 ID3及其系列决策树算法 39

3.2.1 ID3算法 39

3.2.2 ID4算法 43

3.2.3 ID5R算法 44

3.3 C4.5决策树学习算法 45

3.3.1 C4.5功能改进 45

3.3.2 C4.5系统应用 48

3.3.3 C4.5的不足 56

3.4 其他决策树分类算法 56

3.4.1 CART算法 56

3.4.2 CHAID算法 62

3.4.3 SLIQ算法 62

3.4.4 SPRINT算法 69

3.4.5 PUBLIC算法 75

3.5 小结 75

参考文献 76

第4章 基于分层搜索的关联挖掘算法 77

4.1 关联规则挖掘研究综述 77

4.1.1 基本关联规则挖掘算法 77

4.1.2 复杂类型关联规则挖掘算法 78

4.1.3 针对关联规则评价的研究 78

4.1.4 并行挖掘算法 78

4.1.5 增量挖掘算法 79

4.2 基本问题描述 79

4.2.1 频繁数据项集 79

4.2.2 关联规则 80

4.3 关联挖掘基本框架 82

4.3.1 产生关联规则的两个阶段 82

4.3.2 关联规则的生成算法 83

4.4 分层搜索算法分析及仿真研究 85

4.4.1 AIS算法简介 85

4.4.2 Apriori算法分析与仿真 87

4.4.3 DHP算法分析与仿真 92

4.5 算法复杂性的度量 98

4.5.1 算法复杂性概念 98

4.5.2 分层搜索算法复杂性分析模型 100

4.5.3 算法的时间复杂性的讨论 101

4.6 小结 104

参考文献 104

第5章 软计算方法 107

5.1 概述 107

5.1.1 软计算的基本概念 107

5.1.2 数据挖掘中的软计算方法 107

5.2 粗糙集 109

5.2.1 概述 109

5.2.2 基于粗糙集的知识表达方法 109

5.2.3 集合近似及其性质 110

5.2.4 粗糙集的约简与核 111

5.2.5 基于粗糙集的数据挖掘 112

5.2.6 应用实例 114

5.3 神经网络 115

5.3.1 神经网络基本概念 115

5.3.2 BP神经网络 117

5.3.3 神经网络在数据挖掘中的应用 118

5.3.4 一个煤灰结渣预测实例 120

5.4 基于遗传算法的数据挖掘技术 121

5.4.1 遗传算法的一般结构 121

5.4.2 遗传算法的组成要素 122

5.4.3 基于遗传算法的关联规则挖掘方法 124

5.4.4 基于遗传算法的聚类算法 128

5.5 人工免疫算法 130

5.5.1 生物免疫系统的组成 131

5.5.2 抗原与抗体 132

5.5.3 人工免疫系统 133

5.5.4 GMST问题计算实例 136

5.6 小结 138

参考文献 139

第6章 支持向量机 141

6.1 统计学习问题 141

6.1.1 经验风险最小化原则 141

6.1.2 函数集的VC维 142

6.2 学习过程的一致性 142

6.2.1 学习一致性的经典定义 142

6.2.2 统计学习理论的关键定理 143

6.2.3 VC熵 143

6.2.4 统计学习理论的三个里程碑 144

6.3 结构风险最小化原则 144

6.3.1 SRM原则的数学描述 144

6.3.2 SRM原则的图解说明 145

6.4 最优化理论 146

6.4.1 基本概念 146

6.4.2 拉格朗日理论 147

6.4.3 Karush-Kuhn-Tucker条件 148

6.5 支持向量机 149

6.5.1 线性支持向量机 149

6.5.2 非线性支持向量机 152

6.5.3 ε不敏感损失函数 153

6.5.4 构造用于回归估计的支持向量机 154

6.6 核函数 155

6.6.1 多项式核函数 155

6.6.2 径向基核函数 155

6.6.3 多层感知器 156

6.6.4 动态核函数 156

6.7 若干扩展支持向量机算法 157

6.7.1 C-SVM的二次松弛变量算法 157

6.7.2 C-SVM的k次方算法 158

6.7.3 BSVM算法 158

6.7.4 v-SVM算法 158

6.7.5 One-class SVM算法 159

6.7.6 WSVM(Weighted SVM)算法 160

6.7.7 FSVM算法 160

6.7.8 LS-SVM算法 160

6.8 仿真实例 162

6.9 小结 167

参考文献 168

第7章 数据挖掘算法的工程应用 169

7.1 关联挖掘在烧成窑专家控制系统中的应用 169

7.1.1 引言 169

7.1.2 一种基于模糊时间序列挖掘的专家控制规则提取方法 172

7.1.3 基于数据挖掘的模糊控制规则提取 176

7.1.4 基于信息融合和数据挖掘技术的专家控制器设计 178

7.1.5 氧化铝烧成窑专家控制系统的实施及运行效果 180

7.1.6 小结 182

7.2 基于支持向量机分类器的水轮机调速故障诊断 182

7.2.1 引言 182

7.2.2 支持向量机(C-SVM) 183

7.2.3 模糊支持向量机多级二叉树分类器 184

7.2.4 水轮机调速系统故障诊断实验 186

7.2.5 小结 187

7.3 免疫克隆算法在物流配送车辆路径优化问题中的应用 188

7.3.1 物流配送车辆路径优化问题的描述和数学模型 188

7.3.2 抗体编码 189

7.3.3 亲和力函数 190

7.3.4 仿真计算 190

7.4 小结 192

参考文献 192