引言 1
1 绪论 9
1.1 决策树算法的概述 11
1.1.1 决策树基本算法 11
1.1.2 ID3算法的起源及概述 14
1.1.3 改进的ID3算法C4.5 及决策树算法的改进 17
1.2 认知物理学的研究 18
1.2.1 认知论的发展和实践意义 19
1.2.2 认知物理学概述 20
1.2.3 借鉴物理学中的原子模型表示概念 22
1.2.4 借鉴物理学中的场描述客体间的相互作用 23
1.2.5 借鉴物理学中层次结构描述知识发现状态空间 25
1.3 粗糙集理论及其决策树生成算法概述 27
1.3.1 基本知识 29
1.3.2 属性约简及其规则获取 33
1.3.3 基于粗糙集的决策树生成算法 34
1.4 结语 36
2 基于认知物理学的决策树优化算法 37
2.1 基于语言场的知识表示方法 39
2.1.1 认知物理学的云理论 40
2.1.2 认知物理学的数据场思想 42
2.1.3 语言场与语言值结构 42
2.1.4 知识表示方法 44
2.2 借鉴信息扩散理论研究数据挖掘的后处理 45
2.2.1 认知物理中的信息扩散理论 45
2.2.2 信息扩散理论用于研究数据挖掘的后处理 46
2.3 借鉴信息扩散理论讨论参数波动变化时规则的取舍 47
2.3.1 参数演化规律的研究 47
2.3.2 参数波动变化时规则的取舍 48
2.4 基于信息补偿量的CID3算法 49
2.4.1 基于信息补偿量的分类器的构造 49
2.4.2 基于信息补偿量的CID3算法 53
2.4.3 CID3算法与ID3算法的分析与比较 54
2.4.4 实例分析 55
2.5 结语 58
3 基于信息熵的属性约简算法的研究 59
3.1 基于粗糙集理论的属性约简算法 62
3.1.1 粗糙集理论的基本思想 62
3.1.2 常见的三种属性约简算法 63
3.2 理论分析与设计 66
3.2.1 基本知识 66
3.2.2 求简化决策表的算法 68
3.2.3 信息熵属性约简的差别矩阵方法 72
3.2.4 基于信息熵的差别矩阵的属性约简算法 75
3.3 结语 77
4 基于粗糙边界的决策树优化算法 79
4.1 传统决策树算法的不足 81
4.1.1 传统决策树剪枝的原因 83
4.1.2 构造多变量决策树的原因 83
4.1.3 基于粗糙集理论的决策树构造算法及其不足 84
4.1.4 基于可变精度的ID3改进算法 86
4.2 基于粗糙边界的决策树生成算法 87
4.2.1 基于粗糙边界的决策树生成算法概述 87
4.2.2 基于粗糙边界的决策树生成算法的不足 89
4.3 改进的基于粗糙边界的决策树优化算法 91
4.3.1 改进算法概述 92
4.3.2 实例分析 93
4.4 结语 96
5 改进基于正区域的决策树优化算法 99
5.1 基于正区域的决策树生成算法 101
5.1.1 基于正区域的决策树生成算法概述 101
5.1.2 基于正区域的决策树生成算法的不足 102
5.2 基于依赖度的决策树生成算法 102
5.2.1 基于依赖度的决策树生成算法概述 102
5.2.2 基于依赖度的决策树生成算法的不足 103
5.3 基于粗糙集的决策树生成算法比较 103
5.3.1 几种生成算法的相关分析 103
5.3.2 等价证明 106
5.3.3 基于正区域的决策树生成算法的详细分析 106
5.4 基于正区域的决策树优化算法 108
5.4.1 改进算法概述 108
5.4.2 实例分析 111
5.5 结语 113
6 基于关联规则的决策树优化算法 115
6.1 关联规则挖掘 117
6.1.1 关联规则挖掘概述 117
6.1.2 关联规则挖掘算法 120
6.1.3 关联规则挖掘研究现状 122
6.1.4 关联规则挖掘与其他领域的关系 123
6.1.5 关联规则挖掘工作的其他方向 124
6.2 基于关联规则的决策树的构造 126
6.2.1 新属性的生成 126
6.2.2 新属性的评价 128
6.2.3 基于关联规则的决策树优化算法 129
6.2.4 与相关分类方法的比较 129
6.2.5 实验验证 130
6.3 结语 131
结论与展望 133
参考文献 138