第1章 概论 1
1.1 粒计算 1
1.1.1 概述 1
1.1.2 粒计算内涵 2
1.2 粗糙集 3
1.2.1 概述 3
1.2.2 基本概念 4
1.3 知识约简 6
1.3.1 基于正区域的知识约简算法 6
1.3.2 基于差别矩阵的知识约简算法 7
1.3.3 基于信息熵的知识约简算法 10
1.3.4 普适知识约简算法 11
1.3.5 三种经典知识约简算法之间的关系 12
1.3.6 影响知识约简算法效率的关键因素 14
1.4 知识获取 17
1.4.1 知识获取概述 17
1.4.2 知识获取的主要途径 18
1.4.3 知识获取的常用技术 18
1.5 大数据技术 19
1.5.1 概述 19
1.5.2 HDFS 20
1.5.3 MapReduce 21
1.6 小结 24
第2章 高效的Pawlak粗糙集模型知识约简 25
2.1 引言 25
2.2 基于计数排序的知识约简算法中若干关键子算法 26
2.2.1 基于计数排序的等价类计算算法 26
2.2.2 基于计数排序的简化决策表获取算法 27
2.2.3 基于计数排序的正区域计算算法 28
2.2.4 基于计数排序的核属性计算方法 29
2.3 高效的知识约简算法框架模型 30
2.3.1 基于正区域的知识约简算法 31
2.3.2 基于差别矩阵的知识约简算法 32
2.3.3 基于信息熵的知识约简算法 36
2.3.4 高效的知识约简算法框架模型 37
2.4 实验分析 38
2.4.1 效率评价 38
2.4.2 分类精度比较 42
2.4.3 CHybridⅠ/Ⅱ算法与其他算法比较 43
2.5 应用实例 44
2.5.1 预测模型设计 44
2.5.2 预测结果分析 44
2.6 小结 45
第3章 区间值信息系统的知识约简 46
3.1 引言 46
3.2 基本概念和性质 47
3.2.1 区间值信息系统 48
3.2.2 相似率 48
3.2.3 α-极大相容类 50
3.3 区间值信息系统中的粗糙近似 53
3.4 区间值信息系统的知识约简 57
3.5 区间值决策系统的知识约简 60
3.6 小结 63
第4章 大数据下Pawlak粗糙集模型知识约简 64
4.1 引言 64
4.2 大数据下知识约简算法中数据和任务并行性 65
4.3 大数据下知识约简算法中若干关键子算法 66
4.3.1 大数据下等价类计算算法 66
4.3.2 大数据下简化决策表获取算法 67
4.3.3 大数据下核属性计算算法 69
4.4 大数据下Pawlak粗糙集模型知识约简算法 70
4.4.1 大数据下基于差别矩阵的知识约简算法 70
4.4.2 大数据下基于正区域的知识约简算法 75
4.4.3 大数据下基于信息熵的知识约简算法 76
4.4.4 大数据下知识约简算法框架模型 77
4.5 大数据下知识约简算法实验分析 78
4.5.1 实验环境 78
4.5.2 大数据下基于差别矩阵的知识约简算法实验分析 78
4.5.3 大数据下知识约简算法框架模型实验分析 83
4.5.4 讨论 87
4.6 小结 87
第5章 大数据下区间值信息系统的知识约简 89
5.1 相关基本概念 90
5.1.1 多决策表的相关概念和性质 90
5.1.2 区间值决策表的相关概念和性质 91
5.2 区间值决策表的启发式约简 93
5.2.1 代数观下区间值决策表约简的相关概念和性质 93
5.2.2 基于依赖度的区间值决策表λ-约简算法 94
5.2.3 信息观下区间值决策表约简的相关概念和性质 95
5.2.4 基于互信息的区间值λ-约简算法 97
5.3 多决策表下的区间值λ-全局近似约简 98
5.3.1 多决策表下的区间值λ-全局约简相关概念和性质 99
5.3.2 多决策表下的区间值λ-全局近似约简算法 100
5.4 实验与分析 101
5.4.1 实验数据 101
5.4.2 实验环境 101
5.4.3 评价指标 101
5.4.4 参数的选择和设置 102
5.5 小结 106
第6章 大数据下层次粗糙集模型知识约简 107
6.1 引言 107
6.2 层次粗糙集模型 107
6.2.1 定性属性粒化表示——概念层次树 108
6.2.2 定量属性粒化表示——云模型 109
6.2.3 层次粗糙集模型 113
6.2.4 讨论 117
6.3 大数据下层次粗糙集模型约简算法 119
6.3.1 大数据下计算层次编码决策表算法 119
6.3.2 大数据下层次粗糙集模型约简算法研究 119
6.4 实验与分析 122
6.4.1 理论分析 122
6.4.2 实验环境 123
6.4.3 实验分析 123
6.5 小结 126
第7章 大数据下层次粗糙集模型知识获取 127
7.1 引言 127
7.2 决策规则 127
7.3 大数据下并行知识获取模型 128
7.3.1 信息粒和概念层次构建 128
7.3.2 不同粒度层次下决策规则度量变化 129
7.3.3 大数据下并行知识获取算法 136
7.3.4 时间复杂度分析 140
7.4 实验与分析 141
7.4.1 样例分析 141
7.4.2 实验分析 141
7.5 小结 144
第8章 总结与展望 145
8.1 总结 145
8.2 展望 146
参考文献 148
附录 156
附录1 开源云计算平台Hadoop安装和配置 156
附录2 大数据下知识约简算法代码示例 160