目录摘要 1
Abstract第一章 数据挖掘概述 1
§1.1 数据挖掘的技术定义与商业定义 1
§1.1.1 数据挖掘的技术定义 1
§1.1.2 数据挖掘的商业定义 2
§1.2 数据挖掘与知识发现 4
§1.2.1 知识发现过程 4
§1.2.2 数据挖掘的地位 6
§1.3 数据挖掘的对象 6
§1.3.1 关系数据库 6
§1.3.2 数据仓库 7
§1.3.3 事务数据库 8
§1.3.4 高级数据库系统 9
参考文献 10
第二章 数据挖掘的发展及与统计学的关系 11
§2.1 问题的提出 11
§2.2 数据挖掘的发展 12
§2.2.1 数据挖掘研究领域的广泛性 12
§2.2.2 数据挖掘的发展离不开统计学 15
§2.3 数据挖掘的特点及与统计学的关系 16
§2.3.1 数据挖掘的特点 16
§2.3.2 数据挖掘中的统计方法 18
参考文献 22
第三章 数据准备 25
§3.1 问题的提出 25
§3.2 数据选择 26
§3.2.1 数据的读取 26
§3.2.2 原始数据的表示 26
§3.2.3 数据分类 28
§3.3.1 噪声数据的处理 30
§3.3 数据预处理 30
§3.3.2 异常的分析 33
§3.3.3 缺失数据 36
§3.4 数据变换 38
§3.4.1 数据标准化 38
§3.4.2 消减数据维数 40
§3.4.3 时序数据变换 45
§3.5 聚类分析中数据类型的衍生 49
§3.5.1 数据矩阵 49
§3.5.2 相异度矩阵 50
§3.5.3 单向有序列联阵 51
参考文献 52
§4.1 问题的提出 54
第四章 事务性数据库的压缩 54
§4.2 Rough集理论的几个基本概念 55
§4.2.1 引言 55
§4.2.2 Rough集的基本理论 56
§4.3 数据库中事务项的压缩及分析 65
§4.3.1 减少事务数增加可识别性 65
§4.3.2 事务项压缩的特征提取 66
§4.3.3 事务项压缩的统计分析及奇异项的提取 66
§4.4 事务数据库的列联描述 68
§4.4.1 条件属性项之间的列联关系 68
§4.4.2 条件属性项与决策属性项之间的列联关系 71
§4.4.3 属性项与属性值之间的列联关系 73
§4.5 事务数据库的属性项压缩 75
§4.5.1 基于重要性的属性压缩 75
§4.5.2 基于相依性的属性压缩 76
§4.5.3 属性项的广义线性分析及压缩 78
§4.5.4 基于多重相关性的属性项压缩 83
§4.6 移动通讯用户消费分析 84
§4.6.1 确立移动手机用户信息系统 84
§4.6.2 移动手机用户数据库的压缩 86
参考文献 90
第五章 数据的排序及有序聚类分析 92
§5.1 问题的提出 92
§5.2 事务项(样品)的排序标准 94
§5.2.1 以信息源为标准的排序 94
§5.2.2 以综合属性项为标准的排序 95
§5.2.3 移动通讯用户的综合费用排序 97
§5.3.1 以平均水平为标准的排序 99
§5.3 属性项(变量)的排序标准 99
§5.3.2 以秩效应为标准的排序 101
§5.4 有序近邻聚类分析 103
§5.4.1 相似指标的确定及聚类方法 103
§5.4.2 Fisher最优求解法与有序近邻法的比较 105
§5.5 有序平均秩效应聚类分析 110
§5.5.1 平均秩效应原则及聚类方法 110
§5.5.2 聚类分析的效应检验 114
参考文献 116
第六章 关联规则的进一步研究 117
§6.1 问题的提出 117
§6.2 相应分析的求解 120
§6.2.1 引言 120
§6.2.2 有关记号和分布轮廓 122
§6.2.3 相应分析的求解 124
§6.3 相应分析与独立性检验的内在关系 126
§6.3.1 二维列联表的独立性检验 127
§6.3.2 总信息变差的量度 127
§6.3.3 相应分析的有关性质及与独立性检验的关系 129
§6.4 相应分析的适应性检验 132
§6.4.1 适应性检验的基本思想 132
§6.4.2 相应分析的适应性检验和分析 133
§6.4.3 相应分析适应性的应用 138
§6.5 相应分析适应性的量度 143
§6.5.1 均方列联系数的引入 143
§6.5.2 相应分析适应性的分层量度 146
参考文献 148
第七章 数据挖掘中的基函数拟合建模及预测 149
§7.1 问题的提出 149
§7.2 基函数的确定 150
§7.2.1 多项式幂基函数 151
§7.2.2 拉格朗日(Lagrange)基函数 151
§7.2.3 伯恩斯坦(Bernstein)基函数 151
§7.3 Bernstein基函数拟合建模及预测问题 153
§7.3.1 基函数拟合建模 153
§7.3.2 预测问题 156
§7.4 上证指数收盘价预测模拟 157
§7.4.1 上证指数收盘价的拟合模拟 158
§7.4.2 预测模拟 160
参考文献 161
附录 162
附录Ⅰ 移动手机用户数据库压缩及列联表 162
附录Ⅱ 大学生隐形教育调查分析结果 176
附录Ⅲ 上证指数收盘价预测误差分析结果 182