数据挖掘的统计方法及实践PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:朱建平著
- 出 版 社:北京:中国统计出版社
- 出版年份:2005
- ISBN:7503747641
- 页数:182 页
目录摘要 1
Abstract第一章 数据挖掘概述 1
§1.1 数据挖掘的技术定义与商业定义 1
§1.1.1 数据挖掘的技术定义 1
§1.1.2 数据挖掘的商业定义 2
§1.2 数据挖掘与知识发现 4
§1.2.1 知识发现过程 4
§1.2.2 数据挖掘的地位 6
§1.3 数据挖掘的对象 6
§1.3.1 关系数据库 6
§1.3.2 数据仓库 7
§1.3.3 事务数据库 8
§1.3.4 高级数据库系统 9
参考文献 10
第二章 数据挖掘的发展及与统计学的关系 11
§2.1 问题的提出 11
§2.2 数据挖掘的发展 12
§2.2.1 数据挖掘研究领域的广泛性 12
§2.2.2 数据挖掘的发展离不开统计学 15
§2.3 数据挖掘的特点及与统计学的关系 16
§2.3.1 数据挖掘的特点 16
§2.3.2 数据挖掘中的统计方法 18
参考文献 22
第三章 数据准备 25
§3.1 问题的提出 25
§3.2 数据选择 26
§3.2.1 数据的读取 26
§3.2.2 原始数据的表示 26
§3.2.3 数据分类 28
§3.3.1 噪声数据的处理 30
§3.3 数据预处理 30
§3.3.2 异常的分析 33
§3.3.3 缺失数据 36
§3.4 数据变换 38
§3.4.1 数据标准化 38
§3.4.2 消减数据维数 40
§3.4.3 时序数据变换 45
§3.5 聚类分析中数据类型的衍生 49
§3.5.1 数据矩阵 49
§3.5.2 相异度矩阵 50
§3.5.3 单向有序列联阵 51
参考文献 52
§4.1 问题的提出 54
第四章 事务性数据库的压缩 54
§4.2 Rough集理论的几个基本概念 55
§4.2.1 引言 55
§4.2.2 Rough集的基本理论 56
§4.3 数据库中事务项的压缩及分析 65
§4.3.1 减少事务数增加可识别性 65
§4.3.2 事务项压缩的特征提取 66
§4.3.3 事务项压缩的统计分析及奇异项的提取 66
§4.4 事务数据库的列联描述 68
§4.4.1 条件属性项之间的列联关系 68
§4.4.2 条件属性项与决策属性项之间的列联关系 71
§4.4.3 属性项与属性值之间的列联关系 73
§4.5 事务数据库的属性项压缩 75
§4.5.1 基于重要性的属性压缩 75
§4.5.2 基于相依性的属性压缩 76
§4.5.3 属性项的广义线性分析及压缩 78
§4.5.4 基于多重相关性的属性项压缩 83
§4.6 移动通讯用户消费分析 84
§4.6.1 确立移动手机用户信息系统 84
§4.6.2 移动手机用户数据库的压缩 86
参考文献 90
第五章 数据的排序及有序聚类分析 92
§5.1 问题的提出 92
§5.2 事务项(样品)的排序标准 94
§5.2.1 以信息源为标准的排序 94
§5.2.2 以综合属性项为标准的排序 95
§5.2.3 移动通讯用户的综合费用排序 97
§5.3.1 以平均水平为标准的排序 99
§5.3 属性项(变量)的排序标准 99
§5.3.2 以秩效应为标准的排序 101
§5.4 有序近邻聚类分析 103
§5.4.1 相似指标的确定及聚类方法 103
§5.4.2 Fisher最优求解法与有序近邻法的比较 105
§5.5 有序平均秩效应聚类分析 110
§5.5.1 平均秩效应原则及聚类方法 110
§5.5.2 聚类分析的效应检验 114
参考文献 116
第六章 关联规则的进一步研究 117
§6.1 问题的提出 117
§6.2 相应分析的求解 120
§6.2.1 引言 120
§6.2.2 有关记号和分布轮廓 122
§6.2.3 相应分析的求解 124
§6.3 相应分析与独立性检验的内在关系 126
§6.3.1 二维列联表的独立性检验 127
§6.3.2 总信息变差的量度 127
§6.3.3 相应分析的有关性质及与独立性检验的关系 129
§6.4 相应分析的适应性检验 132
§6.4.1 适应性检验的基本思想 132
§6.4.2 相应分析的适应性检验和分析 133
§6.4.3 相应分析适应性的应用 138
§6.5 相应分析适应性的量度 143
§6.5.1 均方列联系数的引入 143
§6.5.2 相应分析适应性的分层量度 146
参考文献 148
第七章 数据挖掘中的基函数拟合建模及预测 149
§7.1 问题的提出 149
§7.2 基函数的确定 150
§7.2.1 多项式幂基函数 151
§7.2.2 拉格朗日(Lagrange)基函数 151
§7.2.3 伯恩斯坦(Bernstein)基函数 151
§7.3 Bernstein基函数拟合建模及预测问题 153
§7.3.1 基函数拟合建模 153
§7.3.2 预测问题 156
§7.4 上证指数收盘价预测模拟 157
§7.4.1 上证指数收盘价的拟合模拟 158
§7.4.2 预测模拟 160
参考文献 161
附录 162
附录Ⅰ 移动手机用户数据库压缩及列联表 162
附录Ⅱ 大学生隐形教育调查分析结果 176
附录Ⅲ 上证指数收盘价预测误差分析结果 182
- 《建筑施工企业统计》杨淑芝主编 2008
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《语文教育教学实践探索》陈德收 2018
- 《彼得·布鲁克导演实践研究》邓小玲著 2019
- 《反思性实践》胡红梅, 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《高含硫气藏开发腐蚀控制技术与实践》唐永帆,张强 2018
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《环境影响评价公众参与理论与实践研究》樊春燕主编 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《建筑施工企业统计》杨淑芝主编 2008
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《清至民国中国西北戏剧经典唱段汇辑 第8卷》孔令纪 2018