数据挖掘技术与应用PDF电子书下载
- 电子书积分:8 积分如何计算积分?
- 作 者:夏春艳著
- 出 版 社:北京:冶金工业出版社
- 出版年份:2014
- ISBN:9787502467869
- 页数:137 页
1 绪论 1
1.1 数据挖掘的起源 1
1.2 数据挖掘的现状 2
1.3 数据挖掘的概念 3
1.3.1 数据挖掘的技术含义 4
1.3.2 数据挖掘的理论基础 4
1.3.3 数据的分类 6
1.3.4 训练集和测试集 6
1.3.5 学习 6
1.4 数据挖掘的功能 7
1.5 数据挖掘的过程 8
1.6 数据挖掘的分类 9
1.6.1 根据数据库类型分类 9
1.6.2 根据知识类型分类 9
1.6.3 根据技术分类 9
1.6.4 根据应用分类 9
1.7 数据挖掘的方法 10
1.7.1 决策树方法 10
1.7.2 神经网络方法 10
1.7.3 模糊集方法 10
1.7.4 遗传算法 10
1.7.5 统计分析方法 10
1.7.6 粗糙集方法 11
1.8 数据挖掘的应用分析 11
1.8.1 数据挖掘在体育竞技中的应用 11
1.8.2 数据挖掘在商业银行中的应用 11
1.8.3 数据挖掘在电信中的应用 12
1.8.4 数据挖掘在科学探索中的应用 12
1.8.5 数据挖掘在信息安全中的应用 12
1.9 数据挖掘的发展趋势与面对的问题 13
参考文献 15
2 数据 16
2.1 数据类型 16
2.1.1 属性与度量 16
2.1.2 数据集的类型 20
2.2 数据预处理 24
2.2.1 数据清理 24
2.2.2 数据集成 26
2.2.3 数据变换 26
2.2.4 数据归约 27
2.3 邻近性度量 27
2.3.1 一些概念 27
2.3.2 简单属性之间的邻近度 28
2.3.3 数据对象之间的相异度 28
2.3.4 数据对象之间的相似度 29
2.3.5 邻近性度量举例 29
参考文献 31
3 关联规则 32
3.1 关联规则概念 32
3.2 Apriori关联规则算法 34
3.2.1 发现频繁项目集 34
3.2.2 生成关联规则 36
3.3 提高Apriori算法的效率 38
3.3.1 基于划分的方法 38
3.3.2 基于散列的方法 39
3.3.3 基于采样的方法 39
3.3.4 基于事务压缩的方法 40
3.3.5 基于动态项目集计数的方法 40
3.4 关联规则挖掘的深入问题 40
3.4.1 多层次关联规则挖掘 40
3.4.2 多维关联规则挖掘 42
3.4.3 数量关联规则挖掘 42
参考文献 46
4 分类和预测 47
4.1 分类概念 47
4.2 分类规则 48
4.2.1 分类规则原理 48
4.2.2 分类规则算法步骤 49
4.2.3 分类规则模式 49
4.3 基于距离的分类器 50
4.4 决策树分类器 52
4.4.1 决策树基本算法 53
4.4.2 决策树分类举例 56
4.4.3 ID3算法 58
4.5 贝叶斯分类器 63
4.5.1 贝叶斯定理 64
4.5.2 贝叶斯定理在分类中的应用 65
4.5.3 朴素贝叶斯分类器 66
4.6 基于规则的分类器 68
4.6.1 规则的描述 68
4.6.2 规则的有效性 69
4.6.3 规则产生算法 70
4.6.4 分类决策 70
4.6.5 分类方法 71
参考文献 72
5 聚类分析 73
5.1 聚类分析概述 73
5.1.1 聚类分析在数据挖掘中的应用 74
5.1.2 聚类分析方法的概念 75
5.1.3 聚类分析方法的分类 75
5.1.4 距离与相似性度量 76
5.2 聚类方法 78
5.2.1 划分聚类方法 79
5.2.2 层次聚类方法 81
5.2.3 密度聚类方法 83
参考文献 86
6 粗糙集理论 87
6.1 国内外研究现状 87
6.2 粗糙集思想 88
6.3 信息系统 89
6.4 知识与不可分辨关系 90
6.5 不精确范畴、近似和粗糙度 91
6.6 区分矩阵 93
6.7 知识的约简和核 93
6.7.1 约简和核 93
6.7.2 相对约简和相对核 94
6.8 属性的重要性 95
6.8.1 基于知识依赖性的属性重要度 95
6.8.2 基于信息熵的属性重要度 96
6.9 决策规则的产生 97
6.10 粗糙集方法在数据挖掘中的应用范围 97
参考文献 98
7 属性约简算法 99
7.1 属性约简的典型算法 99
7.1.1 基本算法 99
7.1.2 启发式算法 99
7.1.3 遗传算法 100
7.1.4 复合系统的约简 100
7.1.5 扩展法则 100
7.1.6 动态约简 101
7.2 启发式属性约简算法分析 101
7.2.1 基于属性依赖度的约简算法 101
7.2.2 基于信息熵的约简算法 101
7.2.3 基于属性重要性和频度的约简算法 102
7.2.4 属性重要度的完备性分析 103
7.2.5 属性约简算法的综合分析 105
7.3 启发式属性约简算法研究 106
7.3.1 启发式属性约简算法(一) 106
7.3.2 启发式属性约简算法(二) 109
7.3.3 启发式属性约简算法(三) 110
7.3.4 启发式属性约简算法(四) 112
7.3.5 启发式属性约简算法(五) 112
参考文献 114
8 数据挖掘的应用 116
8.1 数据挖掘的应用举例 116
8.1.1 属性约简 116
8.1.2 分类规则 123
8.2 数据挖掘在农业中的应用 124
8.2.1 农作物灾害预测实例 125
8.2.2 农作物病害预测实例(一) 127
8.2.3 农作物病害预测实例(二) 128
8.2.4 农作物种植实例 129
8.2.5 水稻产量预测实例 130
8.3 数据挖掘在教学评价与教学中的应用 131
8.3.1 数据挖掘在教学评价中的应用 132
8.3.2 数据挖掘在教学中的应用 134
参考文献 136
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《陶瓷工业节能减排技术丛书 陶瓷工业节能减排与污染综合治理》罗民华著 2017
- 《全国职业院校工业机器人技术专业规划教材 工业机器人现场编程》(中国)项万明 2019