数据挖掘算法与Clementine实践PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:熊平主编
- 出 版 社:北京:清华大学出版社
- 出版年份:2011
- ISBN:9787302235019
- 页数:237 页
第1章 数据挖掘概述 1
1.1数据挖掘简介 1
1.1.1数据、信息和知识 1
1.1.2数据挖掘的定义 2
1.2数据挖掘过程 2
1.3数据挖掘方法 5
1.4数据挖掘工具及软件 7
第2章 Clementine概述 10
2.1 Clementine简介 10
2.2 Clementine基本操作 11
2.2.1 Clementine主窗口 11
2.2.2 数据流的基本操作 13
第3章 决策树 15
3.1分类与决策树概述 15
3.1.1分类与预测 15
3.1.2决策树的基本原理 15
3.2 ID3、C4.5与C5.0 18
3.2.1 ID3 18
3.2.2 C4.5 23
3.2.3 C5.0 26
3.2.4在Clementine中应用C5.0 27
3.3 CART 40
3.3.1生成最大树 40
3.3.2树的修剪 43
3.3.3子树评估 45
3.3.4在Clementine中应用CART 46
第4章 聚类分析 54
4.1聚类分析概述 54
4.1.1聚类分析的概念 54
4.1.2聚类分析的基本方法 55
4.2 K-Means算法 57
4.2.1数据预处理 57
4.2.2K-Means算法流程 59
4.2.3在Clementine中应用K-Means 60
4.3 TwoStep算法 68
4.3.1构建CF树 68
4.3.2聚类 70
4.3.3在Clementine中应用TwoStep 72
第5章 关联规则 75
5.1 关联规则概述 75
5.1.1关联规则的定义 75
5.1.2关联规则的基本概念 76
5.1.3关联规则挖掘算法 77
5.2 Apriori算法 78
5.2.1 Apriori算法原理 78
5.2.2在Clementine中应用Apriori算法 83
5.3 CARMA算法 90
5.3.1 CARMA算法原理 90
5.3.2在Clementine中应用CARMA算法 95
5.4序列模式 105
5.4.1序列与序列模式 105
5.4.2序列模式挖掘算法 106
5.4.3在Clementine中应用序列模式挖掘 110
第6章 数据筛选 116
6.1特征选择 116
6.1.1特征选择算法概述 116
6.1.2筛选 117
6.1.3分级 118
6.1.4选择 128
6.1.5在Clementine中应用特征选择 129
6.2异常检测 133
6.2.1异常数据挖掘概述 133
6.2.2异常检测算法 136
6.2.3在Clementine中应用异常检测 141
第7章 统计模型 149
7.1线性回归 149
7.1.1线性回归的基本原理 149
7.1.2在Clementine中应用线性回归 154
7.2二项Logistic回归 162
7.2.1二项Logistic回归的基本原理 162
7.2.2在Clementine中应用Logistic回归 167
第8章 神经网络 175
8.1神经网络原理 175
8.1.1神经网络基本概念 175
8.1.2神经网络及其学习 177
8.2多层感知器与RBF网络 179
8.2.1多层感知器 179
8.2.2径向基函数网络 184
8.2.3在Clementine中应用神经网络 187
8.3 Kohonen网络 195
8.3.1自组织神经网络 195
8.3.2自组织特征映射网络 196
8.3.3在Clementine中应用Kohonen网络 200
第9章 时间序列分析与预测 205
9.1时间序列概述 205
9.1.1时间序列基本概念 205
9.1.2时间序列预测的传统方法 206
9.2指数平滑法 208
9.2.1指数平滑法概述 208
9.2.2指数平滑模型 208
9.3 ARIMA模型 213
9.3.1 ARMA模型 214
9.3.2差分运算与ARIMA模型 219
9.3.3 ARIMA建模过程 221
9.3.4在Clementine中应用时间序列分析 225
参考文献 236
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《激光加工实训技能指导理实一体化教程 下》王秀军,徐永红主编;刘波,刘克生副主编 2017
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《先进激光加工技能实训》肖海兵主编 2019
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《英语实训教程 第2册 商务英语听说》盛湘君总主编 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019