数据挖掘理论与应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:胡可云,田凤占,黄厚宽编著
- 出 版 社:北京:北京交通大学出版社
- 出版年份:2008
- ISBN:7811232529
- 页数:248 页
第1章 导论 1
数据挖掘概述 1
数据挖掘的背景 1
数据挖掘的定义 2
数据挖掘的应用 4
数据挖掘的一般过程 6
数据挖掘中的数据集 6
数据挖掘的任务 8
数据挖掘过程 10
数据挖掘的一般方法 12
分类预测型方法 12
描述型方法 14
文本/Web挖掘方法 16
第2章 分类方法 18
决策树 18
决策树基本概念 18
决策树构造过程 20
决策树的扩展 23
前馈神经网络 24
基本概念 24
BP训练过程 25
RBF网络 28
基于规则的方法 30
AQ算法 31
C45 rules 32
RIPPER 33
支持向量机 34
核函数 34
线性可分模式下的最优超平面 35
线性不可分模式下的最优超平面 36
支持向量机 36
贝叶斯分类 38
贝叶斯理论和极大后验假设 39
贝叶斯网络和贝叶斯分类器 39
几种常见的贝叶斯分类器模型 40
贝叶斯分类器应用举例 44
粗糙集方法 47
粗糙集概念 47
粗糙集基本算法 54
粗糙集方法的扩展 61
其他分类方法 64
回归分析 64
k-最近邻分类方法 67
组合学习方法 68
第3章 聚类方法 71
聚类方法概述 71
聚类分析中的常见数据类型 72
对聚类算法的一些典型要求 74
主要的聚类方法 75
划分聚类 76
k-均值算法 76
二分k-均值聚类方法 78
k-中心点算法 78
层次聚类 79
凝聚的和分裂的层次聚类 79
BIRCH算法 81
CURE算法 83
ROCK算法 84
Chameleon 85
基于密度的聚类 86
DBSCAN算法 86
OPTICS算法 88
Kohonen聚类 90
自组织神经网络 90
Kohonen自组织映射 90
孤立点分析 92
基于统计的孤立点检测 92
基于距离的孤立点检测 93
基于偏离的孤立点检测方法 94
概念格 95
基本概念 95
概念格的建造 97
规则提取 102
第4章 关联分析 103
基本概念与挖掘过程 103
基本概念 103
关联规则挖掘过程 105
频繁项集挖掘算法 106
Apriori算法 106
Apriori算法的改进 109
FP- Growth算法 110
关联规则生成算法 114
频繁闭项集挖掘 115
关联规则的扩展 115
多层次关联规则 115
多维关联规则 116
定量关联规则 116
加权关联规则 117
序列模式分析 117
第5章 文本与Web挖掘 120
文本挖掘 120
文本预处理 120
文本检索 127
文本分类 135
文本聚类 139
文本摘要 140
Web挖掘 144
概述 144
Web内容挖掘 146
Web结构挖掘 149
Web使用挖掘 152
第6章 业务理解 160
需求分析 160
需求分析的内容 160
需求分析的方法 161
需求分析的结果 161
需求分析的注意事项 162
实例:客户细分项目的需求分析 162
客户细分项目的内容 162
分析方法 164
分析结果 164
第7章 数据预处理 165
数据理解 165
数据准备 166
数据整理与合并 166
数据抽样 167
训练集和测试集的划分方法 170
类标签的确定 172
数据描述 173
单变量描述方法 174
多变量描述方法 178
数据清理 183
缺值处理 183
探测异常点与噪声清除 185
变量变换与合成 188
连续变量归一化 188
离散变量的数值化 190
连续变量离散化 191
变量变换 195
变量合成 197
变量选择 201
概述 201
包装方法 202
过滤方法 203
主成分及因子分析 205
一些算法对预处理的要求 207
实例:客户流失项目的数据预处理 207
数据理解和数据准备 208
数据描述和清理 210
数据变换与选择 210
第8章 建模 213
算法选择 213
模型参数调整 214
模型评估和性能比较 215
分类模型的评估方法 215
聚类模型的评估方法 217
模型导出 218
实例 客户流失项目的建模 223
算法选择 223
参数调整 223
性能评估 223
模型导出 224
第9章 模型部署与维护 225
模型部署 225
模型维护 225
客户流失项目的模型部署与维护 226
附录A 主要数据挖掘软件简介 227
SAS Enterprise Miner 227
概述 227
数据挖掘过程及模块 228
SPSS Clementine 231
概述 231
数据挖掘过程及模块 231
IBM Intelligent Miner 235
概述 235
数据挖掘过程及模块 236
其他常见数据挖掘工具 238
参考文献 240
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《情报学 服务国家安全与发展的现代情报理论》赵冰峰著 2018
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《新课标背景下英语教学理论与教学活动研究》应丽君 2018
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019