数据挖掘技术与工程实践PDF电子书下载
- 电子书积分:13 积分如何计算积分?
- 作 者:(加)洪松林(HongSongLin),(中)庄映辉,方堃著
- 出 版 社:北京:机械工业出版社
- 出版年份:2014
- ISBN:9787111480761
- 页数:368 页
第1章 数据挖掘应用绪论 1
1.1 认识数据挖掘 1
1.1.1 数据挖掘概念 2
1.1.2 数据挖掘与生活 4
1.1.3 数据挖掘与知识 6
1.2 数据挖掘应用基础 6
1.2.1 事物与维度 7
1.2.2 分布与关系 9
1.2.3 描绘与预测 11
1.2.4 现象和知识 13
1.2.5 规律与因果 13
1.3 数据挖掘应用系统工程 14
1.3.1 数据层 14
1.3.2 算法层 18
1.3.3 应用层 23
1.4 数据挖掘应用体会 26
1.4.1 项目关键点 26
1.4.2 技术与应用创新 27
1.4.3 经验积累与应用 28
1.5 无限三维嵌套空间假说 28
1.5.1 一维空间 29
1.5.2 二维空间 29
1.5.3 三维空间 29
1.5.4 突破三维空间 30
1.5.5 五维空间 31
1.5.6 六维空间 31
1.6 本章小结 32
第2章 数据探索与准备 33
2.1 数据关系探索 34
2.1.1 业务发现 34
2.1.2 关系发现 36
2.1.3 数据质量探索 37
2.1.4 数据整合 40
2.2 数据特征探索 42
2.2.1 数据的统计学特征 42
2.2.2 统计学特征应用 48
2.3 数据选择 52
2.3.1 适当的数据规模 52
2.3.2 数据的代表性 53
2.3.3 数据的选取 54
2.4 数据处理 56
2.4.1 数据标准化 57
2.4.2 数据离散化 58
2.5 统计学算法的数量条件 60
2.5.1 样本量估计概念 60
2.5.2 单样本总体均值比较的样本量估计(T-Test) 61
2.5.3 两样本总体均值比较的样本量估计(T-Test) 62
2.5.4 多样本总体均值比较的样本量估计(F-Test) 63
2.5.5 区组设计多样本总体均值比较的样本量估计(F-Test) 66
2.5.6 直线回归与相关的样本量估计 66
2.5.7 对照分析的样本量估计 67
2.6 数据探索应用 68
2.6.1 检验项的疾病分布 69
2.6.2 疾病中检验项的分布 70
2.6.3 成对检验项的相关分析 71
2.6.4 两种药物的应用分析 71
2.7 本章小结 73
第3章 数据挖掘应用算法 74
3.1 聚类分析 74
3.1.1 划分聚类算法(K均值) 75
3.1.2 层次聚类算法(组平均) 79
3.1.3 密度聚类算法 84
3.2 特性选择 85
3.2.1 特性选择概念 85
3.2.2 线性相关算法 90
3.2.3 相关因子SRCF算法 91
3.3 特征抽取 100
3.3.1 主成分分析算法 101
3.3.2 因子分析算法 102
3.3.3 非负矩阵因子分解NMF算法 103
3.4 关联规则 104
3.4.1 关联规则概念 105
3.4.2 Apriori算法 105
3.4.3 FP树频集算法 106
3.4.4 提升Lift 107
3.5 分类和预测 107
3.5.1 支持向量机 107
3.5.2 Logistic回归算法 112
3.5.3 朴素贝叶斯分类算法 115
3.5.4 决策树 121
3.5.5 人工神经网络 125
3.5.6 分类与聚类的关系 129
3.6 时间序列 129
3.6.1 灰色系统预测模型 129
3.6.2 ARIMA模型预测 135
3.7 本章小结 136
第4章 数据挖掘应用案例 137
4.1 特性选择的应用 137
4.1.1 数据整合 137
4.1.2 数据描绘 138
4.1.3 数据标准化 139
4.1.4 特性选择探索 139
4.2 分类模型的应用——算法比较 144
4.2.1 数据整合 144
4.2.2 数据描绘 145
4.2.3 数据标准化 148
4.2.4 特性选择探索 148
4.2.5 分类模型 150
4.3 分类模型的应用——网络异常侦测 151
4.3.1 计算机网络异常行为 152
4.3.2 网络异常数据模型 152
4.3.3 分类模型算法应用 156
4.4 算法的综合应用——肿瘤标志物的研究 159
4.4.1 样本选取 160
4.4.2 癌胚抗原临床特征主题分析 164
4.4.3 癌胚抗原临床特征规则分析 167
4.4.4 癌胚抗原临床特征规则的比较分析 172
4.4.5 癌胚抗原相关因子分析 173
4.4.6 不同等级癌胚抗原组差异分析 176
4.5 数据挖掘在其他领域中的应用 180
4.6 本章小结 182
第5章 数据挖掘行业应用原理 183
5.1 传统医学科研方法的现状 184
5.1.1 传统医学科研的命题与假说 184
5.1.2 传统医学科研的数据应用 185
5.1.3 传统的医学科研的统计学应用 186
5.1.4 传统医学科研的流程 186
5.2 智能医学科研系统的需求 187
5.2.1 临床医学科研的问题 187
5.2.2 临床医学科研的解决思路 188
5.3 智能医学科研系统的设计思想 190
5.3.1 科研立题 190
5.3.2 科研设计与统计分析 191
5.3.3 样本数据收集与分析 192
5.4 智能医学科研系统的核心技术方法 193
5.5 智能医学科研系统的科研数据仓库建设 194
5.5.1 医学科研数据仓库建设的技术方法 194
5.5.2 医学科研数据仓库的建设过程 196
5.5.3 科研数据仓库的数据安全 198
5.6 智能医学科研系统的核心功能设计 198
5.7 智能医学科研系统的整体功能设计 199
5.7.1 智能医学科研系统主要功能 200
5.7.2 智能医学科研系统的模块设计和应用实现 202
5.7.3 智能医学科研系统的评估方法 211
5.8 智能医学科研系统的应用价值 215
5.9 本章小结 218
第6章 数据挖掘应用系统的开发 219
6.1 数据挖掘应用系统的意义 219
6.2 IMRS系统设计 221
6.2.1 对数据源的分析 221
6.2.2 数据挖掘应用系统IMRS的总体设计 224
6.3 IMRS异常侦测模型的开发 232
6.3.1 异常侦测模型的功能展示 232
6.3.2 数据挖掘技术开发要点 236
6.4 IMRS特征抽取模型的开发 242
6.4.1 特征抽取模型的功能展示 242
6.4.2 数据挖掘技术开发要点 243
6.5 IMRS智能统计模型的开发 255
6.5.1 回归模型的开发实现 255
6.5.2 线性相关模型的开发实现 267
6.6 IMRS的算法开发 271
6.6.1 相关因子算法SRCF的实现 271
6.6.2 朴素贝叶斯分类算法的实现 275
6.7 本章小结 280
第7章 数据挖掘应用系统的应用 281
7.1 分布探索 282
7.1.1 两维度聚类模型应用 282
7.1.2 高维度聚类模型应用 287
7.2 关系探索 289
7.2.1 关联规则的应用 289
7.2.2 特性选择的应用 292
7.3 特征探索 297
7.3.1 不稳定心绞痛的特征总结 297
7.3.2 动脉硬化心脏病的临床特征 302
7.4 异常探索 305
7.4.1 生理指标的异常侦测 305
7.4.2 异常侦测模型的比较 307
7.5 推测探索 308
7.6 应用系统的高级应用 310
7.6.1 异常侦测的高级用法 310
7.6.2 关联规则的高级应用 315
7.7 本章小结 320
第8章 数据挖掘工具的应用 321
8.1 应用Oracle Data Mining 321
8.1.1 ODM数据挖掘流程 322
8.1.2 ODM算法模型 323
8.1.3 ODM算法应用 327
8.2 应用IBM SPSS Modeler 351
8.2.1 IBM SPSS Modeler介绍 351
8.2.2 SPSS Modeler独立应用 352
8.2.3 SPSS Modeler与应用系统的联合应用 359
8.3 本章小结 367
参考文献 368
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《语文教育教学实践探索》陈德收 2018
- 《彼得·布鲁克导演实践研究》邓小玲著 2019
- 《反思性实践》胡红梅, 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《高含硫气藏开发腐蚀控制技术与实践》唐永帆,张强 2018
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《环境影响评价公众参与理论与实践研究》樊春燕主编 2019
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《克里蒙奇钢琴教程》(美)吴菀夷,(加)陈若心编著 2019
- 《软件工程》齐治昌,谭庆平,宁洪编著 2019
- 《空气动力学 7 飘浮的秘密》(加)克里斯·费里著 2019
- 《弗里达·卡罗》(加)苏珊娜·巴贝扎特著;朱一凡,玩静雯,李梦幻译 2020
- 《快乐的陷阱》(加)兰迪·帕特森(RandyJ.Paterson) 2019
- 《当代声乐教学理念与实践创新》王松林责任编辑;(中国)林梅 2019
- 《克里蒙奇钢琴教程 第2册》(美)吴菀夷,(加)陈若心编著 2019
- 《因为天空曾经真实》(加)衣田·拉朗德(Etienne Lalonde)著 2018
- 《新中国经济史论》洪银兴,杨德才编著 2019
- 《刺杀肯尼迪》(美)比尔·奥赖利(美)马丁·杜加尔德 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019