数据挖掘PDF电子书下载
- 电子书积分:8 积分如何计算积分?
- 作 者:张道强,李静,蔡昕烨编著
- 出 版 社:北京:科学出版社
- 出版年份:2018
- ISBN:9787030573902
- 页数:138 页
第1章 绪论 1
1.1 什么是数据挖掘 1
1.2 数据挖掘的任务 2
1.3 数据挖掘在脑疾病诊断以及生物信息学中的应用 3
1.4 数据挖掘在软件设计和应用领域的应用 4
1.5 基于进化计算的数据挖掘技术 4
1.6 本书的内容与组织 4
第2章 数据准备 6
2.1 数据 6
2.1.1 数据集类型 6
2.1.2 数据属性及类型 7
2.1.3 数据相似性与相异性 8
2.2 数据预处理方法 10
2.2.1 数据清理 10
2.2.2 数据变换 11
2.2.3 数据归约 12
2.2.4 数据集成 14
参考文献 15
第3章 关联规则 16
3.1 基本概念 16
3.2 Apriori算法 17
3.3 其他关联规则挖掘 18
参考文献 19
第4章 分类 21
4.1 基本概念 21
4.2 决策树分类 22
4.2.1 决策树概念 22
4.2.2 常见决策树算法 23
4.3 基于贝叶斯定理的分类方法 28
4.3.1 朴素贝叶斯分类器 28
4.3.2 贝叶斯信念网络 29
4.4 多层前馈神经网络分类器 30
4.4.1 基本概念 31
4.4.2 BP算法 32
4.5 支持向量机分类器 34
4.5.1 支持向量与超平面 34
4.5.2 线性可分支持向量机 36
4.5.3 线性不可分支持向量机 39
4.5.4 非线性支持向量机 42
4.6 最近邻分类器 43
4.7 分类器的评估与度量 44
4.7.1 性能评估指标 44
4.7.2 分类器的准确率评估 45
4.7.3 常见评估方法 45
参考文献 47
第5章 聚类分析 48
5.1 聚类概述 48
5.2 基于划分的聚类算法 51
5.2.1 k均值聚类 51
5.2.2 k中心点聚类 52
5.2.3 EM 53
5.3 基于层次的聚类算法 54
5.3.1 簇间距离度量方法 54
5.3.2 BIRCH 55
5.3.3 CURE 57
5.3.4 ROCK 57
5.3.5 Chameleon 58
5.4 基于网格与基于密度的聚类 59
5.4.1 STING 59
5.4.2 DBSCAN 60
5.4.3 OPTICS 61
5.5 其他方法聚类 61
5.5.1 NMF 61
5.5.2 子空间聚类 62
5.6 聚类有效性验证 63
参考文献 65
第6章 多模态脑影像挖掘 67
6.1 引言 67
6.2 多模态分类 68
6.2.1 基于多核学习的多模态分类器 68
6.2.2 实验结果 69
6.3 多模态特征选择 72
6.3.1 基于流形正则化多模态特征选择 72
6.3.2 实验结果 74
6.4 结论 76
参考文献 77
第7章 脑网络分析 79
7.1 脑网络分析概述 79
7.2 基于拓扑结构的结构化特征选择 81
7.2.1 方法的框架 81
7.2.2 Weisfeiler-Lehman子树核 82
7.2.3 特征提取 83
7.2.4 结构化特征选择 84
7.3 脑网络的判别性子图学习 86
7.3.1 判别性子图 86
7.3.2 基于判别性子图的脑网络分类 88
7.3.3 进一步提高效果的方法 88
参考文献 89
第8章 数据挖掘在生物信息学中的应用 92
8.1 基于树型结构引导的稀疏学习方法在基因-影像关联分析中的应用 92
8.1.1 引言 92
8.1.2 方法 93
8.1.3 实验 96
8.1.4 结论 98
8.2 基于结构化ECOC的蛋白质图像亚细胞定位方法 98
8.2.1 引言 98
8.2.2 方法 100
8.2.3 实验 102
8.2.4 结论 104
参考文献 104
第9章 软件数据挖掘 106
9.1 软件数据挖掘概述 106
9.2 软件缺陷预测简介 106
9.2.1 概述 106
9.2.2 基于机器学习的静态软件缺陷预测 106
9.3 代价敏感特征选择在软件缺陷预测中的应用 108
9.3.1 双重代价敏感特征选择 108
9.3.2 代价敏感特征选择算法思想概述 110
9.3.3 CSVS特征选择算法 111
9.3.4 CSLS特征选择算法 112
9.3.5 CSCS特征选择算法 112
9.3.6 实验及结果分析 113
9.4 小结 117
参考文献 117
第10章 基于进化计算的数据挖掘 119
10.1 引言 119
10.2 进化计算 119
10.2.1 进化算法 119
10.2.2 多目标进化算法 120
10.3 数据挖掘中进化计算的应用 122
10.3.1 进化计算用于特征选择 122
10.3.2 进化计算用于分类 125
10.3.3 进化计算用于聚类分析 128
10.3.4 进化计算用于规则发现 131
10.4 结束语 133
参考文献 134
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《小牛顿科学故事馆 医学的故事》小牛顿科学教育公司编辑团队 2018
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019