第1章 医学数据挖掘概述 1
1.1数据挖掘概念 1
1.1.1数据挖掘的产生 1
1.1.2数据挖掘的定义 2
1.2数据挖掘的任务 5
1.3数据挖掘技术 8
1.4数据挖掘工具——SQL Server 2005 8
1.5数据挖掘技术在医学领域中的应用特点、现状及展望 10
本章小结 12
习题 12
第2章 数据挖掘方法和最佳实践 13
2.1为什么需要方法论 13
2.1.1获取不真实的知识 13
2.1.2获取真实但无用的知识 14
2.2假设测试 14
2.3数据挖掘的方法 15
本章小结 23
习题 23
第3章 决策树 24
3.1决策树的概念 24
3.2决策树算法的基本原理 25
3.2.1 ID3算法 25
3.2.2 ID3算法的特点和面临的问题 28
3.2.3树枝修剪 28
3.2.4其他决策树算法 29
3.3利用Microsoft SQL Server 2005实践决策树算法 30
3.3.1案例背景 30
3.3.2 Microsoft SQL Server 2005 Analysis Services操作步骤 31
本章小结 39
习题 39
第4章 回归与时序算法 41
4.1算法介绍 41
4.2回归分析 42
4.2.1一元线性回归分析 42
4.2.2多元线性回归分析 50
4.2.3非线性回归分析 52
4.3时间序列分析 53
4.3.1确定性时间序列分析方法 54
4.3.2随机时间序列分析 58
4.4利用Microsoft SQL Server 2005实践回归与时序分析 59
4.4.1案例背景 59
4.4.2 Microsoft SQL Server 2005 Analysis Services操作步骤 60
本章小结 66
习题 66
第5章 人工神经网络 68
5.1人工神经网络简介 68
5.2人工神经网络建模基础 70
5.2.1生物神经网络 70
5.2.2人工神经元 72
5.2.3 M-P模型 74
5.2.4人工神经网络分类 74
5.2.5人工神经网络的学习 77
5.3感知器神经网络 80
5.3.1单层感知器 80
5.3.2多层感知器 86
5.3.3误差反传(BP)算法 88
5.4利用Microsoft SQL Server 2005实践神经网络算法 91
5.4.1案例背景 91
5.4.2 Microsoft SQL Server 2005 Analysis Services操作步骤 91
本章小结 96
习题 96
第6章 关联规则 97
6.1关联规则概述 97
6.2关联规则算法 99
6.2.1单维布尔关联规则挖掘 99
6.2.2多层关联规则挖掘 103
6.2.3多维关联规则挖掘 104
6.3利用Microsoft SQL Server 2005实践关联规则算法 105
6.3.1案例背景 105
6.3.2 Microsoft SQL Server 2005 Analysis Services操作步骤 106
本章小结 112
习题 112
第7章 聚类分析 113
7.1聚类分析相关概念及其分类 113
7.1.1相似性测量 113
7.1.2聚类分析算法简介 114
7.2 k-Means算法 116
7.3 EM算法 117
7.4利用Microsoft SQL Server 2005实践聚类分析算法 119
7.4.1案例背景 119
7.4.2 Microsoft SQL Server 2005 Analysis Services操作步骤 120
本章小结 126
习题 127
附录A SQL Server 2005数据库的安装 128
附录B 数据挖掘模拟试题(一) 133
附录C 数据挖掘模拟试题(二) 139
参考文献 144