第1章 大数据概论 1
1.1 大数据技术概述 1
1.1.1 大数据的主要来源 2
1.1.2 大数据的核心 2
1.1.3 大数据的处理流程 3
1.1.4 大数据的结构类型 6
1.1.5 大数据的基本特征 6
1.2 大数据的技术架构 7
1.3 大数据分析的4种典型工具 8
1.4 大数据未来的发展趋势 9
1.4.1 数据资源化 9
1.4.2 数据科学和数据共享 9
1.4.3 大数据的隐私和安全问题 10
1.4.4 开源软件 10
1.4.5 大数据对生活的影响 11
1.5 大数据在医学领域的应用 11
1.5.1 临床操作 11
1.5.2 付款/定价 12
1.5.3 研发 13
1.5.4 新的商业模式 14
1.5.5 公众健康 14
本章小结 14
习题1 15
第2章 医学大数据采集 16
2.1 大数据采集概述 16
2.1.1 大数据的采集 16
2.1.2 医学大数据的数据来源 17
2.2 医学大数据采集的实现 19
2.2.1 医学大数据采集的方法 19
2.2.2 网络爬虫采集的实现 23
本章小结 31
习题2 32
第3章 大数据分析 34
3.1 大数据分析概述 34
3.1.1 大数据分析简介 34
3.1.2 大数据分析的研究方向 35
3.2 大数据分析的主要技术 37
3.2.1 深度学习 37
3.2.2 知识计算 39
3.3 大数据分析处理系统 40
3.3.1 批量数据及其分析处理系统 40
3.3.2 流式数据及其分析处理系统 40
3.3.3 交互式数据及其分析处理系统 41
3.3.4 图数据及其分析处理系统 41
3.4 大数据分析在医学领域的应用 42
本章小结 46
习题3 46
第4章 大数据可视化 48
4.1 大数据可视化概述 48
4.2 大数据可视化工具 53
本章小结 62
习题4 63
第5章 Hadoop 64
5.1 Hadoop概述 64
5.1.1 Hadoop的概念和核心架构 64
5.1.2 Hadoop的数据处理流程 65
5.1.3 Hadoop的功能 65
5.2 Hadoop的实现方法 66
5.3 Hadoop在医学领域的应用 68
本章小结 73
习题5 73
第6章 HDFS和Common 74
6.1 HDFS概述 74
6.1.1 HDFS的相关概念和特征 74
6.1.2 HDFS的体系结构 75
6.1.3 HDFS的工作原理 76
6.2 Common概述 78
6.3 HDFS在医学领域的应用 79
本章小结 82
习题6 82
第7章 MapReduce 84
7.1 MapReduce概述 84
7.1.1 MapReduce的概念 84
7.1.2 MapReduce的内涵、特征和局限性 85
7.2 MapReduce的架构和工作流程 86
7.2.1 MapReduce的架构 86
7.2.2 MapReduce的工作流程 87
7.3 Map和Reduce的工作原理 87
7.4 MapReduce在医学领域的应用 90
本章小结 91
习题7 92
第8章 NoSQL 93
8.1 NoSQL的概念和特点 93
8.2 NoSQL的技术基础 94
8.2.1 大数据的一致性策略 94
8.2.2 大数据的分区技术和放置策略 95
8.2.3 大数据的复制和容错技术 95
8.2.4 大数据的缓存技术 96
8.3 NoSQL的类型 97
8.3.1 键值存储 97
8.3.2 面向列存储 97
8.3.3 面向文档存储 97
8.3.4 面向图形存储 98
8.4 典型的NoSQL工具和医学应用 99
8.4.1 Redis 99
8.4.2 HBase 101
8.4.3 MongoDB 102
本章小结 106
习题8 107
第9章 Spark 108
9.1 Spark平台 108
9.1.1 Spark的概念 108
9.1.2 Spark的发展 109
9.1.3 Spark的优点 110
9.1.4 Spark的速度比Hadoop快的原因 110
9.2 Spark生态系统 111
9.2.1 Cluster Manager和Data Manager 112
9.2.2 Spark Runtime 112
9.2.3 高层的应用模块 113
9.3 Spark在医学领域的应用 114
9.3.1 Spark在医学领域的应用场景 114
9.3.2 使用Scala语言开发Spark医学应用程序 115
本章小结 118
习题9 119
第10章 云计算与大数据 122
10.1 云计算概述 122
10.1.1 云计算的概念 122
10.1.2 云计算和大数据的关系 123
10.1.3 云计算的服务模式 124
10.2 云计算的核心技术 125
10.2.1 虚拟化技术 125
10.2.2 资源池化技术 126
10.2.3 云计算的部署模式 127
10.3 云计算在医学领域的应用 128
10.3.1 医疗云 128
10.3.2 移动医疗健康服务云 129
10.3.3 医学科研分析服务云 132
本章小结 142
习题10 142
第11章 大数据在医疗领域的应用 143
11.1 大数据在临床操作领域的应用 143
11.1.1 比较效果研究 143
11.1.2 临床决策支持系统 144
11.1.3 医疗数据透明 145
11.1.4 远程患者监控 146
11.1.5 电子病历分析 146
11.2 大数据在医药及其支付领域的应用 147
11.2.1 多种自动化系统 147
11.2.2 基于卫生经济学和疗效研究的定价计划 148
11.3 大数据在医疗研发领域的应用 149
11.3.1 预测建模 149
11.3.2 临床试验的设计及数据分析 149
11.3.3 个性化治疗 150
11.3.4 疾病模式分析 151
11.4 大数据在新的医疗商业模式的应用 151
11.4.1 汇总患者的临床记录和医疗保险数据集 151
11.4.2 网络平台和社区 151
11.5 大数据在公众健康领域的应用 152
本章小结 153
习题11 153
参考文献 154