第一部分 大数据分析理论基础 1
atrain分布式系统(ADS):面向任何四维特征大数据的可变规模数据架构 1
1 引言 2
2 r-train(train)和r-atrain(atrain):大数据数据结构 3
2.1 类数组 3
2.2 面向同构大数据的同构数据结构r-train 4
2.3 r-atrain(atrain):面向大数据的高效异构数据结构 11
3 立体矩阵和立体类矩阵(用于大数据和暂存大数据) 19
3.1 立体矩阵和立体类矩阵 19
3.2 三维立体矩阵及其特点 20
4 (元素为数值的)立体矩阵代数运算 22
5 面向立体矩阵/类矩阵的同构数据结构MT 24
5.1 三维立体矩阵(三维立体类矩阵)的应用 25
6 异构矩阵和异构类矩阵:异构大数据的存储模型 31
7 用于大数据的atrain分布式系统 32
7.1 atrain分布式系统 32
7.2 用于ADS的“多马拉车”拓扑结构和循环拓扑结构 33
8 atrain分布式系统中的异构数据结构r-atrain 36
8.1 在ADS中r-atrain的数据类 37
8.2 环形train和环形atrain 40
8.3 面向大数据的ADS内r-atrain的基本操作 41
9 用于大数据立体异构类矩阵的异构数据结构MA 43
10 结论 45
参考文献 46
大数据时序预测模型:基于模糊神经网络的混合方法 48
1 引言 48
2 模糊集基础 50
3 混合模糊-神经网络与大数据时间序列 51
3.1 神经网络:综述 51
3.2 混合模糊-神经网络方法:应用于大数据时序预测问题的新方法 51
4 数据集描述 53
5 方法与算法 54
5.1 EIBD方法 54
5.2 大数据时序预测模型算法 55
6 面向大数据的模糊神经网络预测模型 55
7 性能分析参数 58
8 实证分析 59
8.1 M因子预测 60
8.2 双因子预测 61
8.3 三因子预测 61
8.4 统计显著性 61
9 结论与讨论 62
参考文献 62
基于混合智能技术的学习方法 63
1 引言 63
2 基于智能混合粒子群和快速约简算法的基因选择方法 65
2.1 粒子群算法 67
2.2 算法步骤 67
2.3 算法执行与结果 69
3 面向癌症分类问题的基于粗糙集的混合基因选择 71
3.1 粗糙集 71
3.2 基于基因选择的粗糙集方法 72
3.3 有监督条件下的基于相关性的约简算法(CFS-RST) 73
3.4 算法执行与结果 73
4 面向微阵列数据分类精度增强的混合数据挖掘技术(CFS-PLS) 74
4.1 SIMPLS与分类框架中的维度约简 75
4.2 偏最小二乘回归 76
4.3 算法执行与结果 77
5 结论 79
6 工作展望 80
参考文献 80
智集及其在决策中的应用 83
1 引言 83
2 单值智集 84
3 多个单值智集的距离、相似性与熵 86
3.1 两个智集之间的距离 86
3.2 两个单值智集间的相似性 88
4 区间值智集软集 93
4.1 软集 93
4.2 区间智集软集 93
4.3 IVNSS在决策支持中的应用 98
5 结论 99
参考文献 99
第二部分 面向大数据分析的框架结构 101
一种用于数据聚类和大数据分析的高效分组遗传算法 101
1 引言 102
2 定义 104
3 算法 105
3.1 编码 106
3.2 适应度函数 108
3.3 选择算子 109
3.4 交叉算子 109
3.5 变异算子 111
3.6 取代和精英策略 113
3.7 局部搜索 113
4 聚类分析的验证 113
5 实验与评价 114
5.1 数据集 114
5.2 结果 116
6 结论 118
参考文献 119
用于大规模优化的Nelder Mead交叉Log-Logistic突变自组织迁移算法 122
1 引言 122
2 自组织迁移算法 124
3 NMSOMA-M算法 126
3.1 NM交叉算子 126
3.2 Log-Logistic突变算子 127
3.3 NMSOMA-M算法步骤 127
4 基准函数 129
5 基准问题的数值结果 131
6 结论 141
参考文献 141
面向数据分析的大数据应用纵览 143
1 引言 143
2 医疗领域的大数据 145
3 大数据分析框架 146
3.1 大数据 146
3.2 数据的预处理 147
3.3 训练集 147
3.4 数据挖掘技术 147
3.5 描述和可视化 148
4 结果和实现 149
5 结论 152
参考文献 152
脑电信号基本原理及其在医疗领域的应用 155
1 引言 155
2 脑电波 156
2.1 自发的脑电图波 156
2.2 事件相关电位 157
2.3 基于脑电图的系统的组成 159
3 视觉刺激生成 160
4 脑信号的处理 161
4.1 预处理 161
4.2 特征提取 162
4.3 特征选择与压缩 164
4.4 分类 165
5 结论 166
6 未来展望 166
参考文献 166
第三部分 大数据分析及云计算 169
大数据:基于云技术的数据密集型应用处理 169
1 引言 169
2 云计算及大数据 170
2.1 云技术为大数据提供的优势 171
3 云计算中的大数据处理所面临的挑战 171
3.1 数据获得和存储 172
3.2 数据传输 173
3.3 数据策管 173
3.4 数据分析 175
3.5 数据可视化 176
4 大数据云工具:一种新的技术手段 176
4.1 基于MapReduce的大数据处理 177
4.2 基于Hadoop的大数据处理 177
4.3 Cloudant 179
4.4 Xeround 180
4.5 StormDB 180
4.6 SAP 180
4.7 Rackspace 180
4.8 MongoLab 180
4.9 MicrosoftAzure 181
4.10 Google Cloud SQL 181
4.11 Garantia Data 181
4.12 EnterpriseDB 181
4.13 Amazon Web Services 181
5 结论 182
参考文献 182
基于模型驱动的异构云框架 184
1 引言 184
2 背景 185
2.1 云计算 185
2.2 模型驱动工程 187
2.3 使用多个云的必要性 187
2.4 迁移的难点 188
3 应用至云端的现代化技术 190
3.1 已有的技术 190
4 云应用的可移植性问题 192
5 已提出的方法 193
6 结论 196
参考文献 196
基于云端的大数据分析:广域网优化技术与解决方案 198
1 引言 198
2 广域网优化 200
2.1 问题及挑战 200
3 广域网优化技术 201
3.1 面向视频监控的广域网优化 202
4 提高应用性能的工具 202
4.1 蓝衣应用辅助网络 203
5 广域网优化设备 203
6 广域网优化控制器 203
6.1 面向大数据和批量数据传输的补充广域网优化控制器 204
6.2 广域网优化控制器的比较:评估供应商和产品 205
7 广域网优化应用于大数据分析 205
7.1 广域网优化的大数据分析的关键趋势 206
7.2 大数据下广域网优化的驱动 206
8 广域网优化解决方案 206
8.1 Infineta系统和Q架构 207
8.2 BIG-IP广域网优化管理 207
8.3 边缘虚拟服务器基础架构 208
8.4 EMCIsilon和Silver Bank 广域网优化 209
8.5 F5 广域网优化模块 210
8.6 BIG-IP 广域网优化模块 210
8.7 面向甲骨文数据库快速复制的F5广域网优化 211
9 未来发展研究趋势 211
9.1 虚拟数据环境和云服务中的广域网优化 211
9.2 广域网优化产品的局限性 212
9.3 加速数据迁移与广域网优化 212
10 结论 213
参考文献 213
基于云计算的电子政务方案:案例分析 215
1 引言 215
2 ACME发展部管理系统 216
3 云方案 218
3.1 技术方案构架 219
3.2 模块式aDAMS方案 219
4 结论 222
参考文献 223