第一篇 理论篇 3
第1章 绪论 3
1.1大数据的概念 3
1.1.1大数据的特征 3
1.1.2大数据的分类 4
1.1.3大数据挖掘的应用示例 5
1.2本书背景 7
1.2.1流式大数据挖掘的过程 7
1.2.2构建流式大数据挖掘服务平台需求分析 10
1.3国内外相关研究进展 12
1.3.1流式大数据挖掘技术的发展 12
1.3.2流式大数据挖掘服务平台的历史发展和现状 14
1.4全书组织结构 15
第2章 云计算与云环境 17
2.1云计算的概念 17
2.2云计算的层次 18
2.3云计算服务的发展现状 20
2.4云环境下的流式大数据采集方法 25
第3章 元理论 28
3.1元的概念 28
3.2元数据 29
3.2.1数据仓库领域的元数据 29
3.2.2情报学领域的元数据 29
3.2.3面向对象程序设计领域的元数据 29
3.2.4流式大数据挖掘服务平台的元数据和元建模 29
3.2.5 OMG元数据体系结构 30
3.2.6数据挖掘元数据和元模型的研究现状 32
3.3元建模视角下的流式大数据挖掘服务平台构建思路 33
第4章 预测模型标记语言的扩展理论 35
4.1预测模型标记语言 35
4.1.1面向数据挖掘的PMML 35
4.1.2 PMML的缺陷 37
4.2语义Web的逻辑学基础 39
4.2.1语义Web 39
4.2.2描述逻辑家族 42
4.2.3基于描述逻辑设计EPMML的理念 44
4.3描述逻辑DL4PMML 44
4.4扩展预测模型标记语言 45
4.4.1 EPMML元类 46
4.4.2 EPMML复杂元类 46
4.4.3 EPMML属性 47
4.4.4 EPMML个体 48
4.4.5 EPMML属性约束 48
4.4.6 EPMML辅助语言元素 49
4.5 EPMML与OWL的比较 50
4.6本章小结 50
第二篇 建模篇 55
第5章 基于EPMML的流式大数据挖掘服务平台元数据分析与验证 55
5.1流式大数据挖掘服务平台元数据 55
5.2基于EPMML的知识表示 57
5.3基于EPMML的知识推理 62
5.3.1 DL4PMML的推理复杂性 63
5.3.2 EPMML元数据一致性检测框架 64
5.4知识推理和一致性检测示例 65
5.4.1语义一致性示例 65
5.4.2冲突检测示例 65
5.5本章小结 67
第6章 基于EPMML的流式大数据挖掘服务平台的数据组件建模 68
6.1流式大数据挖掘的形式化数据模型 68
6.1.1流式数据的信息系统模型 69
6.1.2面向流式大数据挖掘的决策逻辑语言 70
6.1.3概念的内涵和外延 71
6.1.4概念迁移的实质 71
6.2流式大数据上规则提取的解释 72
6.2.1规则的质量度量 72
6.2.2关联规则的解释 73
6.2.3决策规则的解释 76
6.3流式大数据挖掘服务平台数据组件的建模 77
6.4实例演示与分析 78
6.5本章小结 84
第7章 基于EPMML的流式大数据挖掘服务平台的算法组件建模 86
7.1流式大数据挖掘服务平台算法管理框架 86
7.1.1框架的设计原则 86
7.1.2 AMF-DSMS的描述 87
7.1.3 AMF-DSMS的执行语义 89
7.2基于EPMML的算法管理组件建模 90
7.2.1基于EPMML的算法服务描述 90
7.2.2基于EPMML的算法接口设计 93
7.3实例演示与分析 95
7.3.1算法选择的必要性 95
7.3.2算法选择与优化 97
7.4本章小结 100
第8章 流式大数据挖掘服务平台框架的设计 101
8.1系统框架的整体设计 101
8.2系统框架对流式大数据的适应性 105
8.3系统框架的行为设计 106
8.4流式大数据挖掘服务平台的建模层次结构 107
8.5系统中的EPMML元数据 109
8.6本章小结 111
第9章 结束语 112
9.1本书的主要贡献 112
9.2研究成果的意义 113
9.3元建模理论的总结 114
9.4流式大数据挖掘算法管理的总结 114
9.5关于EPMML的总结 116
参考文献 117
后记 127