数据流知识发现PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:潘怡,何可可,叶晖,刘华富著
- 出 版 社:武汉:华中科技大学出版社
- 出版年份:2016
- ISBN:7568005272
- 页数:210 页
1 绪论 1
1.1 什么是知识发现 1
1.2 知识发现的过程 4
1.3 新型数据流应用 6
1.4 数据流定义及特点 10
1.5 数据流知识发现 12
1.5.1 数据流频繁模式挖掘 12
1.5.2 数据流分类研究 14
1.5.3 数据流聚类 16
1.5.4 数据流离群点检测 17
1.5.5 数据流时序数据分析 18
1.6 海量数据管理与并行及分布式计算 20
1.7 小结 22
2 海量数据管理的关键技术 28
2.1 海量数据硬件平台模型 28
2.1.1 并行计算机体系结构 29
2.1.2 集群并行计算系统 30
2.1.3 虚拟化及云 31
2.2 海量数据系统模型 34
2.2.1 Hadoop框架 34
2.2.2 Google File System-GFS 36
2.2.3 Memcached 37
2.2.4 SimpleDB 38
2.3 海量数据计算的基本算法 38
2.3.1 Map/Reduce 38
2.3.2 BigTable 39
2.3.3 NFS 40
2.3.4 AFS 40
2.4 传统海量数据管理技术 40
2.4.1 并行数据划分 42
2.4.2 并行事务调度 44
2.4.3 并行事务并发控制算法 50
2.5 数据流管理系统 55
2.5.1 STREAM 56
2.5.2 Aurora 57
2.5.3 Medusa 57
2.5.4 Borealis 58
2.5.5 其他 58
2.6 基于CPU和GPU的并行计算 59
2.6.1 并行计算机和模型 59
2.6.2 MPI+OpenMP混合模型 60
2.6.3 基于GPU的并行计算模型 62
2.6.4 基于CUDA的并行计算模型 63
2.6.5 并行数据流分析 64
2.7 小结 66
3 数据流关联规则发现 71
3.1 关联规则挖掘概述 71
3.2 关联规则挖掘典型算法分析 73
3.2.1 基于规则中涉及的数据维数的挖掘算法 73
3.2.2 基于规则中涉及的抽象层次的挖掘算法 75
3.2.3 按变量类别不同而确定的挖掘算法 79
3.3 数据流上频集挖掘核心问题 80
3.3.1 概要数据处理方法 80
3.3.2 滑动窗口处理模型 81
3.3.3 挖掘算法分类 83
3.3.4 挖掘任务分类 84
3.4 基于前缀树的频繁闭项集挖掘PFIT算法 87
3.4.1 问题描述 88
3.4.2 前缀树结构描述 89
3.4.3 构建前缀树 90
3.4.4 挖掘前缀树 92
3.4.5 实验 94
3.5 高效益项集挖掘算法FHUI-Growth 96
3.5.1 关联规则效益度的定义及性质 96
3.5.2 一种快速挖掘高效益项集的算法 99
3.5.3 实验 101
3.6 基于概念格的关联规则挖掘算法 106
3.7 小结 108
4 数据流分类知识发现 113
4.1 数据分类模型与方法 114
4.1.1 数据流单分类器算法 114
4.1.2 数据流集成分类器算法 117
4.2 基于隐马尔可夫模型的流数据分类算法 120
4.2.1 基于隐马尔可夫模型的流数据分类算法 120
4.2.2 马尔可夫链 121
4.2.3 隐马尔可夫模型 122
4.3 基于隐马尔可夫模型的流数据分类算法 124
4.3.1 训练样本优化 124
4.3.2 HMM_SDC算法 125
4.3.3 实验 127
4.3.4 结论 129
4.4 小结 129
5 数据流聚类挖掘 134
5.1 引言 134
5.2 聚类分析 135
5.2.1 相关概念 135
5.2.2 聚类分析中的数据类型 136
5.2.3 主要聚类分析方法分类 140
5.2.4 常见聚类分析方法的分析 141
5.3 数据流聚类算法(methods and algorithms) 151
5.3.1 STREAM算法 151
5.3.2 CluStream算法框架 151
5.3.3 HPStream算法框架 154
5.3.4 E-Stream算法 154
5.3.5 DenStream算法 155
5.3.6 D-Stream算法 156
5.3.7 CFR算法 158
5.4 数据流滤波问题研究 159
5.4.1 受系统参数影响的状态空间模型 159
5.4.2 最小距离设计方法 160
5.4.3 SSUKF-JSIMM算法思想 161
5.4.4 SSUKF-JSIMM算法步骤 162
5.4.5 仿真实验 164
5.5 研究主题 167
5.5.1 一般性主题 167
5.5.2 面向具体应用领域的问题 168
5.6 小结 169
6 时序和序列数据流挖掘 173
6.1 时间序列及其应用 173
6.2 时间序列预测的常用方法 174
6.3 时间序列的相似性搜索 175
6.3.1 基于ARMA模型的时间序列相似性搜索 175
6.3.2 基于离散傅里叶变换的时间序列相似性查找 178
6.3.3 基于规范变换的查找方法 179
6.4 序列模式挖掘简介 181
6.5 序列模式挖掘算法 183
6.5.1 Apriori算法 184
6.5.2 基于划分的模式生长算法 187
6.5.3 基于序列比较的算法 188
6.6 支持约束的序列模式挖掘 190
6.6.1 约束的分类 190
6.6.2 支持约束的序列模式挖掘算法 190
6.7 周期模式挖掘 191
6.8 增量式序列模式挖掘 192
6.9 序列模式挖掘算法的比较分析 194
6.9.1 算法的定性比较 194
6.9.2 算法的时间和空间执行效率比较 195
6.9.3 算法适用范围分析 196
6.10 序列挖掘在生物信息领域的应用 197
6.10.1 蛋白质功能的计算方法简介 197
6.10.2 一种改进的蛋白质功能预测方法PF_WNP[36] 199
6.10.3 实验结果分析 201
6.10.4 结论 205
6.11 小结 206
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《汉语词汇知识与习得研究》邢红兵主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《弹好钢琴必备的五线谱知识》杨青华威武 2019
- 《国家执业药师考试历年真题试卷全解 2015-2019 中药学专业知识 1》黄坤主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《初中物理知识地图》赵端旭 2017
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《大学化学实验》李爱勤,侯学会主编 2016
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017