《数据流机器学习 MOA实例》PDF下载

购买积分：20 如何计算积分？
作　　者：（法）阿尔伯特·比费特
出版社：
出版年份：2020
ISBN：
页数：0 页

图书介绍：

点击购买此书全本PDF电子书

第一部分概述 2

第1章简介 2

1.1大数据 2

1.1.1工具：开源革命 4

1.1.2大数据带来的挑战 4

1.2实时分析 6

1.2.1数据流 6

1.2.2时间和内存 6

1.2.3应用一览 6

1.3关于本书 7

第2章大数据流挖掘 8

2.1算法 8

2.2分类算法 9

2.2.1如何在数据流中评估分类器 10

2.2.2多数类分类器 11

2.2.3无变化分类器 11

2.2.4惰性分类器 11

2.2.5朴素贝叶斯分类器 12

2.2.6决策树分类器 12

2.2.7集成分类器 13

2.3回归算法 13

2.4聚类算法 14

2.5频繁模式挖掘 14

第3章MOA的实际操作介绍 16

3.1入门开始 16

3.2分类模型的图形用户界面 18

3.3用命令行操作 23

第二部分数据流挖掘 26

第4章数据流和Sketch数据结构 26

4.1背景知识：近似算法 27

4.2集中不等式 28

4.3取样 30

4.4统计总数 31

4.5去重统计 32

4.5.1线性计数 33

4.5.2科恩对数计数器 33

4.5.3 Flajolet-Martin计数器和HyperLogLog算法 34

4.5.4应用：图论的计算距离函数 36

4.5.5讨论：对数与线性 37

4.6频率问题 37

4.6.1 SpaceSaving sketch 38

4.6.2 CM-Sketch算法 40

4.6.3 CountSketch算法 42

4.6.4时刻计算 44

4.7滑动窗口的指数矩形图 45

4.8分布式sketch计算的可合并性 47

4.9一些技术方面的讨论和其他资料 48

4.9.1哈希函数 48

4.9.2创建（ε，δ）近似算法 49

4.9.3其他sketch技术 49

4.10练习 50

第5章处理变化 52

5.1数据流中变化的定义 52

5.2评估器 56

5.2.1滑动窗口和线性评估器 57

5.2.2指数加权移动平均评估器 57

5.2.3单维度卡尔曼滤波器 58

5.3变化探测 58

5.3.1评估变化探测 59

5.3.2 CUSUM 测试和Page-Hinkley测试 59

5.3.3统计测试 60

5.3.4漂移探测法 61

5.3.5自适应滑动窗口算法 62

5.4与其他Sketch和多维数据结合 64

5.5练习 64

第6章分类 66

6.1分类器评估 67

6.1.1误差估算 68

6.1.2分布评估 69

6.1.3性能的评估测量 70

6.1.4统计显著性 72

6.1.5测量挖掘成本 73

6.2基线分类器 73

6.2.1多数类 73

6.2.2无变化分类器 74

6.2.3朴素贝叶斯 74

6.2.4多项式朴素贝叶斯 77

6.3决策树 78

6.3.1估算切分标准 79

6.3.2 Hoeffding决策树 80

6.3.3 CVFDT 82

6.3.4 VFDTc和UFFT 83

6.3.5 Hoeffding适应树 84

6.4处理数字属性 85

6.4.1 VFML 85

6.4.2穷举二叉树 86

6.4.3 Greenwald和Khanna的分位数摘要 86

6.4.4高斯近似 87

6.5感知器模型 88

6.6惰性学习 89

6.7多标签分类器 89

6.8主动学习 91

6.8.1随机策略 92

6.8.2固定不确定策略 93

6.8.3可变不确定策略 93

6.8.4随机不确定策略 94

6.9概念演变 94

6.10 MOA实战操作 95

第7章集成方法 99

7.1准确率加权集成 99

7.2加权多数算法 100

7.3堆叠算法 102

7.4装袋算法 102

7.4.1在线装袋算法 103

7.4.2装袋算法如何应对数据流变化 103

7.4.3杠杆装袋算法 103

7.5提升算法 104

7.6 Hoeffding树集成算法 105

7.6.1 Hoeffding选项树算法 105

7.6.2随机森林算法 105

7.6.3有限的Hoeffding树的感知器堆叠 106

7.6.4自适应大小的Hoeffding树算法 107

7.7重复性概念 107

7.8 MOA实战操作 108

第8章回归 110

8.1什么是回归 110

8.2如何评估回归 111

8.3感知器学习 112

8.4惰性学习 112

8.5决策树学习 112

8.6决策规则 113

8.7 MOA中的回归 114

第9章聚类 115

9.1聚类的评估方法 116

9.2 k-means算法 117

9.3 BIRCH、BICO和CluStream 118

9.4基于密度的方法：DBSCAN和Den-Stream 120

9.5 ClusTree 121

9.6 StreamKM＋＋：核心集 122

9.7延伸阅读 123

9.8 MOA实战操作 124

第10章频繁模式挖掘 127

10.1什么是模式挖掘 127

10.1.1模式的定义和例子 127

10.1.2频繁模式挖掘的批量算法 129

10.1.3闭合模式和最大模式 131

10.2数据流中频繁模式挖掘的方法 131

10.3如何在数据流中进行频繁项集挖掘 134

10.3.1简化为高频繁项 134

10.3.2 Moment算法 135

10.3.3频繁模式数据流算法 135

10.3.4 IncMine算法 136

10.4数据流的频繁子图挖掘 137

10.4.1 WinGraphMiner框架 138

10.4.2 AdaGraphMiner框架 139

10.5延伸阅读 140

10.6练习 141

第三部分MOA软件 144

第11章MOA及其软件体系 144

11.1 MOA架构 145

11.2安装 145

11.3 MOA的近期发展 145

11.4 MOA扩展包 146

11.5 ADAMS优化 147

11.6 MEKA优化 149

11.7 OpenML环境 150

11.8 StreamDM软件 150

11.9 Streams工具 151

11.10 Apache SAMOA流媒体ML库 151

第12章图形用户界面 154

12.1初识图形用户界面 154

12.2分类和回归 154

12.2.1主要任务一览 156

12.2.2数据源和数据生成器 157

12.2.3贝叶斯分类器一览 160

12.2.4决策树一览 160

12.2.5元分类器（集成）一览 161

12.2.6函数分类器一览 162

12.2.7漂移分类器一览 162

12.2.8主动学习分类器 163

12.3聚类 163

12.3.1数据源和数据生成器 163

12.3.2数据流聚类算法一览 163

12.3.3如何进行可视化和数据分析 164

第13章用命令行操作 166

13.1给分类和回归创建学习任务 166

13.2给分类和回归创建评估任务 167

13.3给分类和回归创建学习与评估任务 167

13.4两种分类器的对比 168

第14章调用API 170

14.1 MOA对象 170

14.2选项 170

14.3示例：先序评估 173

第15章在MOA中开发新的方法 175

15.1 MOA中的主要类 175

15.2创建新的分类器 176

15.3编译分类器 183

15.4 MOA中的良好编程方法 183

参考文献 185