《垃圾邮件识别与处理技术研究》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:李志敏著
  • 出 版 社:北京:北京理工大学出版社
  • 出版年份:2015
  • ISBN:9787568206600
  • 页数:173 页
图书介绍:本书共分五章。第一章绪论,其内容包括研究介绍电子邮件系统结构,垃圾邮件定义、特征、历史、现状、分类,以及对垃圾邮件过滤技术发展的概述;第二章阐述了基于内容的垃圾邮件过滤技术工作过程。第三章 本章针对基于内容过滤技术的局限性,对基于行为识别过滤与人工免疫算法进行了研究,并揭示其规律性。第四章将混合型P2P结构应用于垃圾邮件过滤技术中,设计了基于超节点的Anti-Spam P2P网络结构并研究了该网络的查询策略;研究了垃圾邮件发送行为识别平台,改进了消息查询、转发以及结果返回机制;设计了基于JXTA的垃圾邮件识别器。第五章图像型垃圾邮件过滤技术研究,详细分析了图像型垃圾邮件的特点,并深入探讨其检测方式。

第1章 垃圾邮件过滤概述 1

1.1 电子邮件简介 1

1.1.1 电子邮件的结构 1

1.1.2 电子邮件系统的组成 2

1.2 垃圾邮件的定义 3

1.3 垃圾邮件的由来、特征及危害 4

1.4 垃圾邮件的现状 7

1.5 垃圾邮件的分类 8

1.6 垃圾邮件的防治方法 9

1.7 垃圾邮件过滤技术发展的阶段 10

1.7.1 第一代垃圾邮件过滤技术 10

1.7.2 第二代垃圾邮件过滤技术 12

1.7.3 第三代垃圾邮件过滤技术 14

1.7.4 第四代垃圾邮件过滤技术 14

第2章 基于内容的垃圾邮件过滤技术研究 15

2.1 基于内容的过滤技术工作过程 15

2.1.1 邮件预处理 15

2.1.2 文本分类 17

2.1.3 结果处理 18

2.2 邮件分词算法 18

2.2.1 提取邮件文本 18

2.2.2 垃圾邮件过滤中的中文分词 19

2.2.3 文本表示 23

2.3 特征选择 25

2.3.1 特征选择方法及其在邮件过滤中的应用 25

2.3.2 互信息算法的研究及改进 27

2.4 基于贝叶斯的邮件分类 33

2.4.1 分类算法 33

2.4.2 评价体系 39

2.4.3 Weka分类简介 40

2.4.4 垃圾邮件最终处理方式 40

本章小结 41

第3章 基于邮件行为的垃圾邮件过滤技术研究 42

3.1 基于内容过滤技术的局限 43

3.1.1 垃圾邮件发送原理 43

3.1.2 基于内容过滤技术的局限性 43

3.2 基于行为识别的垃圾邮件过滤技术 44

3.2.1 行为识别技术概述 44

3.2.2 MTA 邮件过滤原理 46

3.2.3 邮件头内容分析 47

3.3 基于人工免疫算法的垃圾邮件行为识别技术 48

3.3.1 免疫算法 49

3.3.2 人工免疫算法在垃圾邮件行为识别模块中的应用 51

本章小结 56

第4章 基于P2P协作的垃圾邮件发送行为识别技术研究 57

4.1 P2P技术概述 57

4.1.1 P2P网络简介 57

4.1.2 JXTA技术概述 59

4.2 垃圾邮件发送行为识别平台研究 62

4.2.1 P2P网络资源搜索模式及其分析 63

4.2.2 Anti-Spam P2P网络结构设计 65

4.2.3 Anti-Spam P2P网络协作查询策略研究 68

4.3 基于P2P协作的垃圾邮件发送行为识别技术研究 74

4.3.1 基于JXTA的垃圾邮件识别器的体系结构设计 74

4.3.2 信息列表、消息、广告的定义 76

4.3.3 垃圾邮件发送行为识别算法 78

4.3.4 算法开销的理论分析 82

4.4 基于P2P协作的垃圾邮件发送行为识别技术的实现 83

4.4.1 Anti-Spam P2P网络的组建 83

4.4.2 基于P2P协作的垃圾邮件发送行为识别算法的实现 89

4.5 实验及结果分析 97

4.5.1 实验环境 97

4.5.2 实验数据 98

4.5.3 实验结果 99

4.5.4 垃圾邮件过滤性能的比较与分析 99

本章小节 102

第5章 图像型垃圾邮件过滤技术研究 103

5.1 图像型垃圾邮件过滤技术综述 103

5.1.1 图像型垃圾邮件的起源 103

5.1.2 图像型垃圾邮件的检测难点 103

5.1.3 图像型垃圾邮件特征的分析 106

5.1.4 图像型垃圾邮件的分类算法 110

5.1.5 算法性能的评价标准 112

5.2 基于圆形模板的角点检测算法 114

5.2.1 经典的SUSAN角点检测算法 115

5.2.2 改进的彩色边缘检测算子 119

5.2.3 圆形模板设计与角点检测 124

5.2.4 实验结果与性能分析 129

5.3 ECTL文本区域定位算法 130

5.3.1 主流文本区域定位算法分析 131

5.3.2 ECTL文本区域定位算法 133

5.3.3 实验结果分析 140

5.4 基于文本区域特征的图像型垃圾邮件识别算法 143

5.4.1 文本区域及图像属性特征分析 145

5.4.2 文本区域及图像属性特征提取与归一化 146

5.4.3 实验结果分析 148

5.5 基于颜色与角点特征的图像型垃圾邮件识别算法 152

5.5.1 颜色与角点特征分析 153

5.5.2 颜色与角点特征提取 156

5.5.3 实验结果分析 157

5.5.4 鲁棒性验证及分析 160

5.5.5 两种算法与主流算法的对比分析 164

本章小结 166

参考文献 167