第1章 绪论 1
1.1 信息内容安全概念 1
1.1.1 信息内容安全定义及内涵 1
1.1.2 信息内容安全威胁 2
1.1.3 信息内容安全起因 3
1.2 信息内容安全与信息安全关系 4
1.2.1 学科外延及内涵的关系 4
1.2.2 学科科学研究方法区别 5
1.2.3 学科专业规范区别 6
1.3 信息内容安全管理体系 8
1.3.1 基于戴明环的信息内容安全管理框架 8
1.3.2 信息内容安全管理体系构建 9
1.4 信息内容安全与法律 11
1.4.1 促进信息内容安全发展的重要法规 11
1.4.2 打击互联网信息内容安全犯罪相关法律 13
1.4.3 互联网信息内容安全相关管理处罚规定 14
1.5 本章小结 15
参考文献 15
本章习题 15
第2章 网络信息内容获取技术 17
2.1 网络信息内容获取模型 17
2.2 搜索引擎技术 18
2.2.1 网上采集算法 20
2.2.2 排级算法 20
2.2.3 搜索引擎与垃圾信息关系 23
2.3 数据挖掘技术 24
2.3.1 数据挖掘技术历程 24
2.3.2 Web挖掘技术 25
2.3.3 Web文本挖掘技术 26
2.4 信息推荐技术 26
2.4.1 信息推荐概念和形式化定义 26
2.4.2 推荐算法 27
2.5 信息还原技术 30
2.5.1 电脑还原技术 30
2.5.2 网页还原技术 31
2.5.3 多媒体信息还原技术 35
2.6 本章小结 36
参考文献 36
本章习题 38
第3章 文本内容安全 40
3.1 文本预处理技术 40
3.1.1 分词技术 41
3.1.2 文本表示 43
3.1.3 文本特征提取与缩维 44
3.2 文本内容分析 46
3.2.1 文本语法分析方法 46
3.2.2 文本语义分析方法 50
3.2.3 文本语用分析方法 56
3.3 文本内容安全应用 62
3.3.1 基于内容的网页过滤 62
3.3.2 基于内容的网络监控 63
3.4 本章小结 65
参考文献 65
本章习题 69
第4章 网络多媒体内容安全 70
4.1 概述 70
4.2 网络不良图像内容识别 71
4.2.1 肤色检测 72
4.2.2 纹理分析 75
4.2.3 其他特征 77
4.2.4 不良图像的识别 77
43网络不良视频内容识别 80
4.3.1 网络视频流的发现 80
4.3.2 网络视频流流量的获取 81
4.3.3 视频时域分割 82
4.3.4 视频关键帧提取 82
4.4 网络不良音频内容识别 84
4.4.1 音频数据预处理 84
4.4.2 短时音频特征 85
4.4.3 基于隐马尔科夫模型的不良音频识别 88
本章小结 90
参考文献 90
本章习题 94
第5章 电子邮件内容安全 95
5.1 电子邮件概论 95
5.1.1 电子邮件通信原理 95
5.1.2 电子邮件格式标准 97
5.1.3 电子邮件传输协议 99
5.1.4 电子邮件的内容安全 100
5.2 垃圾邮件概述 100
5.2.1 垃圾邮件的定义 100
5.2.2 垃圾邮件产生的原因 101
5.2.3 垃圾邮件的危害 101
5.2.4 垃圾邮件发送手段分析 102
5.2.5 反垃圾邮件技术 103
5.3 垃圾邮件的特征提取 105
5.3.1 垃圾邮件的特征分析 105
5.3.2 垃圾邮件的预处理技术 107
5.4 垃圾邮件的过滤技术 108
5.4.1 基于黑白名单的过滤技术 109
5.4.2 基于关键字的过滤技术 111
5.4.3 基于统计的内容过滤技术 112
5.4.4 基于规则的内容过滤技术 114
5.4.5 基于行为识别的过滤技术 116
5.4.6 图片垃圾邮件的过滤技术 118
5.4.7 基于过滤器的反垃圾邮件的局限性 120
5.5 本章小结 122
参考文献 122
本章习题 123
第6章 手机短信内容安全 124
6.1 短信传播模型 124
6.1.1 手机短信息 124
6.1.2 SMS短信 124
6.1.3 手机短信的传播特性 126
6.2 不良内容短信识别 129
6.2.1 不良内容短信简介 129
6.2.2 不良内容短信的发送方式 130
6.2.3 基于短信内容的识别技术 131
6.2.4 基于用户的识别 133
6.2.5 现有不良内容短信识别方法的缺陷 135
6.3 短信热点话题分析 136
6.3.1 短信热点及其分析必要性 136
6.3.2 短信话题发现 137
6.3.3 短信话题热度评析 140
6.4 本章小结 140
参考文献 140
本章习题 141
第7章 网络内容安全态势评估 142
7.1 概述 142
7.1.1 网络内容脆弱性分析 142
7.1.2 网络内容安全态势评估概念 143
7.2 网络内容安全态势评估模型 144
7.2.1 安全评估 144
7.2.2 网络内容安全态势评估模型 148
7.2.3 网络内容安全态势评估发展 149
7.3 网络内容安全态势评估指标体系 150
7.3.1 评估指标的选取原则 150
7.3.2 评估指标的选取方法 151
7.3.3 指标体系分析 152
7.3.4 网络内容安全等级划分 155
7.4 网络内容安全态势预测与可视化 155
7.4.1 态势预测技术 155
7.4.2 可视化技术 157
7.5 本章小结 158
参考文献 158
本章习题 159
第8章 信息内容安全与对抗 161
8.1 中文主动干扰概念和方法 161
8.1.1 中文主动干扰原因 161
8.1.2 中文主动干扰概念 162
8.1.3 中文主动干扰方法 163
8.1.4 中文主动干扰效果评估 165
8.2 抗中文主动干扰的柔性中文处理算法 167
8.2.1 柔性中文串匹配算法 168
8.2.2 基于意会关键词柔性匹配的文本特征信息提取算法 171
8.3 基于粗糙集与贝叶斯决策的不良网页过滤算法 175
8.3.1 引言 175
8.3.2 粗糙集理论 176
8.3.3 粗糙集与贝叶斯决策的网页过滤方法 176
8.3.4 算法设计 178
8.3.5 算例与仿真结果 180
8.4 定制的互联网舆情监测分析系统 184
8.4.1 系统概述 184
8.4.2 系统功能 185
8.4.3 舆情处理结果展示 189
8.4.4 系统管理 191
8.4.5 系统部署 192
8.5 本章小结 193
参考文献 194
本章习题 195
第9章 信息内容安全实践 196
9.1 网络数据包的获取与分析 196
9.1.1 网络数据捕获技术简介 196
9.1.2 Lnux和Windows下的网络数据捕获 197
9.1.3 基于Winpcap的数据包捕获程序设计 199
9.1.4 Ethereal使用介绍 201
9.2 Web页面的获取与分析 204
9.2.1 Heritrix概述 204
9.2.2 Heritrix架构分析 204
9.2.3 Heritrix实战 207
9.2.4 Heritrix定制开发 214
9.3 中文语言处理技术 226
9.3.1 ICTCLAS简介 226
9.3.2 ICTCLAS使用 227
9.4 小结 231
参考文献 232