第1章 绪论 1
1.1 信息内容安全概述 1
1.2 信息内容安全威胁 2
1.3 信息内容安全特点及其与相关学科的联系 2
1.4 信息内容安全研究现状 3
1.4.1 政府部门主导的项目 3
1.4.2 科研院所或公司的项目与产品 4
1.5 信息内容安全研究的意义 4
1.6 本章小结 5
1.7 习题 5
第2章 网络信息内容的获取 6
2.1 互联网信息类型 6
2.1.1 网络媒体信息 6
2.1.2 网络通信信息 8
2.2 网络媒体信息获取原理 8
2.2.1 网络媒体信息获取理想流程 8
2.2.2 网络媒体信息获取的分类 11
2.2.3 网络媒体信息获取的技术难点 13
2.3 网络媒体信息获取方法 13
2.3.1 需身份认证静态媒体发布信息获取 13
2.3.2 内嵌脚本语言片段的动态网页信息获取 17
2.3.3 基于浏览器模拟实现网络媒体信息获取 20
2.4 网络通信信息获取方案 24
2.5 本章小结 25
2.6 习题 25
第3章 文本信息的特征抽取和选择 26
3.1 文本特征的抽取和选择概述 26
3.2 语义特征的抽取 27
3.2.1 词级别语义特征 27
3.2.2 亚词级别语义特征 29
3.2.3 语义与语用级别语义特征 30
3.2.4 汉语的语义特征抽取 30
3.3 特征子集选择 31
3.3.1 停用词过滤 32
3.3.2 文档频率阈值法 33
3.3.3 TF-IDF 34
3.3.4 信噪比 34
3.3.5 信息增益 35
3.3.6 卡方统计 36
3.4 特征重构 36
3.4.1 词干 36
3.4.2 知识库 37
3.4.3 潜在语义索引 37
3.5 向量生成 40
3.5.1 局部系数 40
3.5.2 全局系数 41
3.5.3 规范化系数 41
3.5.4 几种常见的组合方式 41
3.6 本章小结 42
3.7 习题 42
第4章 音频信息特征抽取 43
4.1 数字音频技术概述 43
4.2 人类的听觉感知 44
4.3 音频信号分析和编码 47
4.3.1 音频信号的特征分析 47
4.3.2 音频信号的数字编码 48
4.3.3 数字音频信号的解析 48
4.4 音频信息特征抽取 49
4.4.1 基于帧的音频特征 50
4.4.2 基于片段的音频特征 51
4.5 本章小结 52
4.6 习题 53
第5章 图像信息特征抽取 54
5.1 数字图像的表示方法 54
5.2 图像颜色特征提取 56
5.2.1 颜色直方图特征 56
5.2.2 颜色聚合矢量特征 59
5.2.3 颜色矩特征 60
5.2.4 其他颜色特征 61
5.3 图像纹理特征提取 61
5.3.1 灰度共生矩阵 61
5.3.2 Gabor小波特征 62
5.3.3 Tamura特征 63
5.3.4 纹理特征 64
5.4 其他图像特征 64
5.4.1 边缘特征 64
5.4.2 轮廓特征 65
5.5 本章小结 66
5.6 习题 66
第6章 信息处理模型和方法 67
6.1 文本模式匹配算法 67
6.1.1 经典单模式匹配算法 67
6.1.2 经典多模式DFSA匹配算法 71
6.2 分类算法 73
6.2.1 线性分类器 74
6.2.2 最近邻分类法 75
6.2.3 支持向量机 76
6.2.4 传统Bayes分类方法 78
6.2.5 向量空间模型法 79
6.3 本章小结 80
6.4 习题 81
第7章 信息过滤 82
7.1 信息过滤概述 82
7.1.1 信息过滤研究的历史 83
7.1.2 信息过滤的分类体系 84
7.1.3 信息过滤的应用 86
7.1.4 信息过滤的评价 86
7.2 内容安全的信息过滤 87
7.2.1 信息过滤与其他信息处理的异同 87
7.2.2 用户过滤和安全过滤 88
7.2.3 现有信息过滤系统及技术 90
7.3 基于匹配的文本过滤 92
7.3.1 特征字串匹配查全率估算 93
7.3.2 准确率估算试验 94
7.4 基于邻近类别分类的过滤 95
7.5 本章小结 96
7.6 习题 97
第8章 数字水印 98
8.1 数字水印概述 98
8.1.1 数字水印的历史 98
8.1.2 数字水印的现状 99
8.1.3 数字水印分类 101
8.1.4 数字水印基本要求 102
8.1.5 数字水印的应用领域 104
8.1.6 数字水印的发展趋势 106
8.2 数字水印理论与模型 108
8.2.1 系统数学模型 108
8.2.2 数字水印的一般定义 108
8.2.3 数字水印的基本特性 109
8.2.4 数字水印与密码学的区别 110
8.3 数字音频水印技术 113
8.3.1 数字音频水印算法 113
8.3.2 数字音频水印攻击 114
8.3.3 数字音频水印算法评价准则 116
8.4 数字图像水印技术 116
8.4.1 数字图像水印算法 116
8.4.2 数字图像水印攻击 119
8.4.3 数字图像水印评价准则 121
8.5 数字视频水印技术 123
8.5.1 数字视频水印算法 123
8.5.2 数字视频水印攻击 126
8.5.3 数字视频水印技术的特殊要求 127
8.6 一种基于DCT视频水印的改进算法 128
8.6.1 算法模型介绍 128
8.6.2 算法基本思想 129
8.6.3 嵌入算法步骤 129
8.6.4 提取算法步骤 130
8.6.5 仿真试验分析 131
8.7 本章小结 136
8.8 习题 136
第9章 网络舆情监测与预警系统 137
9.1 舆情系统的背景和应用范围 137
9.1.1 现状 137
9.1.2 舆情系统的发展趋势 139
9.1.3 舆情系统的应用 142
9.2 舆情系统的功能分解 143
9.2.1 技术发展背景 143
9.2.2 高仿真网络信息深度提取 148
9.2.3 高性能信息自动提取机器人技术 149
9.2.4 基于语义的海量文本特征快速提取与分类 150
9.2.5 多媒体群件理解技术 151
9.2.6 非结构信息自组织聚合表达 152
9.2.7 非结构信息数据挖掘技术 153
9.3 互联网论坛信息分析 154
9.3.1 面向互联网论坛的定点网站深入挖掘机制 155
9.3.2 异构数据归一化存储与目标站点热点查询 156
9.3.3 监控目标热点自动发现功能 156
9.4 本章小结 157
9.5 习题 157
参考文献 158