第1章 绪论 1
1.1 概述 1
1.1.1 网络舆情的概念 2
1.1.2 网络舆情的特点 4
1.1.3 微博舆情的特点 5
1.1.4 网络舆情的发展阶段 6
1.1.5 网络舆情的传播规律 9
1.2 国内外研究现状 10
1.2.1 舆情传播网络结构和模型研究 11
1.2.2 舆情传播的理论模型和一般规律 13
1.2.3 网络舆情监测的相关关键技术 14
1.3 舆情信息分析系统 17
1.3.1 系统背景 17
1.3.2 系统概述 17
1.3.3 系统架构 17
1.3.4 功能描述 18
1.4 内容和章节安排 19
参考文献 19
第2章 舆情信息的收集 23
2.1 概述 23
2.2 网页的结构 25
2.2.1 HTML中的标记符 26
2.2.2 DOM树 27
2.3 网页的爬取 28
2.3.1 爬虫的基本原理 29
2.3.2 链接URL的选择 30
2.3.3 爬虫遵循的规则 32
2.3.4 网页更新 33
2.3.5 多线程爬取 34
2.3.6 分布式策略 35
2.3.7 动态网页的爬取 36
2.4 网页信息的提取 37
2.4.1 信息提取与信息检索的区别 38
2.4.2 信息提取方法 38
2.4.3 信息提取的评价标准 41
2.5 基于模板的舆情信息提取系统 42
2.5.1 主要信息源 43
2.5.2 网页爬虫模块 43
2.5.3 网页信息提取模块 46
2.5.4 网页信息自动提取方案 48
2.6 系统设计 50
2.7 本章小结 53
参考文献 53
第3章 舆情信息的内容分析 55
3.1 概述 55
3.2 信息预处理 57
3.2.1 分词处理 58
3.2.2 向量空间模型 61
3.2.3 特征降维 62
3.3 舆情信息内容识别 64
3.3.1 舆情内容特征库构建 64
3.3.2 舆情文本分类 65
3.3.3 舆情文本聚类 67
3.3.4 舆情内容识别评测 71
3.4 舆情话题发现 75
3.4.1 热点分析 75
3.4.2 话题发现 77
3.4.3 话题跟踪 79
3.5 舆情情感分析 80
3.5.1 情感建模 81
3.5.2 情感词库的建立 83
3.5.3 情感分析方法 85
3.6 舆情观点挖掘 88
3.6.1 观点规则库构建 89
3.6.2 观点分类和聚类 91
3.6.3 观点倾向性分析 92
3.7 系统设计 94
3.8 本章小结 100
参考文献 100
第4章 舆情信息结构分析 102
4.1 舆情网络的构建 102
4.2 舆情网络分析基础 103
4.2.1 节点扩散能力 103
4.2.2 整体扩散能力 105
4.2.3 聚集性 106
4.2.4 关键节点 106
4.3 舆情网络的社区结构分析 108
4.3.1 社区发现与话题识别 108
4.3.2 常见的社区发现方法 109
4.3.3 基于节点扩展的社区发现 113
4.3.4 基于节点合并的社区发现 127
4.4 舆情网络的演化 140
4.4.1 网络扩散能力演化 140
4.4.2 网络社区结构演化 142
4.5 舆情网络的行为分析 143
4.5.1 舆情的定义与分级 144
4.5.2 行为分析 145
4.5.3 网络行为分析的具体步骤 146
4.5.4 舆情网络行为分析实例 150
4.6 本章小结 154
参考文献 154
第5章 舆情的传播与控制 157
5.1 舆情传播模型 157
5.1.1 三种基本的传播模型 157
5.1.2 考虑人类活动时间特性的传播模型 162
5.1.3 考虑人类活动空间模式的传播模型 169
5.2 舆情传播的影响因素 174
5.2.1 初始信息源的影响 174
5.2.2 混合中心性指标下初始节点对传播的影响 179
5.2.3 网络结构的影响 187
5.3 舆情趋势预测 190
5.3.1 预测模型 191
5.3.2 模型库建立与预测 193
5.3.3 实验结果及分析 195
5.4 舆情控制策略 198
5.4.1 概述 198
5.4.2 随机免疫 198
5.4.3 关键节点免疫策略 199
5.4.4 关键链路免疫策略 200
5.4.5 其他免疫策略 200
5.4.6 舆情控制实例 201
5.5 本章小结 205
参考文献 205