《网络舆情分析技术》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:王兰成著
  • 出 版 社:北京:国防工业出版社
  • 出版年份:2014
  • ISBN:9787118093032
  • 页数:242 页
图书介绍:本书内容归纳如下。在网络信息智能采集方面深入研究:1.面向主题爬行的网页分块方法;2.具有分块特征信息的模型构建;3.综合内容和链接结构的链接与主题相关性判定等。在网络信息智能分析方面深入研究:1.网络信息的知识模型构建;2.语义特征抽取;3.基于语义的信息聚类和分类策略;4.网络信息倾向性分析等。

第1章 导论 1

1.1 互联网舆情信息 1

1.2 网络舆情采集 2

1.3 网络舆情处理 3

1.4 网络舆情服务 6

1.5 内容概览 7

第2章 网络舆情的分析 10

2.1 网络舆情的信息采集 10

2.1.1 网络舆情的采集方法 10

2.1.2 搜索引擎的研究进展 12

2.1.3 网络信息的分类及其抽取 15

2.2 舆情话题的搜索技术 21

2.2.1 话题搜索的基本原理 21

2.2.2 话题搜索的若干技术 22

2.2.3 主题爬行的实现 27

2.2.4 国内外舆情采集的研究成果 38

2.3 网络舆情的信息处理 43

2.3.1 网络舆情的处理方法 43

2.3.2 网络舆情的信息内容分析 44

2.4 网络舆情的内容分析与服务 45

2.4.1 知识技术及其应用 45

2.4.2 主题舆情内容分析框架 46

2.4.3 国内外舆情分析的研究成果 49

2.5 基于社交网络的舆情传播动力学性质 59

2.5.1 舆情演化模型及评析 59

2.5.2 社交网络特性与舆情传播控制策略 62

2.6 本章小结 68

第3章 基于主题爬行的网络舆情信息抽取和整理 69

3.1 舆情网页的结构特征与分块处理 69

3.1.1 话题标记和页分块 69

3.1.2 基于DOM树的内容分块 72

3.1.3 基于板块位置的布局分块 73

3.1.4 基于视觉特征的结构分块 73

3.2 基于主题爬行的舆情网页分块 74

3.2.1 网页分块的典型应用 74

3.2.2 网页的预处理 77

3.2.3 网页分块的特征提取及其算法 81

3.2.4 舆情内容块的整合 87

3.3 主题网络舆情的语义特征抽取 91

3.3.1 网络舆情语义的特征 91

3.3.2 基于N-Gram的特征抽取及其改进算法 95

3.3.3 基于DOM树分块的特征项权重计算 96

3.4 网络舆情的情报获取与整合 99

3.4.1 网络舆情的情报价值与情报支援 99

3.4.2 网络舆情情报支援系统 101

3.5 本章小结 103

第4章 舆情网页与话题相关性的判定分析 104

4.1 内容相关性的判定方法 104

4.1.1 元数据方法 104

4.1.2 链接标签数据方法 105

4.1.3 链接结构分析方法 106

4.1.4 页面语义信息方法 106

4.2 链接相关性的判定方法 110

4.2.1 链接锚文本标记及其信息提取 111

4.2.2 基于分块的主题链接上下文信息提取 114

4.2.3 基于链接标记和锚文本的主题判定算法 115

4.2.4 基于语义相似度计算的链接判定 116

4.3 舆情网页内容相关性的分析 120

4.3.1 主题特征的选择 120

4.3.2 待识别网页模型的建立 123

4.3.3 话题文本识别算法的选择 125

4.4 舆情网页链接相关性的分析 127

4.4.1 Web超链接的若干分析 127

4.4.2 基于信息链接关系的分析算法 128

4.4.3 增加主题分析的PageRank改进算法 129

4.5 本章小结 132

第5章 基于本体的网络舆情分析 134

5.1 本体理论概述 134

5.1.1 本体概念与分类 134

5.1.2 面向舆情分析的本体作用 136

5.1.3 通用本体构建的几种方法 137

5.2 基于本体的主题网络舆情知识模型 138

5.2.1 舆情的本体知识源 138

5.2.2 本体的主题舆情构建策略 139

5.2.3 知识模型中的本体库架构 142

5.3 主题网络舆情SIPO本体的实现方案 144

5.3.1 本体构建的规则 144

5.3.2 SIPO本体的实现步骤 144

5.3.3 一个舆情事件的本体实例 146

5.4 本章小结 148

第6章 基于SIPO的网络舆情信息聚类和分类 150

6.1 语义特征抽取转换 150

6.1.1 语义转换及概念特征生成 150

6.1.2 概念映射匹配算法分析 151

6.2 网络舆情信息的聚类与分类 152

6.2.1 Web文本信息的聚分类 153

6.2.2 利用SIPO本体的聚分类 156

6.2.3 SIPO的语义聚分类分析 157

6.3 基于SIPO本体的语义相似度计算 158

6.3.1 SIPO概念语义相似度 158

6.3.2 增加语义特征的文本相似度计算 160

6.4 基于语义的主题网络舆情信息聚类 164

6.4.1 舆情信息聚类流程分析 164

6.4.2 基于语义相似计算模型的凝聚层次聚类算法 165

6.5 基于语义的主题网络舆情信息分类 166

6.5.1 舆情信息分类流程分析 166

6.5.2 基于语义相似计算模型的KNN分类算法 167

6.6 本章小结 169

第7章 网络舆情采集与处理的功能实现及其评测 170

7.1 SIPO原型系统的功能框架 170

7.2 开发工具和平台概述 173

7.3 舆情采集实验与结果分析 176

7.3.1 实验数据选取和测试指标 177

7.3.2 URL与主题相关性判定算法测试 178

7.3.3 舆情采集应用分块方法的效果测试 180

7.4 舆情信息聚类实验与结果分析 181

7.4.1 实验数据选取和测试指标 181

7.4.2 基于语义的聚类分析实验方法 183

7.4.3 实验结果及分析 183

7.5 舆情信息分类实验与结果分析 185

7.5.1 基于语义的舆情分类实验方法 185

7.5.2 实验结果及分析 186

第8章 基于情感本体的网络舆情倾向性分析 188

8.1 网络舆情的倾向性分析 188

8.2 网络舆情倾向性识别方法及比较 189

8.2.1 基于文本分类的倾向性识别 189

8.2.2 基于语义规则的倾向性识别 189

8.2.3 基于情感词的倾向性识别 190

8.3 情感本体的构建方法 191

8.3.1 HowNet和领域语料的情感概念选择 191

8.3.2 整合多情感概念的情感本体构建 192

8.3.3 基于HowNet和领域语料库的本体话题构建 193

8.4 基于情感本体的主题舆情倾向性分析 194

8.4.1 特征词情感倾向度计算 194

8.4.2 增加程度级别的特征词权重计算 195

8.4.3 基于情感本体的倾向性分析过程 196

8.5 网络舆情倾向性分析实验与结果分析 196

8.5.1 实验方法 196

8.5.2 实验结果及分析 197

8.6 本章小结 198

第9章 面向知识挖掘的网络舆情信息服务 199

9.1 基于网络论坛的舆情话题追踪 199

9.1.1 话题追踪的方法与分析 199

9.1.2 基于文本图的话题追踪模型 201

9.1.3 文本概念图的生成与关键词识别 202

9.1.4 语义相关度的计算及追踪话题的更新 206

9.1.5 舆情话题追踪实验与结果分析 207

9.2 网络舆情检索系统中的查询主题分类 213

9.2.1 查询分类的方法与分析 213

9.2.2 基于语义知识的查询分类模型 215

9.2.3 文档目录图上的查询词扩展 216

9.2.4 目录图上的查询分类识别 217

9.2.5 查询主题分类实验与结果分析 219

9.3 舆情事件网页内容的词汇关联分析 222

9.3.1 基于词跨度的事件内容关键词获取 222

9.3.2 基于共现次数统计的词汇关联分析 225

9.3.3 网络舆情事件的词汇关联实验与结果分析 227

9.4 本章小结 229

参考文献 230

后记 236