表格目录 1
插图目录 1
第1章 绪论 2
1.1 研究背景 2
1.2 研究对象与意义 6
1.2.1 研究对象 6
1.2.2 研究意义 7
1.3 研究文献综述 8
1.3.1 研讨文本数据分析简述 8
1.3.2 在线研讨中欺骗问题研究简述 15
1.3.3 社会化媒体数据集成研究简述 20
1.3.4 决策支持系统研究简述 24
1.3.5 研究评述 34
1.4 研究问题的提出 36
1.5 研究思路与本书框架 37
1.5.1 研究思路 37
1.5.2 研究方法 37
1.5.3 研究内容 39
1.5.4 技术路线 42
1.6 本书主要创新之处 43
第2章 支持在线研讨意义构建的文本分析方法研究 48
2.1 引言 48
2.2 在线研讨中的意义构建与语言行为视角 49
2.2.1 意义构建理论 49
2.2.2 语言行为视角 50
2.2.3 基于LAP的文本分析框架 52
2.3 研究假设 53
2.3.1 会话主题拆解理论假设 53
2.3.2 连贯性分析理论假设 55
2.3.3 言语行为分类理论假设 63
2.3.4 意义构建理论假设 64
2.4 基于LAP的文本分析系统 67
2.4.1 会话主题拆解 69
2.4.2 连贯性分析 73
2.4.3 言语行为分类 78
2.4.4 言语行为树 82
2.5 小结 84
第3章 LTAS系统的实验与评估 86
3.1 实验总体设计 86
3.2 实验1:会话主题拆解算法的实验与评估 88
3.2.1 实验设计 88
3.2.2 性能指标 89
3.2.3 结果与讨论 90
3.3 实验2:连贯性分析方法的实验与评估 93
3.3.1 实验2a:连贯性分析特征 93
3.3.2 实验2b:连贯性分析方法对比实验 95
3.4 实验3:言语行为分类算法的实验与评估 100
3.4.1 言语行为类别定义 101
3.4.2 言语行为人工标注 102
3.4.3 结果与讨论 105
3.5 实验4:面向意义构建的信息质量分析 107
3.5.1 实验4a: SATrees与Conversation Tree的准确性比较 107
3.5.2 实验4b:社交网络中心性测量 109
3.6 实验5:面向意义建构的用户实验 113
3.6.1 面向意义建构的问卷设计 113
3.6.2 实验设计 114
3.6.3 测试实验与数据收集 116
3.6.4 结果与讨论 118
3.7 小结 120
第4章 在线研讨过程中欺骗识别研究 124
4.1 引言 124
4.2 在线评论欺骗行为相关研究 126
4.2.1 欺骗的定义 126
4.2.2 欺骗理论 127
4.2.3 文体分析研究 133
4.2.4 文本分类方法概述 134
4.3 数据集的构建 138
4.3.1 虚假评论的构建 138
4.3.2 真实评论的构建 140
4.4 特征选取 140
4.4.1 词语词频 141
4.4.2 信息丰富度 141
4.4.3 内容信服度 144
4.4.4 特征汇总 145
4.5 在线评论欺骗识别系统设计 146
4.5.1 系统架构 146
4.5.2 预处理 147
4.5.3 特征抽取 148
4.5.4 文本分类 148
4.6 结果与讨论 149
4.6.1 实验设计 149
4.6.2 三种分类算法的实验结果 150
4.6.3 词语词频特征集分析 152
4.6.4 感觉特征集分析 152
4.6.5 词性特征分析 153
4.6.6 语言接近程度特征分析 155
4.6.7 分类技术比较分析 155
4.7 小结 156
第5章 面向研讨问题的网络民意分析研究 158
5.1 背景介绍 158
5.2 相关研究 160
5.2.1 网络民意与网络舆论 160
5.2.2 文本意见挖掘 162
5.2.3 在线研讨中的利益相关者 162
5.3 面向研讨问题的网络民意建模 164
5.3.1 网络评论网页采集 165
5.3.2 HTML页面的解析 165
5.3.3 面向研讨问题的主题分析 167
5.3.4 相似度计算 168
5.3.5 利益相关群体提取 169
5.3.6 情感分析 170
5.3.7 “主题—利益相关群体—情感”模型 171
5.4 应用案例与分析 172
5.4.1 网络评论数据 172
5.4.2 决策问题解析 173
5.4.3 网络民意建模 173
5.5 小结 176
第6章 结论 178
6.1 本书的主要工作与创新点 178
6.2 研究不足及展望 181
附录1意义构建实验问卷 183
附录2虚假评论问卷 186
附录3真实评论问卷 189
附录4 ICTPOS词性标注集及含义 192
参考文献 193