第1章 引言 1
1.1 研究背景与意义 1
1.2 国内外研究现状概述 3
1.2.1 词语频繁度及共现规则方法 4
1.2.2 机器学习方法 4
1.2.3 句法依存关系分析方法 5
1.2.4 主题模型的方法 6
1.3 研究现状评述 8
1.4 主要研究内容和总体研究框架 9
1.5 结构安排 11
第2章 基于主题模型的特征词和情感词提取相关技术 12
2.1 主题模型概述 12
2.1.1 LSA模型 13
2.1.2 PLSA模型 13
2.1.3 LDA模型 16
2.2 特征词和情感词提取中的典型主题模型 21
2.3 本章小结 31
第3章 词聚类主题模型 32
3.1 问题的提出 32
3.2 相关研究 32
3.3 词聚类算法 34
3.3.1 词义相似度计算 34
3.3.2 上下文相关度计算 35
3.3.3 聚类距离计算 37
3.4 WC-LDA模型设计 37
3.4.1 模型结构 37
3.4.2 主题—词语隶属规则 38
3.5 实验结果与分析 39
3.5.1 数据集选择及设置 39
3.5.2 评价标准 39
3.5.3 特征词抽取的比较及分析 40
3.6 本章小结 42
第4章 关联约束主题模型 43
4.1 问题的提出 43
4.2 相关研究 44
4.3 关联约束知识的提取 45
4.3.1 无特征情感词的关联组合 45
4.3.2 低频情感词与特征词的关联组合 47
4.3.3 次级特征词与局部特征词的关联组合 47
4.4 AC-LDA模型设计 48
4.4.1 全局特征词的识别 48
4.4.2 AC-LDA的约束机制 49
4.4.3 AC-LDA模型结构 49
4.4.4 模型参数估计 51
4.5 实验结果与分析 52
4.5.1 数据集选择及设置 52
4.5.2 评价标准 53
4.5.3 不同模型的比较分析 54
4.5.4 模型的性能分析 59
4.6 本章小结 61
第5章 语义关系约束主题模型 62
5.1 问题的提出 62
5.2 相关研究 63
5.3 语义关系图的构建 64
5.3.1 特征词之间的语义关系获取 65
5.3.2 特征词和情感词之间的语义关系获取 66
5.3.3 情感词和情感词之间的语义关系获取 68
5.3.4 语义关系图的融合 69
5.4 SRC-LDA模型设计 70
5.4.1 语义约束机制 70
5.4.2 SRC-LDA模型结构 71
5.4.3 模型参数估计 72
5.5 实验结果与分析 73
5.5.1 数据集选择及设置 73
5.5.2 评价标准 73
5.5.3 不同模型的比较分析 74
5.5.4 模型性能分析 78
5.6 本章小结 80
第6章 语义弱监督主题模型 81
6.1 问题的提出 81
6.2 研究现状 82
6.3 算法及模型设计思路 83
6.3.1 特征词和情感词的语义约束关系获取 83
6.3.2 主题的多极性情感隶属分配 84
6.3.3 加入情感层和语义约束的SWS-LDA模型 84
6.4 SWS-LDA模型设计 84
6.4.1 主题的情感分配设计 84
6.4.2 多极性决策二叉树的构造 86
6.4.3 SWS-LDA约束设计 86
6.4.4 SWS-LDA结构设计 87
6.4.5 SWS-LDA参数估计 88
6.5 实验结果与分析 89
6.5.1 数据集选择及设置 89
6.5.2 评价标准 89
6.5.3 实验比较分析 90
6.6 本章小结 92
第7章 结论与展望 93
附录 96
参考文献 107