《基于语义约束主题模型的商品特征和情感词提取研究》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:彭云
  • 出 版 社:北京:北京理工大学出版社
  • 出版年份:2017
  • ISBN:9787568249621
  • 页数:119 页
图书介绍:为了更多地提取符合语义要求的细粒度特征词和情感词,改善主题模型对于中文商品评论文本语义理解能力的不足,本书提出了语义约束主题模型并进行了相关研究。首先从句法依存、词义理解和语境相关等角度获取语义关系,并将语义关系转化为LDA模型容易识别和方便嵌入的方式;然后在LDA模型中嵌入语义先验知识来影响不同层级的词语分布关系,构建语义约束LDA主题模型,指导LDA提取符合语义要求的特征词和情感词,并实现特征级别的细粒度情感分析。

第1章 引言 1

1.1 研究背景与意义 1

1.2 国内外研究现状概述 3

1.2.1 词语频繁度及共现规则方法 4

1.2.2 机器学习方法 4

1.2.3 句法依存关系分析方法 5

1.2.4 主题模型的方法 6

1.3 研究现状评述 8

1.4 主要研究内容和总体研究框架 9

1.5 结构安排 11

第2章 基于主题模型的特征词和情感词提取相关技术 12

2.1 主题模型概述 12

2.1.1 LSA模型 13

2.1.2 PLSA模型 13

2.1.3 LDA模型 16

2.2 特征词和情感词提取中的典型主题模型 21

2.3 本章小结 31

第3章 词聚类主题模型 32

3.1 问题的提出 32

3.2 相关研究 32

3.3 词聚类算法 34

3.3.1 词义相似度计算 34

3.3.2 上下文相关度计算 35

3.3.3 聚类距离计算 37

3.4 WC-LDA模型设计 37

3.4.1 模型结构 37

3.4.2 主题—词语隶属规则 38

3.5 实验结果与分析 39

3.5.1 数据集选择及设置 39

3.5.2 评价标准 39

3.5.3 特征词抽取的比较及分析 40

3.6 本章小结 42

第4章 关联约束主题模型 43

4.1 问题的提出 43

4.2 相关研究 44

4.3 关联约束知识的提取 45

4.3.1 无特征情感词的关联组合 45

4.3.2 低频情感词与特征词的关联组合 47

4.3.3 次级特征词与局部特征词的关联组合 47

4.4 AC-LDA模型设计 48

4.4.1 全局特征词的识别 48

4.4.2 AC-LDA的约束机制 49

4.4.3 AC-LDA模型结构 49

4.4.4 模型参数估计 51

4.5 实验结果与分析 52

4.5.1 数据集选择及设置 52

4.5.2 评价标准 53

4.5.3 不同模型的比较分析 54

4.5.4 模型的性能分析 59

4.6 本章小结 61

第5章 语义关系约束主题模型 62

5.1 问题的提出 62

5.2 相关研究 63

5.3 语义关系图的构建 64

5.3.1 特征词之间的语义关系获取 65

5.3.2 特征词和情感词之间的语义关系获取 66

5.3.3 情感词和情感词之间的语义关系获取 68

5.3.4 语义关系图的融合 69

5.4 SRC-LDA模型设计 70

5.4.1 语义约束机制 70

5.4.2 SRC-LDA模型结构 71

5.4.3 模型参数估计 72

5.5 实验结果与分析 73

5.5.1 数据集选择及设置 73

5.5.2 评价标准 73

5.5.3 不同模型的比较分析 74

5.5.4 模型性能分析 78

5.6 本章小结 80

第6章 语义弱监督主题模型 81

6.1 问题的提出 81

6.2 研究现状 82

6.3 算法及模型设计思路 83

6.3.1 特征词和情感词的语义约束关系获取 83

6.3.2 主题的多极性情感隶属分配 84

6.3.3 加入情感层和语义约束的SWS-LDA模型 84

6.4 SWS-LDA模型设计 84

6.4.1 主题的情感分配设计 84

6.4.2 多极性决策二叉树的构造 86

6.4.3 SWS-LDA约束设计 86

6.4.4 SWS-LDA结构设计 87

6.4.5 SWS-LDA参数估计 88

6.5 实验结果与分析 89

6.5.1 数据集选择及设置 89

6.5.2 评价标准 89

6.5.3 实验比较分析 90

6.6 本章小结 92

第7章 结论与展望 93

附录 96

参考文献 107