当前位置:首页 > 文化科学教育体育
方面级观点挖掘理论与方法
方面级观点挖掘理论与方法

方面级观点挖掘理论与方法PDF电子书下载

文化科学教育体育

  • 电子书积分:9 积分如何计算积分?
  • 作 者:吕品等著
  • 出 版 社:北京:科学出版社
  • 出版年份:2015
  • ISBN:9787030461858
  • 页数:156 页
图书介绍:随着信息科技的发展,人类进入了大数据时代。挖掘互联网上海量主观性文本已成为决策支持的重要手段。从产品消费、服务、医疗保健、金融服务、再到社会事件和政治选举,观点挖掘几乎渗透到现实生活中每一个可能的领域。这些实际的应用为观点挖掘的研究提供了强烈的动机。本书在分析观点挖掘相关理论和相关技术研究现状基础上,阐述了方面级观点挖掘方法的分类、如何利用CRF方法以及主题模型进行方面级观点挖掘、以及在观点挖掘环境下实体和方面的指代消解研究。实现了在线评论的智能化观点挖掘,故本书书名为《在线评论方面级观点挖掘理论与方法》,并进一步研究将观点挖掘的结果应用于用户满意度评价及产品属性绩效类型界定方法。每部分研究工作详细描写了背景、问题、研究思路、实验结果、结论与总结等。各部分工作相关,又独成体系,可读性好。
《方面级观点挖掘理论与方法》目录

第1章 观点挖掘 1

1.1 从数据挖掘到观点挖掘 1

1.2 观点挖掘的含义及应用 2

1.3 观点挖掘研究 4

1.3.1 观点挖掘的不同级别 4

1.3.2 情感词典及相关问题 5

1.3.3 自然语言处理问题 6

1.4 垃圾观点检测 6

第2章 观点挖掘目标 8

2.1 实体与观点 8

2.2 观点挖掘的目标 10

2.3 观点文摘 13

2.3.1 方面级观点文摘的特点 13

2.3.2 方面级观点文摘的改进 15

2.3.3 方面级对比观点文摘 18

2.3.4 传统短文本文摘 18

第3章 方面级观点挖掘方法 20

3.1 方面抽取 20

3.1.1 基于频率的方法 20

3.1.2 基于关系的方法 21

3.1.3 混合方法 23

3.1.4 监督学习方法 24

3.1.5 主题模型方法 26

3.2 方面分类 29

3.3 方面情感分类 31

第4章 基于CRF的方面级观点挖掘 34

4.1 挖掘方法 34

4.1.1 准备符号标记与训练集 34

4.1.2 定义学习函数 36

4.1.3 训练CRF模型 36

4.1.4 CRF模型的使用 37

4.2 实验 38

4.2.1 数据集 38

4.2.2 性能评估方法 38

4.2.3 用CRF挖掘中文评论的实验结果 39

4.2.4 差异显著性检验 40

4.2.5 CRF方法与其他方法挖掘中文评论的比较 42

第5章 主题模型的设计决策 44

5.1 主题因素 44

5.1.1 全局主题与局部主题 44

5.1.2 主题与方面的映射 45

5.1.3 基于约束的方面分类 45

5.1.4 基于需求的方面分类 45

5.2 情感因素 46

5.2.1 情感层 46

5.2.2 情感之间的依赖 47

5.2.3 情感与方面的分离 47

5.2.4 情感先验信息 48

5.3 相关因素的实现技术 48

5.3.1 主题因素的实现 48

5.3.2 情感因素的实现 52

5.4 相关因素的选取策略 55

第6章 基于TMDP的方面级观点挖掘 58

6.1 TMDP模型 58

6.1.1 模型参数的物理含义 58

6.1.2 模型表示 59

6.1.3 模型生成过程GP-TMDP 61

6.1.4 参数τ的设置 62

6.2 模型参数估计 62

6.2.1 基于collapsed吉布斯抽样的主题参数估计算法Gibbs-TE 62

6.2.2 基于情感预测的主题-方面映射算法TAMSP 65

6.2.3 基于collapsed吉布斯抽样的方面-情感分离参数估计算法Gibbs-ASS 66

6.3 实验结果及分析 67

6.3.1 数据集 67

6.3.2 主题与方面对应关系的定性分析 68

6.3.3 主题与方面对应关系的定量分析 70

6.3.4 局部主题对方面识别的贡献 72

6.3.5 观点词识别的性能分析 74

6.3.6 观点词…和方面词之间关联的评估 76

6.3.7 特征选择对方面与情感分离的影响 77

6.3.8 标签数据尺寸对方面与情感分离的影响 78

6.3.9 不同领域数据集对方面与情感分离的影响 79

第7章 基于TMPP的方面级观点挖掘 81

7.1 TMPP模型 81

7.1.1 基于短语级参数学习的主题模型演化 81

7.1.2 基于短语级参数学习的主题模型中的参数 83

7.1.3 模型生成过程 85

7.2 模型参数估计 85

7.2.1 AR-PLSI模型参数估计 85

7.2.2 AR-LDA模型的参数估计 86

7.2.3 ARI模型的参数估计 88

7.3 实验结果及分析 90

7.3.1 数据集 90

7.3.2 方面识别分析 91

7.3.3 等级预测分析 92

7.3.4 模型的适应性分析 95

第8章 基于CRF的实体和方面的指代消解 99

8.1 已有的指代消解方法 99

8.2 针对观点挖掘环境提出的新特征 100

8.2.1 观点极性一致性特征 101

8.2.2 实体和方面与观点词的关系特征 101

8.3 新特征的实验分析 102

8.3.1 数据集与特征集 102

8.3.2 基线方法 103

8.3.3 新特征的实验结果分析 104

8.4 基于CRF的指代消解 105

8.4.1 约束化局部训练CLT 105

8.4.2 基于CLT的指代消解 106

8.4.3 基于CLT的指代消解实验验证 109

8.4.4 CLT的优化 110

8.4.5 基于CLT的指代消解方法与分类方法的比较 114

第9章 用户满意度评价及产品属性绩效类型界定 116

9.1 情感词相似性判定选择 117

9.2 基于协同过滤推荐算法的用户对产品情感满意度排序 118

9.2.1 用户情感满意度评价指标体系 118

9.2.2 构建用户对产品的评分矩阵 119

9.2.3 构建用户相似集 120

9.2.4 求解用户情感满意度推荐排序分值及结论 120

9.3 基于雷达图法的产品属性绩效类型界定 121

9.3.1 产品绩效评价指标体系 121

9.3.2 产品绩效评价指标的指标权重 123

9.3.3 基于雷达图法的产品属性绩效类型的判据界定 126

9.3.4 基于雷达图指标赋权值的分数值求法 127

9.3.5 产品绩效特征类型界定雷达图 129

9.4 基于灰色评估法的用户满意度评价 129

9.4.1 用户满意度评测指标体系 130

9.4.2 用户满意度的灰色评估模型 131

9.4.3 用户满意度的灰色评价仿真运算 133

9.4.4 软件实现的程序流程 136

9.4.5 求解用户满意度评价因素用户等级结论值 136

参考文献 139

相关图书
作者其它书籍
返回顶部