大数据视角下的观点挖掘PDF电子书下载

电子书积分：11 积分如何计算积分？
作者：余传明著
出版社：北京：中国社会科学出版社
出版年份：2018
ISBN：9787520330923
页数：281 页

图书介绍：本书共分十二个章节。概述了大数据视角下的观点挖掘的相关研究与不足，提出了大数据环境下所面临的规模跨度、领域跨度以及语言跨度等挑战，从而引出了本书的研究问题。论述了大数据环境下观点挖掘的研究方法，揭示了本书的研究思路和研究框架，包括多领域多语言网络评论的下载、虚假评论的识别、产品名称和属性的识别、观点的极性判断、观点挖掘的领域适配、观点挖掘的语言适配、观点挖掘的规模适配、观点摘要、观点主题分析及可视化展示等。论述了虚假评论的识别问题。从评论利益相关者内容与行为特征相结合的角度出发，提出了一种基于个人、群体和商户的主体关系模型，包括虚假评论识别的行为指标体系、虚假评论者的主体关系建模、模型的参数确定、有效性评估以及模型的适应性分析等，并进行了相应的实证研究。

查看图书目录点击购买PDF全本电子书

上一篇：城市燃气输配与调压操作下一篇：二维过渡金属二硫属化合物的电化学储能应用

《大数据视角下的观点挖掘》目录

标签：视角挖掘观点数据

第一章导论 1

第一节观点挖掘：研究的兴起 1

第二节从小数据到大数据：观点挖掘所面临的挑战 4

第三节大数据环境下的规模跨度问题 6

一潜在语义索引方法 6

二佩奇排名方法 7

三映射／规约架构 8

四 SQL与Hadoop相结合的方法 9

第四节大数据环境下的领域跨度问题 10

一共同特征选择 10

二目标领域文档选择 11

三查询词扩充 11

四迁移学习 12

第五节大数据环境下的语言跨度问题 13

一多语词典构建 14

二语料库对齐 15

三用户反馈和用户行为 16

四领域知识库对齐 17

第六节本章结语 18

第二章大数据环境下的观点挖掘研究方法 19

第一节观点挖掘的形式化定义与研究思路 19

第二节多领域多语言网络评论的下载 22

第三节评论的过滤与分类 23

第四节产品名称和产品属性识别 25

一关联规则法 25

二点互信息法 26

三概率潜在语义分析法 27

四潜在狄利克雷分布法 27

五相关主题模型法 28

六最大熵原理法 29

第五节观点极性判断 30

一基于WordNet的方法 31

二基于连接词的方法 32

三基于点互信息的方法 32

四松弛标记法 33

五条件随机场法 34

第六节领域跨度下的观点挖掘 35

第七节语言跨度下的观点挖掘 37

第八节规模跨度下的观点挖掘 38

第九节观点摘要、主题分析与可视化展示 41

第十节本章结语 42

第三章虚假评论识别 44

第一节虚假评论识别的意义 44

第二节虚假评论识别的相关研究 47

第三节虚假评论识别的行为指标体系 51

一评论个人行为的指标体系 52

二评论者群体行为的指标体系 54

三商家行为的指标体系 55

第四节虚假评论识别的主体关系建模 56

一商户—个人（M-U）关系模型 57

二个人—群体（U-G）关系模型 58

三群体—商家（G-M）关系模型 58

四虚假度迭代流程 59

第五节虚假评论识别的实证研究 60

一实验数据 60

二参数确定及有效性评估 60

三实验分析 64

四与其他方法的对比分析 66

第六节本章结语 66

第四章产品名称识别 68

第一节产品名称识别的问题描述 68

第二节基于最大熵模型的产品名称识别 73

一最大熵模型的理论基础 73

二最大熵模型的参数估计算法 74

三实验数据准备 75

四最大熵模型的特征构建 76

五最大熵模型的特征模板 77

六特征生成 80

七训练与测试 80

八实验结果与分析 81

第三节基于条件随机场模型的产品名称识别 84

一利用条件随机场模型为产品名称识别问题建模 84

二参数估计 85

三模型求解 86

四软件工具的选择 87

五语料库构建 87

六选取特征与特征模板 88

七模型训练与测试 88

八模板对产品名称识别效果的分析 90

九语料库对产品名称识别效果的分析 94

十与其他模型的识别效果比较 96

第四节本章结语 97

第五章产品属性识别 98

第一节产品属性识别的问题描述 98

第二节基于自组织映射的产品属性识别 100

一自组织映射的原理 100

二自定义的属性叠加矩阵及其原理 101

三基于属性叠加矩阵的产品属性识别 102

四网络数据收集 103

五分词与词性标注 104

六 SOM输入矩阵的构造 104

七 SOM训练 105

八 SOM的输出分析 105

第三节基于LDA模型的产品属性识别 109

一 LDA模型的原理 111

二基于LDA模型的评论热点识别 112

三数据预处理 113

四输入向量的构造 113

五模型求解 114

六实验结果与分析 115

第四节基于SVM模型的产品属性分类 119

一支持向量机的原理 119

二基于支持向量机的产品属性识别 121

三网络数据收集 122

四分词与词性标注 122

五主观性标注与产品属性标注 123

六输入矩阵的构建 124

七模型的训练 125

八实验结果及评价 128

第五节本章结语 129

第六章观点的情感分析 131

第一节观点极性分析的问题描述 132

一特征选择及特征权重的研究 132

二基于统计与基于规则的情感分类方法 134

第二节基于改进的TF-IDF权重算法的情感分类 136

一特征选择方法 136

二数据集 137

三评价标准 137

四数据预处理 138

五使用支持向量机的情感分类结果 138

第三节基于情感词典和规则的情感分类 143

一情感类别 143

二情感辞典的构建 143

三分类规则 144

四使用规则组合的情感分类实验 146

第四节本章结语 152

第七章观点挖掘的领域适配 154

第一节相关研究 155

一跨领域情感分析 156

二循环神经网络 158

第二节研究问题与方法 160

一研究问题的形式化定义 160

二 CD-DRNN模型结构 160

三对比方法 163

第三节试验及分析 168

一数据集 168

二实验结果 169

三讨论 176

第四节本章结语 177

第八章观点挖掘的语言适配 179

第一节研究现状 181

一基于机器翻译的方法 181

二基于特征概率分布的方法 182

三基于平行语料的方法 183

四基于深度学习的方法 183

第二节研究问题、模型与方法 185

一研究问题及相关定义 185

二先验特征的获取 186

三模型结构 188

四模型训练方式 190

第三节实验及分析 193

一数据集 193

二比较方法 193

三参数设置 195

四实验结果 197

第四节本章结语 200

第九章观点挖掘的规模适配 201

第一节规模适配问题的提出 201

第二节规模适配平台 204

一 Hadoop平台 204

二 Spark平台 207

第三节规模适配算法 209

一并行决策树算法 209

二并行逻辑回归算法 210

三并行朴素叶斯算法 211

四并行随机森林算法 212

五并行支持向量机算法 214

第四节实验及分析 215

一数据集与实验环境设置 215

二评价指标 216

三实验结果 217

四讨论 222

第五节本章结语 223

第十章观点摘要 225

第一节信息抽取方法 226

一图模型方法 226

二篇章分析方法 227

三结构模板方法 228

第二节主题与语义分析方法 229

第三节统计机器学习方法 231

第四节深度学习用于观点摘要 233

一序列到序列神经网络模型 234

二注意力机制 236

三先验知识 237

四语义相关性 238

第五节本章结语 239

第十一章观点主题分析 240

第一节研究问题 240

第二节相关研究 241

一微博主题分析 241

二微博时序分析 242

三微博可视化分析 244

第三节主题演化模式和时序趋势的方法设计 246

第四节实验过程与结果分析 248

一数据描述和预处理 248

二英文埃博拉微博的主题分析 248

三中文埃博拉微博的主题分析 253

第五节本章结语 259

第十二章总结与展望 260

参考文献 263

相关图书

作者其它书籍

出版社其它书籍

本类热门