第1章短文本理解及其应用 1
1.1短文本理解 1
1.2短文本理解研究现状 3
1.2.1短文本理解模型概述 3
1.2.2短文本理解模型粒度分析 10
1.3短文本理解框架 12
第2章基于概率的属性提取与推导 15
2.1引言 15
2.2属性提取 19
2.2.1属性提取的整体框架 19
2.2.2概率isA网络 20
2.2.3基于概念和基于实体的属性提取 21
2.3属性得分推导 25
2.3.1典型度得分 26
2.3.2根据CB列表计算典型度 26
2.3.3根据IB列表计算典型度 27
2.3.4典型度聚合 30
2.3.5同义属性集合 32
2.4相关研究 32
2.5小结 33
第3章 单实体概念化模型 34
3.1引言 34
3.1.1基本层次类别 34
3.1.2应用 36
3.1.3 BLC计算方法 37
3.2语义网络 38
3.3基本层次类别化 39
3.3.1典型性 39
3.3.2将典型性用于BLC 40
3.3.3将平滑典型性用于BLC 41
3.3.4将PMI用于BLC 42
3.3.5将Rep(e, c)用于BLC 43
3.4小结 45
第4章 基于概念化的短文本理解 46
4.1引言 46
4.2预备知识 49
4.2.1概念 50
4.2.2概念聚类 50
4.2.3属性 51
4.2.4整体框架和符号表示 51
4.3挖掘词汇关系 52
4.3.1概述 52
4.3.2解析 53
4.3.3 P(z | t)推导 53
4.3.4 P(c|t, z)推导 53
4.3.5语义网络 55
4.4查询理解 56
4.4.1方法概况 56
4.4.2算法 57
4.5小结 60
第5章基于概念化的短文本主题词与修饰词检测 61
5.1引言 61
5.2整体框架 65
5.3非限定性修饰词挖掘 67
5.4限定性修饰词挖掘 69
5.4.1 Probase:一个大规模的isA知识库 69
5.4.2实体级别主题词-修饰词 70
5.4.3概念级别主题词-修饰词 71
5.5主题词与修饰词检测 75
5.5.1解析 75
5.5.2针对两个组件的主题词-修饰词检测 76
5.5.3针对两个以上组件的主题词-修饰词检测 77
5.6相关工作 78
5.7小结 80
第6章 基于概念化的词相似度计算 82
6.1引言 82
6.2语义网络和同义词集合 85
6.3基本方法 87
6.3.1类型判别 87
6.3.2语境表示 88
6.3.3语境相似度 88
6.3.4讨论 89
6.4改进方法 90
6.4.1概念聚类 91
6.4.2 Max-Max相似度计算方法 94
6.4.3聚类删减优化 96
6.5相关工作 97
6.6小结 99
第7章 基于概念化的海量竞价关键字匹配 100
7.1引言 100
7.2语义网络 103
7.3系统框架 104
7.4概念化 105
7.4.1实体检测 105
7.4.2词义推导 106
7.4.3消除歧义 107
7.5检索 110
7.5.1基于点击数据的候选竞价关键字选择 111
7.5.2基于概念的候选竞价关键字选择 111
7.5.3排名 113
7.6相关工作 113
7.7小结 114
第8章 短文本理解研究展望 115
8.1知识语义网 115
8.2显性知识和隐性知识的结合 116
参考文献 118