第1章 绪论 1
1.1 智能感知的中文信息处理研究 1
1.2 研究背景 2
1.3 研究内容 3
1.4 本书的组织结构 4
第2章 汉语框架网络工程的构建 5
2.1 汉语框架网络工程的背景 5
2.1.1 框架语义学 5
2.1.2 FrameNet工程 6
2.1.3 FrameNet与WordNet的比较 7
2.1.4 FrameNet与PropBank的比较 8
2.1.5 其他语种的FN研究 9
2.2 汉语框架网络工程的构建 10
2.2.1 CFN的语义描述体系 11
2.2.2 汉语框架网络知识库管理系统 14
2.3 句法语义角色自动标注研究 20
2.3.1 浅层语义分析 21
2.3.2 CFN的句法语义分析任务 23
2.3.3 层叠条件随机场模型 25
2.3.4 条件随机场工具包及参数设定 27
2.3.5 评测标准 33
2.3.6 标注实验及结果分析 33
2.4 本章小结 37
第3章 中文阅读理解语料库的构建 39
3.1 阅读理解研究背景及意义 39
3.1.1 阅读理解任务描述及研究背景 39
3.1.2 阅读理解的特点及其与问题回答的区别 46
3.1.3 中文阅读理解研究存在的问题 47
3.2 阅读理解语料库的现状 47
3.2.1 Remedia语料库 48
3.2.2 CBC4Kids语料库 48
3.2.3 BRCC语料库 48
3.3 中文阅读理解语料库的构建 48
3.3.1 语料选材 49
3.3.2 句子切分 50
3.3.3 编写问句、标注答案句 50
3.4 基础构建技术 52
3.4.1 指称指代关系标注 52
3.4.2 词法分析 53
3.4.3 语料库的目标词索引 55
3.5 句法语义角色标注 56
3.5.1 CRCC文本中的目标词选定 56
3.5.2 基于CFN标注属于同一框架的目标词元所在句子 56
3.5.3 基于CFN标注属于不同框架的同一目标词元所在句子 57
3.5.4 基于CFN标注有多个目标词的句子 57
3.5.5 CRCC正文标注总结 58
3.5.6 CRCC问句标注总结 59
3.6 本章小结 60
第4章 最大熵模型 62
4.1 最大熵原理概述 62
4.2 最大熵模型 64
4.3 参数估计 68
4.3.1 IIS算法 69
4.3.2 L-BFGS算法 73
4.4 本章小结 74
第5章 中文阅读理解问答系统 75
5.1 阅读理解问答系统研究现状 75
5.2 最大熵模型的特征表示 82
5.2.1 词层面的特征 82
5.2.2 句法层面的特征 83
5.3 中文阅读理解问答系统流程 85
5.4 实验结果及性能分析 86
5.4.1 训练/测试集的选取 86
5.4.2 系统评价方法 87
5.4.3 训练和测试 88
5.5 本章小结 90
第6章 总结 91
6.1 本书总结 91
6.2 本书的意义 93
附录A 框架示例 95
附录B 词元“增加”的标注句子示例 104
附录C 标注CRCC中的目标词所用到的73个中文框架的框架名 107
附录D 目标词所支配成分的通用非核心FEs、PTs、GFs表 108
参考文献 109