当前位置:首页 > 工业技术
中文问答系统技术及应用
中文问答系统技术及应用

中文问答系统技术及应用PDF电子书下载

工业技术

  • 电子书积分:8 积分如何计算积分?
  • 作 者:张巍著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2016
  • ISBN:9787121282706
  • 页数:144 页
图书介绍:本书全面、系统地介绍中文问答系统的原理及应用研究。分受限域问答系统及开放域问答系统进行了论述,对于受限域问答系统,讨论了医院领域本体构建,常问问题库及本体库抽取答案技术以及推理技术在问答系统中的应用。对于开放域问答系统,讨论了问题分类技术、关键词扩展技术及利用问答对库抽取答案的技术。全书共分15章,前7章为受限域问答系统,后6章为开放域问答系统,最后两章为总结。
《中文问答系统技术及应用》目录

第1章 绪论 1

1.1 中文问答系统研究 1

1.1.1 研究背景 1

1.1.2 研究意义 2

1.2 问答系统国内外研究现状 3

1.3 问答系统的分类 4

第一部分 受限域问答系统 10

第2章 受限域问答系统及本体 10

2.1 本书受限域问答系统研究内容 10

2.2 本书第一部分结构 11

2.3 本体语言简介 12

2.3.1 本体的概念 12

2.3.2 本体描述语言OWL 12

2.4 “医院”领域本体的构建 13

2.4.1 医学知识的特点 13

2.4.2 利用Protégé构建“医院”领域本体 14

2.5 实验及结果分析 17

2.5.1 本体构建实验 17

2.5.2 本体推理实验——阿莫西林与抗感染药推理过程 19

2.5.3 实验结果分析 19

第3章 面向FAQ库的问答策略 23

3.1 问题库的建设 23

3.2 基于常问问题集的问答策略分析 25

3.2.1 索引表的建立 25

3.2.2 句子相似度计算策略1——基于统计和语义的方法 25

3.2.3 句子相似度计算策略2——基于依存句法和改进编辑距离的方法 29

3.2.4 FAQ库的更新 31

3.3 实验及结果分析 32

3.3.1 实验评测标准 32

3.3.2 实验结果及分析 32

第4章 面向本体知识库的问答策略 36

4.1 本体知识库问答模块概述 36

4.2 问句浅层语义分析 37

4.2.1 语义块定义规则 37

4.2.2 问句向量 41

4.2.3 语义块的判定 42

4.2.4 语义块冲突的处理 42

4.3 问句处理实验结果及分析 43

4.4 本体查询模块答案的抽取 44

4.5 实验及结果分析 46

4.6 面向本体知识库的问答策略的不足与展望 47

第5章 Jena推理及在问答系统中的应用 48

5.1 推理机研究 48

5.1.1 推理机的功能 48

5.1.2 本体推理机 48

5.2 Jena研究 50

5.2.1 Jena及其结构 50

5.2.2 Jena2推理机 51

5.3 实验设计及实现 52

5.3.1 Jena推理实验一 52

5.3.2 Jena推理实验二 54

5.3.3 实验结果分析 55

第6章 SWRL及Jess推理在问答系统中的应用 56

6.1 SWRL架构及表示方式 56

6.2 基于本体的SWRL及Jess推理系统框架 57

6.3 推理系统的实现框架 58

6.4 推理过程 58

6.4.1 SWRL规则的建立 58

6.4.2 SWRL规则及OWL本体知识转换 61

6.5 实验及结果分析 61

6.5.1 在Protégé 3.4.1环境下的实验 61

6.5.2 在MyEclipse环境下的实验 63

6.5.3 实验结果分析 65

第7章 城域医院问答检索系统的实现 66

7.1 系统的构建意义 66

7.2 系统设计原则 66

7.3 系统总体结构 66

7.4 系统实现与分析 67

第二部分 开放域问答系统 72

第8章 开放域问答系统概述 72

8.1 开放域问答系统的特点 72

8.2 开放域问答系统的基本结构 72

8.3 本书第二部分结构 73

第9章 基于语义特征的中文问题分类方法 75

9.1 《知网》简介 75

9.2 问题的表示 77

9.3 问题预处理和关键词提取 78

9.4 问题分类特征的选取与表示 79

9.4.1 问题疑问词的提取 79

9.4.2 问题的核心关键词在《知网》中的主要义原的提取 80

9.4.3 命名实体的提取 84

9.4.4 单/复数的提取 84

9.4.5 问句分类特征的向量表示 85

9.5 问题分类算法 85

9.5.1 支持向量机 85

9.5.2 KNN算法 88

9.5.3 最大熵算法 89

9.6 问题分类体系 90

9.7 中文问题分类实验 90

9.7.1 实验方案 90

9.7.2 实验数据 91

9.7.3 评价标准 92

9.7.4 实验结果和实验分析 92

第10章 基于《同义词词林》和《知网》的关键词扩展 95

10.1 关键词扩展的意义 95

10.2 信息检索中的同义词 96

10.3 《同义词词林》及其扩展版 97

10.4 基于《知网》的词语相似度计算 98

10.5 利用《同义词词林》扩展,利用《知网》精简的关键词扩展 99

10.6 实验结果及其讨论 100

10.6.1 同义词扩展实验 100

10.6.2 扩展查询实验 101

第11章 答案源的获取方法研究 102

11.1 网页采集 102

11.2 网页去重 106

11.2.1 网页的预处理 106

11.2.2 网页去重的处理方法 107

11.2.3 网页去重算法测评 111

11.3 信息提取 111

11.3.1 网页净化 111

11.3.2 DOM树的概念 112

11.3.3 模糊归类算法 113

11.3.4 节点影响度因子 114

11.3.5 算法综述 114

11.3.6 实验设计与结果 115

11.4 基于百度知道的问答对库的建立 117

11.4.1 百度知道问答社区简介 117

11.4.2 建立基于关系模式的问答对库 119

第12章 基于大规模问答对库的答案推荐 121

12.1 研究背景和研究现状 121

12.2 问题相似度计算方法 122

12.2.1 基于向量空间的TF-IDF句子相似度计算方法 123

12.2.2 基于关键词语义的句子相似度计算方法 123

12.2.3 基于语义依存的句子相似度计算方法 124

12.3 实验过程及结果分析句子相似度计算的评价 125

12.3.1 实验数据 125

12.3.2 实验方法及结果 125

第13章 基于相似问题推荐的问答系统原型 127

13.1 基于相似问题推荐的问答系统技术路线 127

13.2 基于相似问题推荐的问答系统原型结构图 127

13.3 原型系统工作方式 128

附录A 中文问题分类标准 130

附录B 百度知道的分类体系 132

附录C 《知网》与ICTCLAS词性标注方式比较 133

附录D 哈尔滨工业大学的依存句法分析中的句法关系 134

附录E 《知网》义原树的组成 135

附录F 《知网》知识词典中特殊符号的含义 136

参考文献 137

返回顶部