第1章 绪论 1
1.1研究背景 1
1.1.1社会环境 1
1.1.2技术环境 4
1.1.3“三农”信息服务需求 5
1.2问答系统发展现状 7
1.2.1问答系统的历史 7
1.2.2问答系统概念及分类 11
1.2.3问答系统体系结构 14
1.2.4“三农”问答系统研究 17
1.3研究内容 19
1.3.1“三农”知识表示 20
1.3.2面向“三农”FAQ技术研究 21
1.3.3“三农”问题问句分类技术研究 22
1.3.4“三农”问题答案抽取技术研究 23
1.4研究方法及意义 24
1.4.1研究方法 24
1.4.2研究意义 25
1.5本书的组织结构 26
第2章 中文信息处理基础 28
2.1引言 28
2.2分词 29
2.2.1分词概述 29
2.2.2分词方法 30
2.2.3中科院分词 31
2.3句法分析 32
2.3.1句法分析概述 32
2.3.2句法分析理论及方法 33
2.4知网(HowNet) 35
2.5本章小结 36
第3章“三农”概念簇表示研究 37
3.1引言 37
3.2文本分类相关研究 39
3.3基于规则的“三农”词表的构建 41
3.3.1“三农”词表数据结构设计 41
3.3.2基于DOM树的网页抽取 44
3.3.3基于正则表达式的信息抽取 46
3.4基于KNN的“三农”概念簇表示 48
3.4.1特征抽取 48
3.4.2基于KNN的“三农”概念簇形成 53
3.5实验及结果分析 55
3.5.1实验设计 55
3.5.2评价标准 57
3.5.3实验结果分析 59
3.6本章小结 61
第4章 基于混合策略的“三农”FAQ系统研究 62
4.1引言 62
4.2 FAQ系统相关研究 64
4.3 “三农”FAQ中问题相似度算法 66
4.3.1基于句子词的表层相似度 68
4.3.2基于句法分析的语义相似度 70
4.3.3基于LSA的问句与答案相似度 77
4.3.4“三农”FAQ的综合相似度 80
4.4实验结果及分析 80
4.4.1实验设计 81
4.4.2实验结果分析 82
4.5本章小结 86
第5章“三农”问句分类研究 87
5.1引言 87
5.2问句分类相关研究 88
5.3“三农”问句的分类体系 91
5.4“三农”问句分类的特征选择 94
5.5基于规则模板的“三农”问句粗分类 96
5.5.1基于规则问句分类算法 97
5.5.2问句规则模板的抽取算法 99
5.6基于SVM“三农”问句精细分类研究 100
5.6.1 SVM分类器 101
5.6.2“三农”问句特征向量 103
5.7实验结果及分析 105
5.7.1实验设计 105
5.7.2问句类别统计 106
5.7.3实验结果分析 108
5.8本章小结 111
第6章“三农”问答系统答案抽取研究 112
6.1引言 112
6.2相关研究 114
6.3基于农业知识库的答案抽取 117
6.3.1 AGROVOC知识库 117
6.3.2基于关系组的答案抽取 120
6.4基于线索词的原因性问句答案抽取 122
6.4.1原因性问句的候选答案 123
6.4.2基于模板的答案抽取 126
6.5基于语义摘要的方式性问句答案抽取 127
6.5.1自动文摘概述 128
6.5.2基于主题词的文摘自动抽取 129
6.6实验结果及分析 135
6.6.1评价标准 135
6.6.2实验结果评价 136
6.7本章小结 138
第7章 面向“三农”问答系统构建实现 139
7.1系统运行环境 139
7.1.1服务器环境 139
7.1.2客户端环境 140
7.2系统技术 140
7.2.1 Java 140
7.2.2 Ajax 141
7.2.3 Google Ajax Search API 142
7.2.4 HtmlParser 143
7.3系统的设计构建与实现 144
7.3.1系统逻辑结构设计 144
7.3.2系统实现 149
7.4本章小结 152
第8章 结束语 153
8.1本书工作和创新之处 153
8.2研究不足及后续研究展望 154
8.3本章小结 155
参考文献 156
后记 173