第1章 绪论 1
1.1 研究背景 1
1.1.1 研讨平台中的自动化需求 1
1.1.2 研讨辅助工具与言语行为分类 3
1.1.3 为两类典型研讨平台研制辅助工具 5
1.2 研究问题 6
1.3 主要内容和章节结构 7
1.4 研究方法 10
1.5 主要创新点 11
第2章 言语行为分类研究综述 12
2.1 言语行为与言语行为分类 12
2.2 言语行为的分类体系 13
2.3 言语行为识别技术 15
2.3.1 n-gram方法 16
2.3.2 隐马尔可夫模型 16
2.3.3 贝叶斯分类器 17
2.3.4 多层感知器 19
2.3.5 决策树 20
2.3.6 基于转换的学习 21
2.3.7 基于记忆的学习 22
2.3.8 不常使用的技术 23
2.3.9 总结与讨论 23
2.4 研究工具介绍 25
2.4.1 基于转换的学习 25
2.4.2 支持向量机 29
第3章 言语行为自动分类算法 34
3.1 语料与言语行为关系定义 34
3.1.1 语料简介 34
3.1.2 言语行为关系的定义 35
3.1.3 言语行为类别的统计分布 40
3.1.4 语料手工标注方法 41
3.2 特征选取 43
3.2.1 n元语法及其位置 43
3.2.2 发言在主题中的位置 46
3.2.3 前一个发言的言语行为类别 46
3.2.4 发言者信息 46
3.2.5 发言者变换 46
3.2.6 发言长度 47
3.3 系统构架 47
3.3.1 预处理 48
3.4 特征选择 50
3.5 基于转换学习的言语行为分类算法 52
3.5.1 产生潜在规则集 52
3.5.2 选择最优规则 53
3.5.3 将规则应用到测试集 54
3.6 基于支持向量机的言语行为分类算法 55
3.6.1 训练与测试 55
3.6.2 SVM数值参数选择 56
3.7 分阶段转换学习与类别依赖 58
第4章 言语行为自动分类算法的实验与评估 60
4.1 自动分类算法的结构参数选择问题 60
4.2 测量指标 64
4.3 试运行确定各类别分类的难易程度和previous SA的类型 65
4.3.1 实验设计 66
4.3.2 实验结果 66
4.3.3 各类别分类的难易程度 70
4.3.4 Previous SA的类型 72
4.4 确定分类顺序 73
4.4.1 TBL规则中previous SA域的分布规律 74
4.4.2 言语行为类别的分类顺序 75
4.5 TBL算法挑选最优规则的准则 77
4.5.1 实验设计 77
4.5.2 结果与讨论 77
4.6 SVM算法的核函数 83
4.6.1 实验设计 83
4.6.2 结果与讨论 84
4.6.3 基于SVM算法与基于TBL算法的比较 87
4.7 在盲测集上的效果 89
4.7.1 最优结构参数 89
4.7.2 结果与讨论 90
第5章 自动在线督导系统研究 93
5.1 文献综述 93
5.1.1 在线督导 93
5.1.2 自动在线督导系统 95
5.2 在线问答推荐系统 97
5.2.1 系统实现 97
5.2.2 系统评估 106
5.3 未解决问题识别 109
5.3.1 学生研讨的信息组织模型 109
5.3.2 言语行为分类 112
5.3.3 利用言语行为类别识别包含未回答或未解决问题的主题 116
5.3.4 不利用言语行为类别直接识别包含未回答或未解决问题的主题 117
5.3.5 总结和进一步的工作 118
第6章 群体研讨中的外部概念支持研究 119
6.1 文献综述 120
6.1.1 子类限制和认知惯性 120
6.1.2 激励发散思维 121
6.1.3 概念空间 122
6.1.4 语义Web挖掘 123
6.2 GSS中的外部概念支持系统 124
6.2.1 实时发言分析 124
6.2.2 Web挖掘 127
6.2.3 相关检索 129
6.3 外部概念支持系统的评估 129
6.3.1 原型GSS系统介绍 130
6.3.2 度量指标 131
6.3.3 假设 133
6.3.4 实验设计 134
6.4 结果和讨论 135
6.4.1 概念的质量 135
6.4.2 群体研讨的效果和效率 135
6.4.3 用户主观评估和口头评价 137
6.5 结论 137
6.5.1 启示 138
6.5.2 局限性 138
第7章 群体研讨的自动主持人研究 140
7.1 文献综述 140
7.2 群体研讨基础理论 143
7.2.1 综合集成研讨厅体系 143
7.2.2 Zeno研讨模型 144
7.2.3 GSS中的信息组织模型 145
7.2.4 关注水平与共识水平 146
7.3 自动主持人系统功能 149
7.3.1 显示会议剩余时间 150
7.3.2 发现并制止闲聊 150
7.3.3 识别冷僻的主意 150
7.3.4 鼓励发言 151
7.3.5 信息集成可视化面板 151
7.4 系统实现 153
7.4.1 系统构架 153
7.4.2 发言实时分析 153
7.4.3 专家系统 154
7.4.4 会议干涉 155
7.5 系统评估 155
7.5.1 对信息集成可视化面板的评估 155
7.5.2 现场实验评估 159
7.6 小结 163
附录1 PedaBot语料言语行为类别体系 164
附录2 PedaBot语料一个典型的thread及标注样例 170
附录3 GASS 3系统简介 175
参考文献 180