目录 1
第1章 制约人类利用知识的瓶颈 1
1.1 知识标引的国内外研究现状 2
1.2 知识标引成为知识管理的瓶颈 3
1.2.1 文本标引技术 3
1.2.2 中文文本信息的特点 7
1.2.3 中文理解的困难 7
1.2.4 汉语文献的自动标引研究回顾 8
1.2.5 主题标引的进展 10
1.2.6 自动文摘的进展 11
1.2.7 知识标引成为知识管理的瓶颈 13
1.3 信息科学向内容处理深入 17
1.3.1 概念检索的特点 18
1.3.2 内容检索的特点 18
1.3.3 基于内容的检索方法 18
1.4 知识组织方法的创新 19
第2章 知识发现的新理论 21
2.1 知识的基本概念 22
2.2 知识的信息单元 25
2.3 元知识概念 27
2.4 知识的表示模式 29
2.4.1 知识原子 30
2.4.2 知识因子 31
2.4.3 知识因子的一元运算 32
2.4.4 知识项 34
2.4.5 知识表达式 36
2.4.6 知识表达式的BNF表示 37
2.5 知识映射的模式识别 38
2.5.1 映射的黑箱式与明晰式 39
2.5.2 狭义的模式识别 40
2.5.3 特征决定模式的表达形式 41
2.6 非数值特征模式分类 42
2.7 数据挖掘与知识发现 47
2.7.1 数据挖掘模式 48
2.7.2 数据挖掘与机器学习的区别 49
2.7.3 数据挖掘与数据库查询的不同 49
2.7.4 数据库中的知识发现的概念 49
2.7.5 文本中的知识挖掘 52
2.7.6 国内KDD的研究热点 53
2.8 粗糙集知识发现 54
2.8.1 粗糙集的概念 54
2.8.2 知识的分类观点 55
2.8.3 新型的隶属关系 56
2.8.4 ID3与RS理论 58
2.8.5 知识粒子与知识粒度 59
2.9 非相关文献中的知识发现 61
2.10 归纳是知识发现的基本途径 62
第3章 文献标引与检索的进展 64
3.1 检索语言的概念逻辑基础 65
3.2 标引词的统计方法 66
3.2.1 文献标引 67
3.2.2 文献自动标引 68
3.2.3 Zipf定律 69
3.2.4 Luhn的自动抽词思想 70
3.2.5 叙词的聚类和结合统计 70
3.2.6 标引词向量空间模型 72
3.2.7 文献的词和词的连接矩阵 75
3.2.8 词和文献的结合矩阵 79
3.2.9 文献空间的质心C 81
3.3 主题层次划分 83
3.3.1 有序聚类方式划分文本层次 83
3.3.2 采用语义网络表示主题的层次概念 84
3.4.1 特征提取与选择概念 86
3.4 标引词的特征提取与选择方法 86
3.4.2 基于熵的方差特征提取方法 88
3.5 文本知识发现的特点与进展 90
3.5.1 Web上的数据挖掘 90
3.5.2 Web知识发现的分类 91
3.5.3 Web知识发现的方法 93
3.5.4 文本特征的处理功能 95
3.5.5 汉语文本结构的自动分析 97
3.6 新形势对情报检索语言的挑战 98
3.6.1 情报检索语言面临的挑战 98
3.6.2 利用文献数据库进行数据和事实检索 100
3.7 引入人工智能的方法 102
3.7.1 人工语言与自然语言结合 102
3.7.2 应用人工智能知识处理的方法 103
3.8 引入面向对象技术 106
第4章 知识创新与增值的知识链 109
4.1 知识创造 110
4.1.1 知识成为劳动者的生产要素 110
4.1.2 个人猜想是知识创造的起源 110
4.2.1 知识的复杂性:隐性知识与显性知识 111
4.2 知识转换 111
4.1.3 知识分为编码模式和人物化模式 111
4.2.2 拉里·普鲁萨克的知识管理 112
4.2.3 知识链 114
4.2.4 知识链模型 115
4.2.5 隐性知识与显性知识转换的四个阶段 117
4.3 知识创新 118
4.3.1 组织是知识成为生产力的放大器 118
4.3.2 知识运用于具体的环境中才产生价值 119
4.3.3 知识是个体对信息的增值 119
4.4 数字图书馆的信息整流 120
4.5 知识增值 124
4.5.1 图书馆受到Internet的巨大冲击 124
4.5.2 数字图书馆的知识增值服务 125
第5章 知识管理的革命 128
5.1 传统情报学管理知识理论的困境 129
5.1.1 分类法和主题法组织的是文献而不是知识 129
5.1.2 数字化图书馆的不足 131
5.1.3 情报学应研究知识管理 131
5.1.4 情报学构建“知识体系”框架的任务 132
5.2 网格技术推进知识管理革命 132
5.2.1 网格时代的到来 133
5.2.2 网格提供巨大的计算技术空间 134
5.2.3 知识网格对知识管理的挑战 137
5.2.4 有关知识管理革命的几点设想 138
第6章 知识元链接理论 141
6.1 知识元标引是知识组织的新方向 142
6.2 知识元标引是知识管理的起点 143
6.3 知识元是构造知识系统的基元 143
6.4 知识元链接理论 144
6.4.1 知识元模块化 144
6.4.2 知识元结构定义 145
6.4.3 知识元链接框架 147
6.5 知识的网格结构 147
6.5.1 信息与知识元的导航 148
6.5.2 建立知识网格平台 149
第7章 信息与知识变换 151
7.1 信息与知识理论的早期贡献 152
7.2 信息科学的理论 154
7.3 信息与知识谱的变换性 156
7.3.1 知识谱 157
7.3.2 知识谱分析 159
第8章 知识元的认知理论 161
8.1 认知的探索 162
8.2 认知对文本知识挖掘的指导 164
8.3 知识元的抽取 166
8.4 实例分析 168
第9章 知识元标引 170
9.1 归类分析 171
9.3.1 文本数值数据抽取算法 177
9.3.2 软件功能 177
9.3 数值型知识元软件抽取试验 177
9.2 数值型知识元结构 177
9.3.3 修改原则 179
9.3.4 检索试验 182
9.4 知识元库构架 183
9.5 期刊论文知识元抽取方案 184
第10章 基于创新点的知识元挖掘 186
10.1 创新点是科学论文的灵魂 187
10.2 学术论文撰写的核心要素 188
10.3 文本“创新点”的特征 190
10.3.1 科技期刊的创新性质 190
10.3.2 科技期刊论文创新点的分布 190
10.3.3 科技期刊论文创新的特点 192
10.4 知识元抽取试验 193
10.4.1 人工知识元抽取试验 193
10.3.4 创新点的查新类型 193
10.4.2 创新点知识元抽取原理 194
10.5 实例分析 196
第11章 基于XML的知识元本体推理 200
11.1 知识元本体推理模型 201
11.2 XML平台上的知识元表示 202
11.3 知识元实体 203
11.3.1 知识元的模板描述 204
11.4.1 语义网上五层次模型 205
11.3.2 数值型知识元实体举例 205
11.4 XML语义网推理 205
11.4.2 语义信息层上的三元组 207
11.4.3 本体信息层上的知识推理 207
11.5 知识元本体推理 208
11.5.1 两个本体定义 209
11.5.2 一个数值知识元本体对话的实例 209
附录 数值型知识元抽取软件部分程序 211
参考文献 236
后记 240