第0章 绪言 1
0.1 什么是数据工程 2
0.2 什么是知识工程 3
0.3 数据知识工程和软件工程的关系 5
第1章 数据库工程 8
1.1 数据 8
1.1.1 现实世界中的数据 9
1.1.2 数据处理 9
1.1.3 现代数据管理的需求 11
1.2.1 为什么需要元数据 12
1.2 元数据 12
1.2.2 元数据标准 14
1.2.3 元数据库 16
1.3 数据模型 16
1.3.1 概念数据模型 16
1.3.2 逻辑数据模型 19
1.3.3 从E-R模型向关系模型的转化 20
1.3.4 关系数据模型构造CASE工具——PowerDesign 21
1.4.1 非规范化关系模式带来的问题 22
1.4 数据规范 22
1.4.2 数据依赖 23
1.4.3 范式 24
1.4.4 关系规范化 26
1.4.5 关系规范化在实际中的应用 28
1.5 数据约束 29
1.5.1 关系的完整性 29
1.5.2 数据库的完整性 30
1.5.3 表示完整性约束的方法 31
1.5.4 商品化DBMS中的完整性约束 32
1.6 数据安全 36
1.6.1 常用数据库安全方法 36
1.6.2 商业DBMS的安全性策略 39
1.7 数据库管理 41
1.7.1 DBMS的结构 41
1.7.2 事务管理 43
1.7.3 商业DBMS产品比较 46
1.7.4 选择DBMS产品时的考虑 49
1.8 数据库应用——OLTP 50
1.8.1 OLTP的体系结构 51
1.8.2 OLTP系统的开发步骤 53
1.8.3 一个OLTP系统设计实例 55
第2章 数据仓库工程 58
2.1 数据仓库 58
2.1.1 为什么需要数据仓库 59
2.1.2 数据仓库的组成 60
2.1.3 数据仓库的特性 61
2.1.4 商业化数据仓库解决方案 63
2.2 数据载入 66
2.2.1 从操作数据向数据仓库的移动 66
2.2.2 数据仓库的粒度和元数据 70
2.2.3 Oracle数据移入工具——SQL?LOADER 72
2.3 星型模型 74
2.3.1 构建合理的企业数据模型 74
2.3.2 星型模型架构 76
2.3.3 星型模型构建方法 79
2.4 三层设计 80
2.4.1 ODS 81
2.4.2 DB-ODS-DW三层体系结构 83
2.4.3 DB-ODS-DW体系结构应用实例 84
2.5 数据仓库安全 86
2.5.1 数据仓库安全策略 86
2.5.2 数据访问安全 87
2.5.3 数据安全——数据仓库备份与恢复 88
2.6 数据仓库查询技术 90
2.6.1 查询工具的选择 90
2.6.2 优化物理数据仓库来提高查询效率 91
2.6.3 商业数据仓库解决方案中的查询工具 93
2.7 数据仓库应用——OLAP 95
2.7.1 第一次亲密接触OLAP 95
2.7.2 MOLAP与ROLAP 98
2.7.3 OLAP工具 99
第3章 数据挖掘 101
3.1 基于证据理论的数据挖掘方法 101
3.1.1 证据理论在表征默认值上的应用 102
3.1.2 基于证据理论的多分类器集成方法 103
3.2.1 神经网络简介 106
3.2 基于神经网络的数据挖掘方法 106
3.2.2 使用BP网络进行分类 107
3.3 基于遗传算法的数据挖掘方法 109
3.3.1 遗传算法的基本原理 110
3.3.2 基于遗传算法的广义规则挖掘 111
3.3.3 基于遗传算法的分类规则挖掘 113
3.4 基于粗糙集的数据挖掘方法 116
3.4.1 粗糙集在数据挖掘中的某个应用 116
3.4.2 基于粗糙集的数据挖掘算法 117
3.5.1 决策树 119
3.5 其他数据挖掘方法 119
3.5.2 模糊集 121
3.5.3 数理统计 121
第4章 基于数据(知识)库的知识发现 123
4.1 KDD基本概念 123
4.1.1 KDD的起源 123
4.1.2 KDD的特点 124
4.1.3 KDD的定义 125
4.1.4 KDD的发现目标 126
4.2 KDD的挖掘模式 127
4.2.1 关联模式 127
4.2.2 分类模式 128
4.2.3 聚类模式 128
4.2.4 回归模式 128
4.2.5 序列模式 129
4.3 KDD处理过程模型 130
4.3.1 多处理阶段过程模型1 130
4.3.2 多处理阶段过程模型2 133
4.3.3 多处理阶段过程模型3 134
4.4 KDD中使用的方法 135
4.4.1 决策树方法 135
4.4.2 神经网络方法 136
4.4.3 粗集方法 137
4.4.4 遗传算法 138
4.4.5 统计分析方法 139
4.4.6 覆盖正例排斥反例法 139
4.4.10 云模型方法 140
4.4.9 公式发现 140
4.4.8 概念树方法 140
4.4.7 模糊逻辑 140
4.4.11 可视化技术 141
4.5 KDD应用 141
4.5.1 KDD在保险风险评估中的应用 142
4.5.2 KDD在CRM系统中的应用 144
4.5.3 KDD在电信业中的应用 145
4.5.4 KDD在股票信息处理中的应用 146
4.5.5 KDD在人事管理中的应用 148
4.6 KDD中存在的困难与问题 150
第5章 知识表示 152
5.1 产生式 152
5.1.1 产生式的基本形式 152
5.1.2 产生式系统结构 153
5.1.3 推理步骤及搜索机制 155
5.1.4 产生式系统的特点及不足 156
5.2 语义网 157
5.2.1 基本概念 157
5.2.2 使用语义网表示知识 159
5.2.3 基于语义网的推理 162
5.2.4 语义网的特点及不足 163
5.3 框架表示法 164
5.3.1 框架的定义 164
5.3.2 框架系统的预定义槽 167
5.3.3 基于框架的推理 168
5.3.4 框架系统的特点与不足 169
5.4.1 概述 170
5.4.2 面向对象的概念和特点 170
5.4 基于对象的知识表示方法 170
5.4.3 事实性知识的面向对象表达 172
5.4.4 规则和过程性知识的面向对象表达 176
5.5 逻辑表达 178
5.5.1 命题逻辑知识表达 178
5.5.2 一阶谓词逻辑知识表达 179
5.5.3 非经典逻辑知识表达 183
5.6 Agent 185
5.6.1 Agent概述 185
5.6.2 Agent分类 186
5.6.3 多Agent系统(MAS) 190
5.6.4 智能主体与专家系统 193
5.7 粗集理论 194
5.7.1 粗集理论概述 194
5.7.2 基本概念 195
5.7.3 基于粗集理论的知识表达系统 197
5.7.4 决策表约简 197
5.7.5 与其他软计算方式的联系 203
6.1.1 子句集 204
6.1 谓词逻辑推理 204
第6章 知识推理 204
6.1.2 替换与合一 206
6.1.3 归结原理 209
6.1.4 归结控制策略 212
6.2 非单调推理 214
6.2.1 基本概念 214
6.2.2 非单调推理与不确定推理及经典逻辑 215
6.2.3 非单调推理的研究方法及问题 216
6.3 非精确推理 218
6.2.4 非单调推理与关于行动的推理 218
6.3.1 主观Bayes方法 219
6.3.2 确定性理论方法 223
6.3.3 证据理论方法 225
6.4 案例推理 229
6.4.1 案例推理的基本概念 229
6.4.2 案例推理中的关键技术 230
6.4.3 案例推理的应用 231
6.5.1 定性推理概述 234
6.5 定性推理 234
6.5.2 基于过程的定性推理方法 235
6.5.3 基于部件模型的定性推理方法 239
第7章 知识库管理系统基本功能 243
7.1 知识表达的需求和主要框架 243
7.1.1 知识表达的需求 243
7.1.2 谓词逻辑是知识表达的主要框架 245
7.2 逻辑型知识语言 245
7.2.1 Hom逻辑的语法 245
7.2.2 SLD推导 247
7.2.3 一个实际的Hom逻辑系统——PROLOG系统 250
7.2.4 附加的控制机制——CUT 254
7.2.5 否定信息的处理 255
7.2.6 一个逻辑方式表达的例子 256
7.3 多种知识表达与推理的实现 257
7.3.1 PROLOG的元级扩充 257
7.3.2 框架表达与推理的实现 259
7.3.3 对象表达方式的实现 261
7.4 知识表达模式OOS 262
7.5 知识库系统体系结构 264
7.6 知识消化系统 266
7.7 元推理和演绎机制 269
7.8 知识消化的实现 273
7.8.1 一个例子 275
7.8.2 输入流的消化 277
第8章 库管理系统高级功能 279
8.1 知识追踪 279
8.2 推理的解释 282
8.2.2 要求用户回答问题 284
8.2.1 求解用户的目标 284
8.2.3 示意性的专家系统 285
8.2.4 why解释功能 287
8.2.5 how解释功能 288
8.3 不精确推理 292
8.3.1 不精确推理模型及其性质 292
8.3.2 不精确推理的实现 294
8.4.1 信念系统几个典型的例子 298
8.4.2 一致性的恢复 298
8.4 信念系统和非单调推理 298
8.5 知识调试 299
8.5.1 循环控制 299
8.5.2 假结论的诊断 301
8.5.3 发现丢失解的结论 305
8.6 知识获取的一种方法——模型推理方法 306
8.6.1 求精操作 307
8.6.2 模型推理算法 310
8.6.3 知识调节与实例 312
9.1.1 基本原理 316
9.1 部分计算一般介绍 316
第9章 知识变换与优化 316
9.1.2 实现算法 317
9.1.3 部分计算主要特征 319
9.1.4 循环问题及其处理 319
9.2 元级描述向目标级描述变换方法 320
9.3 逻辑程序的源级优化 323
9.4 源级向抽象机级变换 324
9.4.1 源级或0型抽象机(apm-0)向1型抽象机(apm-1)变换 325
9.4.2 源级或0型抽象机向2型抽象机(apm-2)变换 327
9.5 PROLOG元级解释器的合成方法 333
9.5.1 元级解释器的建立 333
9.5.2 元级解释器的合成 335
第10章 知识工程开发方法 338
10.1 知识工程的开发过程 338
10.1.1 增量式的开发方法 339
10.1.2 螺旋型模型 339
10.2 快速原型法(prototyping) 340
10.2.1 原型法的一般原理 340
10.2.2 原型法的基本要求 341
10.3 概念化知识获取方法 342
10.4 路径寻找问题逻辑设计 344
10.4.1 容器灌水问题 345
10.4.2 农夫划船问题 346
10.5 递归问题逻辑设计 348
10.5.1 自然数是递归问题 348
10.5.2 项递归 348
10.6 约束求解问题设计 351
10.7 面向智能主体的开发技术 354
10.7.2 AGENTO语言 355
10.7.1 面向智能主体的软件开发 355
10.7.3 AGENT-O解释器 356
10.7.4 基于智能主体的软件工程 357
第11章 基于知识的系统开发 359
11.1 ECAP规则系统框架 359
11.1.1 分布式组件技术与三层体系结构的关系 359
11.1.2 主动规则——ECA规则简介 359
11.1.3 扩展的ECA规则 360
11.1.5 ECAP规则语法 361
11.1.4 ECAP规则语义 361
11.1.6 分层结构模型 362
11.1.7 基于ECAP规则的分层应用程序的运行机制 364
11.2 经营过程中的对象行为建模 365
11.2.1 信息系统建模分类及比较 365
11.2.2 CPN概述 366
11.2.3 有色Petri网(CPN) 366
11.2.4 递阶有色Petri网(Hierarchical CPN) 368
11.2.6 面向对象的HCPN对企业行为对象建模 369
11.2.5 HCPN与面向对象 369
11.3 基于ECAP和HCPN的图书信息管理系统设计与建模 373
11.3.1 图书信息管理系统结构 373
11.3.2 采访子系统的功能简介 374
11.3.3 采访子系统的递阶分层模型 374
11.3.4 图书采访的对象模型 375
11.3.5 图书采访的行为模型 376
11.3.6 图书采访的HCPN模型 377
11.3.7 用ECAP规则描述采访过程 380
11.4.2 数据端口的定义 381
11.4.1 ECAP规则的生成 381
11.4 系统生成和重构策略及应用 381
11.4.3 重构策略及应用 382
11.4.4 规则设计性能方面的优化 384
11.5 面向CBR(Case-Based Reasoning)的数据仓库相关技术 384
11.5.1 CBR的基本思想 385
11.5.2 基于事例仓库的高级事例推理系统(Advanced Case-Based System on Case Warehouse) 386
11.6 ACBR知识获取算法 387
11.6.1 规则获取 387
11.6.2 一个例子 389
11.6.3 消除冗余属性 394
11.6.4 消除不一致性 396
11.6.5 利用元知识 400
11.7 ACBR的问题求解 401
11.7.1 事例仓库的组织 401
11.7.2 事例仓库的检索——启发式搜索 402
11.7.3 事例仓库的管理 406
11.7.4 性能评价 406
参考文献 408