第一部分 应用知识管理 1
目录 1
第1章 Web仓库工程与知识管理 3
1.1 Web仓库工程介绍 3
1.1.1 Web仓库工程的数据仓库系谱 4
1.1.2 Web仓库工程的Web技术系谱 5
1.2 Web仓库工程:形式化的定义 6
1.3 未来系统概貌 7
1.4 Web仓库工程商业应用程序 8
1.4.1 Web上的数据仓库工程 8
1.4.4 协同工作组 9
1.4.5 无纸办公 9
1.4.3 多媒体的商业应用 9
1.4.2 向商业人员提供基于文档的知识 9
1.4.6 公司学习 10
1.4.7 海量输入的分析 10
1.4.8 闭环反馈商业系统 10
1.5 客户的Web仓库工程 10
1.5.1 世界信息仓库 10
1.6 Web仓库工程:一个引人瞩目的技术传记 11
1.7 知识管理介绍 12
1.7.1 PeterDrucker和知识工人 12
1.7.2 将企业视为一个知识工厂 13
1.7.3 公司的知识管理观点 14
1.8 什么是知识管理? 14
1.9 什么是知识管理理论? 15
1.10 什么是知识管理原则? 16
1.12 知识定义的研究 17
1.11 客户世界中知识管理原则的应用 17
1.10.1 知识管理原则——定义和列表 17
1.13 知识管理和计算机 18
1.13.1 计算机角色的演变 18
1.13.2 数据、信息和知识 18
1.13.3 非人工干预的、创造和操纵知识的系统 19
1.14 什么是知识管理系统? 21
1.14.1 所有计算机系统都是知识管理系统 21
1.14.2 基于知识管理原则的系统 22
1.14.3 分类系统中基于时髦词汇的方法 22
1.14.4 自动创造和操纵知识的系统 23
1.14.5 知识管理系统定义的形式化标准 23
1.15 数据库、数据仓库和知识库 24
第2章 从Edison到BernersLee:新技术的吸收过程 25
2.1 变革的代价 25
2.2.2 Web仓库工程不是例外 26
2.2.3 为什么有如此多的项目失败? 26
2.2 您的第一个Web仓库工程将会失败! 26
2.2.1 理解掌握一门新技术需要做些什么 26
2.3 新技术的吸收过程 27
2.3.1 发明 27
2.3.2 操作原理的开发 28
2.3.3 模型化与可视化 29
2.3.4 Web仓库工程领域知识管理原则和模型的发展 33
2.3.5 改进 33
2.3.6 知识网络、知识邻居和吸收过程 35
2.3.7 接受和依赖 35
2.4 知识管理在将来的任务 35
2.5.1 基于知识管理的系统的开发周期 36
2.5 公司I/T部门的知识管理 36
2.4.2 基于知识管理的营销 36
2.4.1 基于知识管理的设计 36
2.4.3 基于知识管理/Web仓库工程的发展 36
2.5.2 基于知识管理系统的预算和规划过程 37
2.5.3 软件获取的知识管理 37
2.6 知识管理的主要规划 37
2.6.1 知识管理、系统体系结构和基础结构的设计 37
2.6.2 基于知识管理的组织结构 38
2.7 知识管理的未来 38
第3章 价值链和终止应用程序 39
3.1 从公司战略角度着眼 39
3.1.1 商业过程重构 40
3.1.2 高效客户响应 41
3.1.3 以客户为中心的公司 41
3.2.1 什么是商业? 42
3.1.4 公司战略性革新的汇集 42
3.2 以最基本的形式理解商业 42
3.2.2 商业如何满足客户需要? 43
3.2.3 商业实体是如何组织的? 43
3.2.4 基础设施和组织结构的挑战 44
3.2.5 调整问题 45
3.3 引入价值链 46
3.3.1 什么是公司价值链? 46
3.3.2 一个零售业价值链的例子 47
3.3.3 电信业的例子 48
3.3.4 价值链和OLTP系统角色 48
3.3.5 价值链和Web仓库的创建 50
3.6 价值链和终止应用程序 51
3.5.1 一个低额度、高利润的零售商 51
3.5 一个高额度、低费用的零售商 51
3.4 价值链的实现——公司差异的关键 51
3.6.1 终止应用程序的例子 52
3.6.2 终止应用程序的分析 52
3.7 价值链和知识管理 52
3.7.1 基于知识管理的计算机系统视点 52
3.7.2 基于价值链的新技术视点 53
3.8 价值链调整问题 53
3.8.1 组织失调 53
3.8.2 计算机系统失调 53
3.8.3 利用价值链分析和知识管理来帮助面对调整挑战 54
4.1.1 商业压力 55
4.1.2 Web仓库的应用实体 55
4.1 技术太多,时间太少 55
第4章 设想、建模和价值建议 55
4.2 选择Web仓库解决方案的最主要挑战 56
4.2.1 这项技术确实有用吗? 56
4.3 价值建议 59
4.3.1 不同类型的价值建议 59
4.4 系统提供的价值的本质 61
4.4.1 如何获得这些价值? 62
4.5 建模和设想的任务:把潜在的好处变成现实 62
4.5.1 开发功能模型和金融模型 62
4.5.2 识别是哪些人、在哪里、何时、如何以及为什么使用操作模型和组织模型 63
4.6 什么是模型? 64
4.6.1 不明确的模型 64
4.6.2 开发模型的方式 64
4.7.1 设想过程的目的 66
4.7 设想 66
4.6.3 如何知道已完成建模? 66
4.7.2 开发一个设想 67
4.8 结论 68
第5章 知识网络、知识邻居和知识经济 69
5.1 术语定义 69
5.1.1 知识网络 69
5.1.2 为什么定义知识网络? 70
5.1.3 知识邻居 70
5.1.4 知识经济 71
5.1.5 知识交换的规则 72
5.2 文化的转变和新技术的吸收 72
5.2.1 技术对文化成员的影响 73
5.2.2 文化成员和文化层次 74
5.3.2 印刷机和工业革命 75
5.3.3 无线电、电影和民族主义 75
5.3.1 在原始社会中的知识经济 75
5.3 知识交换、新技术和它们在历史上的角色 75
5.3.4 电视和全球社区 76
5.3.5 Internet和Web仓库工程的角色 76
5.4 知识交换、新技术和它们在商业中的角色 76
5.5 知识的权力——商业的特定结果 77
5.5.1 个人文化层次间的文化冲突 77
5.6 获取知识的权力定义了经济价值 78
5.7 知识交换的硬经济 78
5.7.1 销售人员 78
5.7.2 医生 79
5.7.3 顾问 79
5.7.4 特定的Web仓库工程考虑 79
5.7.6 商业如何解决知识的权力冲突 80
5.7.5 商业上知识交换冲突解决的历史 80
5.9 系统开发生命周期的知识管理后果 81
5.8 次要的文化冲突 81
第二部分 Web仓库工程实践 85
第6章 传统的数据仓库工程体系结构与技术 87
6.1 简介 87
6.2 数据仓库工程的理论 88
6.2.1 数据仓库工程之前的信息系统体系结构的本质 88
6.3 什么是数据仓库? 91
6.3.1 使用数据仓库工程的经济缘由 91
6.4 成功创建数据仓库工程的障碍 92
6.4.1 数据源的挑战 93
6.4.2 系统规约的挑战 94
6.4.3 行政问题 95
6.5.1 “创建它就可以使用它”或者“倾卸然后运行”模型 96
6.5 非常差的数据仓库工程方案 96
6.5.2 数据集市狂热方法 97
6.6 可工作的数据仓库工程方案 97
6.6.1 数据仓库与数据集市 97
6.6.2 典型的体系结构部署模型 98
6.6.3 对平衡的需求 98
6.6.4 “真实”数据仓库指南 99
6.6.5 商业价值是关键 100
6.6.6 将仓库看作一个环境 100
6.7 数据仓库(集市)功能模型 101
6.7.1 获取 101
6.7.2 存储 103
6.7.3 访问 105
6.8.1 物理基础设施 107
6.8 仓库环境的分层 107
6.8.2 操作基础设施 108
6.8.3 应用层 108
6.9 结论 109
第7章 基于Web的查询和报表 110
7.1 通过Web传递信息 110
7.1.1 查询和报表工具与商业价值 110
7.1.2 在Web上提供查询能力的结构方法 112
7.1.3 案例学习方法 113
7.1.4 方案开发中应有的准备工作 113
7.1.5 Web仓库工程的案例 114
7.2 举例:全球运动 114
7.2.1 IQ软件背景 116
7.2.2 IQ产品家族(概述) 116
7.2.3 利用IQ产品 117
7.2.4 IQ产品体系结构 124
7.2.5 IQ Web体系结构 126
7.2.6 ActiveX和Java报表 129
7.3 结论 130
第8章 Web OLAP 131
8.1 OLAP报表世界 131
8.1.1 究竟什么是OLAP系统 131
8.1.2 OLAP报表的特征 132
8.1.3 OLAP的商业价值 135
8.2 OLAP体系结构和性能问题 137
8.2.1 设计挑战 137
8.2.2 基本方法 138
8.2.3 Web方法 139
8.3.2 产品体系结构 142
8.3 Influence软件公司的Aperio 142
8.3.1 产品介绍 142
8.3.3 使用Aperio OLAP来开发OLAP应用程序 144
8.4 结论 148
第9章 基于Web的统计分析和数据挖掘 149
9.1 分析工具 149
9.1.1 什么是数据挖掘? 150
9.2 从分析工具获取的商业价值 150
9.2.1 现行分析工具的例子 151
9.2.2 确定分析工具能够提供的商业价值 152
9.3 统计产品概述 153
9.3.1 统计分析应用 153
9.4 数据发现工具概述 154
9.4.1 数据发现应用程序 154
9.5 产品比较 155
9.5.1 需要哪种用户 156
9.5.2 数据准备要求 156
9.5.3 数学基础 156
9.5.4 获取结果的可信度 157
9.6 统计工具和数据发现工具的体系结构方法 157
9.7 关系行销的智能挖掘产品(IBM) 158
9.7.1 RM的IM产品的背景信息 158
9.8 RM的IM产品的组织和应用 159
9.8.1 数据准备 159
9.8.2 模型建立 160
9.8.3 客户聚焦 163
9.8.4 商业透视 163
9.10 结论 164
9.9 RM的IM产品的体系结构 164
第10章 基于Web的图形和地理信息系统 165
10.1 图形信息系统 165
10.1.1 图形信息系统的定义 165
10.1.2 图形信息系统所提供的商业价值 166
10.2 图形信息系统的类型 166
10.2.1 传统的图表和图形软件 166
10.2.2 虚拟现实(2D/3D/4D)——现实表示 168
10.2.3 多维抽象表示 170
10.2.4 地理信息系统 171
10.3 Autodesk地理信息系统 172
10.3.1 公司背景 172
10.3.2 产品概述 173
10.3.3 产品体系结构 173
10.3.4 Autodesk MapGuide环境的整体操作 174
10.4 开始Autodesk MapGuide显示 175
10.4.1 操纵一个地图视图 176
10.5 结论 178
第11章 文本信息管理系统的介绍 179
11.1 文本管理的潜力和陷阱 180
11.1.1 目前基于Web的文本搜索的缺陷 180
11.1.2 商业人员的信息可用性 180
11.1.3 商业人员对于海量信息的需要 181
11.2 从文本信息管理系统中获取商业利润 182
11.2.1 新技术迫使商业人员重新定义他们自身和他们的角色 182
11.3 文本管理系统提供巨大商业利润的领域 183
11.4 文本信息管理的历史 186
11.4.1 文本建立和存储软件目前的情况 188
11.4.2 文本信息管理中的挑战 190
11.5 结论 192
第12章 文本信息管理系统的体系结构 193
12.1 文本管理系统回顾 193
12.1.1 文本信息管理系统是系统 193
12.1.2 系统之间的区别 194
12.2 TIMS的主要种类 194
12.2.1 不同类型的搜索引擎和查询启动器 195
12.2.2 搜索引擎的功能 195
12.2.3 查询启动器产品的功能 197
12.2.4 文本分析 198
12.2.5 两种类型的文本分析应用程序 199
12.2.6 合作工作环境 199
12.2.7 订阅或征召服务 200
12.3 TIMS的功能模块 201
12.3.1 文本信息管理系统的交付和执行模型 202
12.3.2 TIMS的信息源 203
12.4 结论 204
第13章 搜索引擎和设施 205
13.1 搜索引擎和Web 205
13.1.1 搜索引擎、搜索启动器和搜索设施之间的差异 205
13.1.2 搜索引擎在Web环境中的关键角色 205
13.1.3 搜索引擎在未来商业社会中的角色 206
13.2 搜索引擎的体系结构 206
13.2.1 搜索引擎的主要部件 206
13.3 搜索设施工作方式的变种 207
13.3.1 用户接口(请求和响应设施)的变种 208
13.3.2 搜索模板的变种 208
13.4 索引模式的变种 211
13.4.2 查询生成和执行技术的变种 212
13.4.1 索引组织 212
13.4.3 索引装入信息方式的变种 213
13.5 Excalibur RetrievalWare品 216
13.5.1 Excalibur产品家族 216
13.6 Excalibur RetrievalWare——产品组织 217
13.6.1 Excalibur用户接口 217
13.6.2 Excalibur HTML接口体系结构 217
13.6.3 Excalibur RetrievalWare搜索模板 218
13.6.4 Excalibur RetrievalWare查询生成方法 218
13.6.5 独特的搜索方法 220
13.6.6 利用RetrievalWare生成索引 221
13.6.7 RetrievalWare的同步方法 221
13.7 Excalibur RetrievalWare界面举例 222
13.8.2 可扩展性 224
13.8 Excalibr RetrievalWare报表卡片 224
13.8.1 准确性 224
13.9 结论 225
第14章 文本挖掘系统 226
14.1 文本挖掘简介 226
14.1.1 文本挖掘作为一门独立的学科 227
14.1.2 文本挖掘的处理 227
14.1.3 文本挖掘与数据挖掘的相似和不同 228
14.2 IBM文本挖掘产品介绍 228
14.3 使用文本挖掘产品的商业应用 229
14.3.1 药品公司——生物医学研究 229
14.3.2 电的应用——客户意见调查分析 229
14.4 IBM客户关系智能产品——文本挖掘实践 230
14.4.1 CRI处理 230
14.3.3 在线报纸——查询工作、汽车或房子 230
14.4.2 CRI产品的体系结构 232
14.5 使用IBM智能文本挖掘器 233
14.5.1 特征提取工具 233
14.5.2 聚类工具 233
14.5.3 分类工具 235
14.5.4 特殊语言分类工具 236
14.5.5 概括工具 236
14.5.6 聚类与分类 236
14.6 结论 237
第15章 多媒体信息管理系统 238
15.1 定义多媒体信息管理系统 238
15.1.1 多媒体信息管理系统的分类 239
15.1.2 为什么多媒体搜索不同于文本搜索? 240
15.1.3 检索多媒体的方法 242
15.2 Excalibur Visual RetrievalWare产品 243
15.3 Visual RetrievalWare SDK的构件 243
15.3.1 特征提取器 244
15.3.2 向量索引 244
15.4 Visual RetrievalWare SDK的实际应用 245
15.5 结论 247
第三部分 技术基础 249
第16章 Internet和Internet服务 251
16.1 简介 251
16.2 Internet的历史和分类 252
16.2.1 Web是如何产生的? 252
16.2.2 Internet组织 252
16.2.3 找到所需要的服务器:InterNIC和域名服务 255
16.3 URL:统一资源定位器 257
16.2.4 InterNIC和Internet域名控制 257
16.4 接入Internet 258
16.4.1 核心Internet环境 258
16.4.2 消费者接入和Internet服务提供商 259
16.4.3 企业接入Internet 260
16.4.4 内联网和外联网 261
16.5 Internet服务 262
16.5.1 万维网(World Wide Web) 262
16.5.2 FTP服务 265
16.5.3 Gopher 268
16.5.4 WAIS服务 269
16.5.6 IRC 272
16.5.7 Mail 272
16.5.5 Telnet 272
16.5.8 其他Internet功能 273
16.6 结论 273
第17章 Web组件和通信 274
17.1 Web体系结构回顾 275
17.1.1 什么使得Web如此特殊? 275
17.2 理解HTML 276
17.2.1 HTML作为一种通用的文档显示语言 277
17.2.2 HTML及超文本范例 280
17.2.3 使用HTML指向其他对象 282
17.2.4 MIME及MIME类型 285
17.2.5 使用HTML处理程序的执行 286
17.3 无状态的Web 288
17.3.1 无状态 288
17.4.1 一个请求的完整语法 289
17.4 深入浏览器-服务器通信 289
17.4.2 一个响应的完整语法 291
第18章 PPP和CGI:Web的数据库访问 293
18.1 通过Web传递传统的数据 293
18.1.1 Web上“传统”数据的分发方法 294
18.2 PPP方法 294
18.2.1 PPP方法的体系结构 294
18.2.2 用PPP方法建立通信 294
18.3 CGI方法 296
18.3.1 CGI背景 296
18.3.2 什么是CGI? 297
18.4 基于CGI的基本体系结构 297
18.5 CGI输入 298
18.5.1 使用命令行 298
18.4.1 理解CGI组件模型 298
18.5.2 使用表单来驱动Web 299
18.6 在CGI环境中的通信 302
18.6.1 把用户输入从浏览器传递到服务器 302
18.6.2 把用户输入从服务器传递到程序 302
18.6.3 把信息返回浏览器 304
18.7 CGI处理 306
18.7.1 Web领域的编程类型 306
18.7.2 CGI运行时环境 307
18.7.3 用CGI访问数据库 308
18.7.4 CGI程序能够完成哪些工作? 309
18.7.5 标准CGI数据库程序流 309
18.8 结论 310
19.1 Java介绍 311
19.1.1 简史 311
第19章 Java:Web编程的可选方法 311
19.1.2 Java的特点 313
19.2 Java运行环境 315
19.2.1 Java语言 315
19.2.2 Java平台 316
19.2.3 编写和运行Java小程序 317
19.2.4 书写和运行不基于Web的Java应用程序 320
19.3 Java语言的组件 321
19.3.1 Java开发工具包 321
19.3.2 Java APl核心包 322
19.3.3 Java API标准扩展 323
19.4 一些关键扩展API的研究 325
19.4.1 Java Bean的研究 325
19.4.2 I/O包 326
19.5 结论 327
第20章 在Java中使用JDBC访问数据库 328
20.1 JDBC 328
20.1.1 能够使用JDBC访问的数据库 328
20.1.2 数据库访问过程 329
20.1.3 java.sql包 330
20.2 用JDBC编程 332
20.2.1 导入JDBC类 332
20.2.2 用数据库URL识别数据库 332
20.2.3 用forName()装载驱动器 333
20.2.4 用getConnection()创建连接 334
20.2.5 用createStatement()创建和准备语句 334
20.2.7 用结果集接口方法来处理结果 335
20.2.8 用close()关闭连接 335
20.2.6 用executeQuery()执行语句 335
20.2.9 JDBC编程回顾 336
20.2.10 JDBC的其他功能 338
20.3 使用JDBC连接特定的数据库 338
20.3.1 JDBC和ODBC 338
20.3.2 JDBC和Oracle 339
20.3.3 JDBC和其他数据库 340
20.4 下一代Web技术 341
20.4.1 下一代Internet协议:IPv6 342
20.4.2 动态HTML 343
20.4.3 XML——新的元HTML方法 343
20.5 结论 345
21.1 Web仓库工程拓扑 346
21.1.1 典型的配置 346
第21章 体系结构、性能和管理 346
21.2 容量规划、性能调整和故障排除 349
21.2.1 节点、链路和容量 350
21.3 容量规划的逐步指导 352
21.3.1 开发容量图 352
21.3.2 建立容量工作表 353
21.3.3 工作表开发和分析的一些例子 354
21.4 性能排错的逐步指导 359
21.4.1 分而制之方法 359
21.4.2 其他辅助排错过程 363
21.5 结论 364
附录A 拓扑文档惯例 365
A.1 平台标记符 365
A.2 工作站标记符 366
A.3 网络标记符 367
术语表 368