目录 2
第1部分 什么是XML 2
第1章 利用XML进行信息建模 2
1.1 引言 2
1.2 XML是一个信息领域 2
1.3 XML如何表达信息 3
1.4 XML中的模式 4
1.5 XML信息建模的常见问题 6
1.5.1 将属性作为数据元素使用 7
1.5.2 将数据元素作为元数据使用 7
1.5.3 使用不充分的标签 9
1.6 一种非常简单的设计XML的方法 10
1.7 小结 12
第2部分 纯XML数据库 14
第2章 Tamino——Software AG公司的纯XML服务器 14
2.1 引言 14
2.2 Tamino的体系结构与API 14
2.3 XML存储 16
2.3.1 集合和文档类型 17
2.3.2 模式 17
2.3.3 访问其他数据库——Tamino X-Node 20
2.3.4 将数据映射到相关的功能——Tamino X-Tension 22
2.3.5 国际化的问题 24
2.3.6 索引 25
2.3.7 在磁盘上的组织 26
2.4 查询XML 27
2.4.1 查询语言——Tamino X-Query 27
2.4.2 会话和事务 27
2.4.3 对结果的处理 28
2.4.4 执行查询 28
2.5 工具 29
2.5.1 浏览数据库 29
2.5.2 编辑模式 29
2.5.4 X-Application 30
2.5.3 访问WebDAV 30
2.6 完整的数据库功能 31
2.7 小结 31
第3章 eXist纯XML数据库 32
3.1 引言 32
3.2 系统特性 32
3.2.1 无模式的XML数据存储 32
3.2.2 数据集合 33
3.2.3 基于索引的查询处理 33
3.2.4 用于全文检索扩展 33
3.3.2 部署 34
3.3 系统体系结构 34
3.3.1 可插拔的存储后端 34
3.3.3 应用开发 35
3.4 开始使用eXist 35
3.5 查询语言的扩展 35
3.5.1 指定输入文档集合 36
3.5.2 文本查询 36
3.5.3 突出的特性 37
3.6 应用开发 37
3.6.1 使用XML:DB API编写Java应用 37
3.6.2 使用SOAP访问eXist系统 39
3.6.3 与Cocoon集成 41
3.7 技术背景 43
3.7.1 查询执行的不同方式 43
3.7.2 索引方案 44
3.7.3 索引与存储的实现 46
3.7.4 查询语言处理 48
3.7.5 查询性能 50
3.8 小结 51
第4章 嵌入式XML数据库 52
4.1 引言 52
4.2 嵌入式数据库简介 52
4.3 嵌入式XML数据库 53
4.4 为嵌入式XML数据库开发应用程序 54
4.4.1 Berkeley DB XML系统概述 55
4.4.2 配置 56
4.4.3 建立索引和索引类型 56
4.4.4 XPath查询处理 58
4.4.5 对事务进行编程 60
4.4.6 两阶段加锁和死锁 61
4.4.7 减少资源竞争 63
4.4.8 检查点 64
4.5 小结 65
4.4.9 故障后的恢复处理 65
第3部分 XML和关系数据库 68
第5章 IBM支持XML的数据管理产品体系结构和技术 68
5.1 引言 68
5.2 现有产品和技术概要 68
5.2.1 DB2通用数据库 68
5.2.2 信息集成技术 68
5.3 当前的体系结构和技术 69
5.3.1 共享的体系结构和技术 69
5.3.2 XML Extender的体系结构 70
5.3.3 XML Extender技术 71
5.3.4 同时使用XML Collection和XML Column 75
5.3.6 XML数据的查询、解析和验证 76
5.3.5 XML数据转换 76
5.3.7 XMLExtender的联邦支持 77
5.3.8 SQL/XML支持的体系结构 77
5.3.9 SQL/XML支持技术 78
5.3.10 数据管理Web服务体系结构 80
5.3.11 数据管理Web服务技术 81
5.3.12 信息集成体系结构和技术 83
5.4.1 一个设想 85
5.4.2 应用接口、数据类型和API的目标 85
5.4 未来的体系结构和技术 85
5.4.3 存储、引擎和数据管理器的目标 87
5.4.4 为什么需要在一个系统中同时支持XML和关系存储 89
5.4.5 为什么从长远来看不考虑对象—关系方法 89
5.4.6 紧密相关的技术领域 90
5.5 小结 90
5.6 注意 90
第6章 Oracle9i对XML的支持 92
6.1 引言 92
6.2 将XML存储为CLOB 94
6.2.1 使用CLOB和OracleText包 94
6.2.2 OracleText中的查询谓词 95
6.2.3 XML特有的功能 96
6.2.4 前提条件 97
6.3 XMLType 99
6.3.1 对象类型XMLType 99
6.3.2 Java中的XMLType处理 101
6.4 使用XSU实现细粒度存储 101
6.4.1 标准映射 102
6.4.2 检索 104
6.4.3 修改 106
6.5.2 SQL函数sys_XMLGen 108
6.5.1 SQL函数existsNode和extract 108
6.5 从关系数据建立XML文档 108
6.5.3 SQL函数SYS_XMLAgg 110
6.5.4 PL/SQL包DBMS XMLGen 111
6.6 数据库的Web访问 112
6.6.1 XSQL原理 112
6.6.2 将XML数据发布到数据库中 114
6.6.3 参数化 115
6.6.4 Servlet调用 116
6.7 专有的Oracle特征 117
6.7.1 URI支持 117
6.7.3 类生成器 121
6.7.2 解析器 121
6.7.4 特殊的Java Bean 123
6.8 小结 123
第7章 MicrosoftSQL Server 2000对XML的支持 125
7.1 引言 125
7.2 XML和关系数据 125
7.3 SQLServer的XML访问 126
7.3.1 通过HTTP访问 126
7.3.2 通过SQLOLEDB、ADO和.NET使用XML特征 128
7.4 将SQL查询的结果序列化为XML 128
7.4.2 auto和nested方式 130
7.4.1 raw方式 130
7.4.3 explicit方式 131
7.5 在XML上提供关系视图 133
7.6 SQLXML模板 136
7.7 在关系数据上提供XML视图 137
7.7.1 注释模式 137
7.7.2 使用XPath进行查询 138
7.7.3 使用Updategram的修改 140
7.7.4 批量加载 141
7.8 小结 142
8.1 引言 143
第8章 将XML文档存储到关系数据库中的通用体系结构 143
8.2 系统体系结构 145
8.2.1 安装Xerces 145
8.3 数据模型 145
8.3.1 关系数据库中的DOM存储 147
8.3.2 嵌套集合模型 147
8.4 创建数据库 148
8.4.1 物理数据模型 148
8.4.2 创建用户定义的数据类型 149
8.4.3 创建表 150
8.4.4 从仓储中序列化一个文档 156
8.4.5 手工创建一个XML文档 160
8.5 连接仓储 162
8.5.1 xmlrepDB类 162
8.6 上载XML文档 168
8.6.1 xmlrepSAX类 168
8.6.2 数据条目的存储过程 172
8.6.3 uploadXML类 177
8.6.4 extractXML类 189
8.7 查询仓储 192
8.7.1 Ad Hoc SQL查询 192
8.7.2 文本搜索 195
8.7.3 一些其他的存储过程 195
8.7.4 生成XPath表达式 197
8.8 未来的进一步完善 200
8.9 小结 200
第9章 一种建立高性能XML仓储的对象—关系方法 201
9.1 引言 201
9.2 XML使用实例场景纵览 202
9.3 高层系统体系结构 203
9.4 细节设计描述 207
9.5 小结 220
10.1 引言 222
第10章 生物信息中的知识管理 222
第4部分 XML应用 222
10.2 分子生物学背景简介 223
10.3 生命科学正致力于使用XML对信息建模 226
10.4 一个基因信息模型 228
10.5 NeoCore XMS* 234
10.6 将BLAST集成到NeoCore XMS 237
10.6.1 序列搜索类型 238
10.7 小结 242
11.2 案例分析1:重要客户优先 243
11.2.1 公司情况 243
11.1 引言 243
第11章 XML在IBM DB2通用数据库中的使用案例分析 243
11.2.2 问题的解决 244
11.2.3 进一步的扩展 246
11.3 案例分析2:改善现金流转 247
11.3.1 公司情况 247
11.3.2 问题的解决 247
11.3.3 进一步的扩展 251
11.4 小结 251
11.5 注意 251
12.2 背景及要求 253
12.1 引言 253
第12章 使用XML和J2EE技术设计并实现工程数据管理系统 253
12.3 概述 254
12.3.1 安全服务 254
12.3.2 查询服务 255
12.3.3 图像查询服务 255
12.3.4 打印服务 256
12.4 设计选择 256
12.4.1 在OAI中使用XML 256
12.4.2 将输入的XML文档转换为对象 257
12.4.3 将数据库中的数据转换成XML 258
12.4.4 将图像数据转换成XML 258
12.4.5 数据库的存取 258
12.4.6 验证 260
12.5 未来发展方向 261
12.5.1 XSLT 261
12.5.2 Web服务 261
12.5.3 大量数据传输能力 262
12.5.4 消息机制 262
12.6 小结 263
第13章 GIDB系统中使用支持XML的技术实现地理数据交换 264
13.1 引言 264
13.2 GIDB中的METOC数据集成 266
13.2.1 背景 266
13.2.2 实现 267
13.3 GIDB Web地图服务的实现 271
13.4 GIDB中GML的导入和导出 275
13.5 小结 278
第14章 利用可重用组件的分布式系统配置适配器实现空间网(SWW) 280
14.1 引言 280
14.2 高级概念描述:研究问题 280
14.2.1 未来的通信和卫星群 282
14.3 系统框架的组件集成 284
14.4 实例 285
14.5 研究高级概念、SWW和交叉领域的下一代NASA机构 287
14.6.1 研究方法 288
14.6 高级概念的开发 288
14.6.2 研究任务 289
14.7 小结 296
第15章 归纳数据库中的XML统一框架 297
15.1 引言 297
15.2 过去的工作 298
15.2.1 提取和评价关联规则 298
15.2.2 数据分类 301
15.2.3 归纳数据库 303
15.2.4 PMML 305
15.3 数据模型:XDM 307
15.3.1 基本概念 308
15.3.2 使用XDM的分类 311
15.3.3 XDM中的关联规则 320
15.4 XDM的优势 329
15.5 发展为自适应的开放系统 330
15.6 相关工作 331
15.7 小结 333
第16章 设计和管理XML数据仓库 334
16.1 引言 334
16.1.1 为什么用XML的视图机制 334
16.1.2 主要内容 334
16.2 体系结构 335
16.1.3 概要 335
16.3.1 XML文档的视图模型 336
16.3 数据仓库规范 336
16.3.2 数据仓库规范的图形化工具 338
16.4 元数据管理 339
16.4.1 数据仓库 339
16.4.2 视图定义 339
16.4.3 中介模式定义 342
16.5 数据仓库的存储和管理 342
16.5.1 存储XML数据的不同策略 343
16.5.2 XML数据到关系数据库的映射 343
16.5.4 数据提取 344
16.5.3 视图存储 344
16.6 DAWAX:定义和管理数据仓库的图形化工具 345
16.6.1 数据仓库管理器 345
16.6.2 不同的DAWAX包 345
16.7 相关工作 346
16.7.1 XML查询语言 346
16.7.2 存储XML数据 346
16.7.3 XML数据集成系统 346
16.8 小结 347
17.2 评测基准的规范 350
17.1 引言 350
第17章 XML管理系统的评测基准 350
第5部分 性能和测试基准 350
17.3 评测基准的数据集 351
17.3.1 评测基准中的查询语句 352
17.4 现有的XML评测基准 353
17.4.1 XOO7评测基准 353
17.4.2 XMach-1评测基准 357
17.4.3 XMark评测基准 359
17.5 小结 364
第18章 Michigan评测基准:用于XML查询性能测试的微型基准 366
18.1 引言 366
18.2 相关工作 367
18.3 评测基准的数据集 368
18.3.1 对数据特征的讨论 368
18.3.2 评测基准数据的模式定义 370
18.3.3 生成字符串属性和元素内容 371
18.4 评测基准的查询语句 373
18.4.1 选择 373
18.4.2 基于值的联结 377
18.4.3 基于指针的联结 377
18.4.4 聚集 377
18.5 评测基准的使用 378
18.4.5 更新 378
18.6 小结 379
第19章 数据库中存储XML文档方式的比较 381
19.1 引言 381
19.2 XML文档的数据模型 381
19.2.1 非类型辨识的DOM实现 382
19.2.2 类型辨识的DOM实现 383
19.3 存储XML文档的数据库 384
19.3.1 关系数据库 384
19.3.2 面向对象数据库 387
19.3.3 目录服务器 387
19.4.1 对关系数据库进行评测 391
19.3.4 纯XML数据库 391
19.4 评测基准规范 391
19.4.2 对面向对象数据库进行评测 392
19.4.3 对目录服务器进行评测 392
19.4.4 对纯XML数据库进行评测 393
19.5 测试结果 393
19.5.1 性能评价 394
19.5.2 空间效率的评价 395
19.5.3 小结 396
19.6 相关工作 396
19.6.2 XML和关系数据库 397
19.6.1 对存储和获取XML文档过程的研究 397
19.6.3 XML和对象—关系数据库 398
19.6.4 XML和面向对象数据库 398
19.6.5 XML和目录服务器 399
19.6.6 XML数据库的评测基准 399
19.6.7 评测XML数据库的原则 400
19.7 小结 400
第20章 支持XML的数据库和纯XML数据库的性能分析 402
20.1 引言 402
20.2 相关工作 403
20.3 方法 404
20.4 数据库设计 405
20.5 讨论 408
20.6 实验结果 409
20.6.1 数据库大小 409
20.6.2 SQL操作(单条记录) 410
20.6.3 SQL操作(多条记录) 412
20.6.4 报告 413
20.7 小结 414
第21章 结论 416
参考文献 419