第1章 概述 1
1.1 文档的概念及分类 5
1.1.1 文档的概念 5
1.1.2 文档的分类 6
1.2 文档格式与标准化 7
1.3 文档技术及其发展 12
1.4 开放的文档处理与互操作 14
参考文献 16
第2章 置标语言 17
2.1 置标语言的概念与历史 17
2.1.1 通用标记语言GML 21
2.1.2 标准通用置标语言SGML 22
2.1.3 可扩展置标语言XML 23
2.2 置标语言在开放文档格式与文档互操作中的作用 26
2.3 关于“所见即所得”与式样内容分离的讨论 27
2.4 基于XML的文档格式的设计方法 28
2.4.1 做好需求分析,保证文档格式适合应用的要求 28
2.4.2 尽量重用已有的标准 30
2.4.3 尽量规避私有的标准 30
2.4.4 让已有的文档格式逐步过渡到新的格式 31
2.4.5 置标体现内容与式样分离的原则 31
2.4.6 置标人机可读 32
2.4.7 设计最易兼容的文档格式 33
2.4.8 适当处理好非XML内容 33
参考文献 34
第3章 文档格式基础 35
3.1 流式文档与版式文档 35
3.2 常见的办公文档 36
3.2.1 文字处理文档 36
3.2.2 电子表格文档 38
3.2.3 演示文稿文档 40
3.3 办公文档的基本要素 41
3.3.1 元数据 41
3.3.2 链接与书签 41
3.3.3 脚注与尾注 43
3.3.4 文本和字符 43
3.3.5 段落 46
3.3.6 表格 47
3.3.7 列表 47
3.3.8 标题 48
3.3.9 目录与索引 48
3.3.10 图表 49
3.3.11 多媒体对象 51
3.3.12 式样 52
3.3.13 页面布局 52
3.3.14 修订与批注 52
3.3.15 幻灯片中的动画 52
3.4 常见的版式文档 54
3.4.1 PDF/Mars 55
3.4.2 CEBX 59
参考文献 64
第4章 主要的办公文档格式标准 65
4.1 ODF 65
4.1.1 标准概述 66
4.1.2 字处理文档 69
4.1.3 电子表格文档 81
4.1.4 演示文稿文档 85
4.2 OOXML 89
4.2.1 标准概述 90
4.2.2 文字处理文档 95
4.2.3 电子表格文档 104
4.2.4 演示文稿文档 109
4.3 UOF 113
4.3.1 标准概述 114
4.3.2 字处理文档 117
4.3.3 电子表格文档 124
4.3.4 演示文稿文档 128
4.4 主流文档格式标准的分析与比较 134
4.4.1 打包方式 135
4.4.2 式样的描述 137
4.4.3 字处理文档 138
4.4.4 电子表格文档 140
4.4.5 演示文稿 141
4.4.6 小结 142
参考文献 142
第5章 其他文档格式标准 144
5.1 电子书格式标准 144
5.1.1 EPUB 145
5.1.2 其他主要电子书格式标准及其比较 152
5.2 其他文档格式规范 155
5.2.1 HTML 155
5.2.2 XSL-FO 161
5.2.3 MathML 168
5.2.4 SMIL 170
5.2.5 SVG 174
5.2.6 其他格式标准 175
参考文献 177
第6章 办公软件与文档处理 178
6.1 概述 178
6.2 主要的办公软件产品 179
6.2.1 OpenOffice.org 180
6.2.2 IBM Lotus Symphony 181
6.2.3 MicrosoftOffice 182
6.2.4 国产办公软件 183
6.2.5 主要办公软件对平台和格式标准的支持 187
6.2.6 其他文档处理工具 188
6.3 文档的编辑 191
6.3.1 文字处理文档的编辑 192
6.3.2 电子表格文档的编辑 243
6.3.3 演示文稿文档的编辑 272
6.4 文档的编程 317
6.4.1 使用办公软件提供的SDK 318
6.4.2 使用文档格式API及SDK 320
6.4.3 使用XMI应用编程接口 325
6.5 文档的自动化处理 326
参考文献 331
第7章 文档处理关键技术 334
7.1 文档一体化处理技术 334
7.1.1 复合文档技术 334
7.1.2 流式文档与用户数据的结合 337
7.1.3 版流一体化技术 340
7.2 跨媒体复合出版与交互 347
7.2.1 复合出版技术 347
7.2.2 文档对多媒体内容的支持 349
7.3 智能文档技术 352
7.3.1 早期的文档自动化技术 353
7.3.2 智能标签技术 353
7.3.3 智能表单技术 355
7.3.4 智能文档处理模型 357
7.4 文档安全与数字版权技术 359
7.4.1 办公文档的安全保障机制 359
7.4.2 文档标识方法 365
7.4.3 数字版权保护技术 367
7.5 国际化与本地化技术 371
7.5.1 文档处理国际化、本地化面对的问题 371
7.5.2 国际化、本地化文档处理技术 373
7.6 信息无障碍技术 376
7.6.1 信息无障碍的概念 376
7.6.2 文档处理的信息无障碍要求 378
7.7 基于格式的文档内容理解 379
7.7.1 文档格式对于内容理解的重要性 379
7.7.2 基于格式的文本信息抽取与分类 379
7.7.3 文档格式校验 380
7.8 文档处理技术的新发展 381
7.8.1 在线办公系统 381
7.8.2 云计算环境下的文档协同 383
7.8.3 云计算带来出版业的变革 384
参考文献 385
第8章 文档互操作技术 389
8.1 文档互操作的概念 390
8.2 文档互操作的需求 393
8.3 影响文档互操作的因素 395
8.4 文档互操作的实现途径 396
8.4.1 制定完善的标准 396
8.4.2 文档格式转换 397
8.4.3 开发文档模板 399
8.4.4 采用应用编程接口 400
8.4.5 基于语义的互操作 401
8.4.6 其他互操作途径 405
8.4.7 IBM互操作观点 406
8.5 文档格式转换 407
8.5.1 常见的文档格式转换工具 407
8.5.2 办公文档格式转换方法 407
8.5.3 办公文档格式转换项目 409
8.6 互操作模型 412
8.7 文档互操作度量模型 412
8.8 文档互操作的保障 418
参考文献 420
第9章 当前标准化工作与未来发展 422
9.1 当前的研究工作 422
9.1.1 国际标准化组织ISO/IEC JTC1 SC34的相关工作 422
9.1.2 OASIS的相关工作 428
9.1.3 ECMA的相关工作 429
9.1.4 W3C的相关工作 430
9.1.5 “标文通”工作组的相关工作 431
9.1.6 OpenOffice.org的工作 433
9.1.7 IBM的互操作努力 435
9.2 未来展望 436
参考文献 437