引言:漫话数据库技术发展 1
0.1 非结构化数据库的相关概念 1
0.2 数据库技术发展简略回顾 3
0.3 非结构化数据库的现实意义 6
第1篇 数据库篇 13
第1章 非结构化数据库概述 13
1.1 非结构化数据库的基本概念和技术 13
1.1.1 非结构化数据库的基本概念 13
1.1.2 非结构化数据库中的关键技术 14
1.2 非结构化数据库现状 20
1.3 几种典型的非结构化数据库 21
1.3.1 分布式结构化数据表Big Table 21
1.3.2 Amazon的平台基础存储架构Dynamo 28
1.3.3 BigTable和Dynamo的对比分析 35
1.4 NoSQL的优势与劣势 36
1.5 TRIP全文数据库系统 37
习题1 37
第2章 TRIP系统概述 38
2.1 TRIP系统基础 38
2.1.1 TRIP系统构成 39
2.1.2 数据模型 41
2.1.3 数据组织 42
2.1.4 字段类型 43
2.1.5 TRIP管理员 44
2.1.6 控制文件 44
2.2 TRIP数据库基础 45
2.2.1 记录与元记录 45
2.2.2 文件结构 47
2.2.3 用户操作界面 50
习题2 53
第3章 TRIP数据库设计 54
3.1 数据库设计——TRIPclassic 54
3.1.1 数据库基本属性 55
3.1.2 字段定义 57
3.1.3 数据库设计的保存、修改、删除与复制 62
3.1.4 库组 63
3.2 数据库设计——CCL命令方式 64
3.2.1 输出数据库结构 64
3.2.2 创建数据库结构 66
3.3 数据库设计——GUI方式 67
3.3.1 创建数据库 67
3.3.2 字段定义 70
3.3.3 数据库的修改、删除和复制 71
3.4 叙词表 71
3.4.1 叙词表的概念和用途 71
3.4.2 叙词表的基本元素 73
3.4.3 TRIP叙词表结构 74
3.4.4 创建叙词表步骤 75
习题3 76
第4章 数据库的数据装入与维护 78
4.1 批量导入数据 78
4.1.1 Tform文件格式 78
4.1.2 Tform数据的装入与倒排 80
4.1.3 Tform数据建库示例 80
4.2 在线录入数据 82
4.2.1 录入表单的设计 82
4.2.2 录入表单的管理 84
4.2.3 数据在线录入 85
4.3 数据库的修改更新 85
4.3.1 录入界面的在线修改 85
4.3.2 全局更新 86
4.3.3 利用Tform文件的批量更新 87
4.4 数据库的拆分合并与转移 89
4.4.1 拆分数据库 89
4.4.2 合并数据库 90
4.4.3 数据库记录的转移 90
4.5 数据库光盘 90
4.5.1 数据光盘与数据库光盘 90
4.5.2 建立数据库光盘的基本要求 91
4.5.3 数据库光盘的创建步骤 91
习题4 92
第5章 TRIP数据库的安全性控制 93
5.1 安全性概述 93
5.2 用户和用户组的权限管理 93
5.2.1 用户 93
5.2.2 用户组 96
5.3 数据库的使用权限管理 99
5.3.1 数据库授权——TRIPclassic 100
5.3.2 数据库授权——GUI 101
5.3.3 数据库所有权的转移 103
5.4 数据备份和恢复 104
5.5 日志和审计 104
5.5.1 Tform文件的LOG文件 104
5.5.2 数据库被检索的日志 107
5.5.3 数据库维护日志 107
习题5 108
第2篇 搜索引擎篇 113
第6章 TRIP的索引技术 113
6.1 采用倒排表的信息检索 113
6.2 哈希法 114
6.3 索引文件内容 116
6.4 索引内容的存储 117
习题6 118
第7章 TRIP数据库检索 119
7.1 TRIP数据库检索操作入门 119
7.2 基本检索操作命令 121
7.2.1 带运算符的检索命令 121
7.2.2 在指定字段范围的查找 121
7.2.3 截断检索 121
7.2.4 对数值、日期、时间的检索 122
7.2.5 用记录号检索 123
7.2.6 二次查找——利用过程号进一步查找 123
7.2.7 检索结果的显示 124
7.3 高级检索操作命令 125
7.3.1 整个phrase子字段内容的查找 125
7.3.2 一组字段的查找 126
7.3.3 查找字段内容重复的记录 126
7.3.4 同一范围内的查找 126
7.3.5 记录“邮戳”的查找 127
7.3.6 多个数据库的同时检索 127
7.3.7 复合记录的查找 129
7.3.8 元组字段的查找 130
7.3.9 查找命令过程的存储 130
习题7 131
第8章 搜索相关的其他功能 132
8.1 内容汇聚 132
8.2 索引词浏览 135
8.3 词义扩展 135
8.4 数值统计与数据分析 138
8.5 间接检索 142
8.5.1 间接检索概述 142
8.5.2 间接检索的操作过程 142
8.5.3 间接检索示例 143
8.6 词表检索 146
8.6.1 词表检索的三个步骤 147
8.6.2 词表的调用显示 148
8.6.3 用词表的数据库检索 149
8.6.4 同义词与跨语言查找 150
8.7 中文自动分词 151
8.7.1 单汉字处理 151
8.7.2 中文自动分词 152
8.7.3 分词词典及设置 153
8.7.4 分词法选择 154
习题8 156
第9章 TRIP数据库的输出格式 157
9.1 输出模板的组成 157
9.2 创建输出模板 158
9.2.1 输出模板布局 159
9.2.2 背景文字 160
9.2.3 函数 161
9.2.4 页面尺寸控制 169
9.2.5 输出模板的生成、复制与删除 169
习题9 170
第3篇 应用开发篇 173
第10章 TRIP数据库编程 173
10.1 TRIPnxp&TRIPjxp类库介绍 173
10.2 会话 174
10.3 数据库操作 175
10.4 数据操作 179
10.4.1 数据检索 179
10.4.2 数据更新 184
10.5 用户管理 189
10.6 用户组管理 191
10.7 权限管理 192
10.8 执行CCL命令 193
习题10 195
第11章 TRIP数据库编程实例 196
11.1 系统任务的提出和设计思路 196
11.1.1 数据库设计 196
11.1.2 界面设计 197
11.2 主要模块及实现 197
11.2.1 数据库接口类DbKit 198
11.2.2 登录模块 199
11.2.3 记录添加模块 200
11.2.4 记录删除模块 201
11.2.5 记录修改模块 202
11.2.6 记录检索模块 203
11.2.7 数据的显示和刷新 203
习题11 204
第12章 TRIP其他组件介绍 205
12.1 TRIP的主要产品 205
12.2 TRIPview 205
12.3 连接池 209
12.4 TRIPagent 212
12.4.1 TRIPagent介绍 212
12.4.2 TRIPagent基本概念 213
12.4.3 TRIPagent的使用 214
12.5 TRIP文件分类 218
12.6 TRIPgrid 221
12.6.1 作为存储网格的TRIP 221
12.6.2 TRIP Web Service 222
12.6.3 管理TRIPgrid 222
习题12 223
附录A CCL命令参考手册 224
参考文献 244