dbm数据库源代码分析(3)：头文件部分

现在的位置: 首页 > 综合 > 正文

dbm数据库源代码分析(3)：头文件部分

2013年11月26日 ⁄ 综合 ⁄ 共 12209字 ⁄ 字号小中大 ⁄ 评论关闭

现在解剖gdbm的头文件部分的源码。
（1）autoconf.h：由configure脚本根据autoconf.h.in模板生成。autoconf.h为平台相关的的头文件、函数、库等定义常量标志（只有这些常量标志，没有其他任何头文件和代码），这样在你的源代码中就可以用预编译指令来引用这些常量标志（通过#include "autoconf.h"），以便能够构建出可移植的程序。

/* autoconf.h. 由configure脚本生成 */ /* autoconf.h.in. 由autoheader工具通过configure.in生成 */ /* 定义为1，如果你有`bcopy'函数 */ #define HAVE_BCOPY 1 /* 定义为1，如果你有<dlfcn.h>头文件 */ #define HAVE_DLFCN_H 1 /* 定义为1，如果你有<fcntl.h>头文件 */ #define HAVE_FCNTL_H 1 /* 定义为1，如果你有`flock'函数 */ #define HAVE_FLOCK 1 /* 定义为1，如果你有`fsync'函数 */ #define HAVE_FSYNC 1 /* 定义为1，如果你有`ftruncate'函数 */ #define HAVE_FTRUNCATE 1 /* 定义为1，如果你有`getopt'函数 */ #define HAVE_GETOPT 1 /* 定义为1，如果你有<inttypes.h>头文件 */ #define HAVE_INTTYPES_H 1 /* 定义为1，如果你有`dbm'库(-ldbm)，因为没有，所以不定义它 */ /* #undef HAVE_LIBDBM */ /* 定义为1，如果你有`ndbm'库(-lndbm)，因为没有，所以不定义它 */ /* #undef HAVE_LIBNDBM */ /* 定义为1，如果你有<memory.h>头文件 */ #define HAVE_MEMORY_H 1 /* 定义为1，如果你有`rename'函数 */ #define HAVE_RENAME 1 /* 定义为1，如果你有<stdint.h>头文件 */ #define HAVE_STDINT_H 1 /* 定义为1，如果你有<stdlib.h>头文件 */ #define HAVE_STDLIB_H 1 /* 定义为1，如果你有<strings.h>头文件 */ #define HAVE_STRINGS_H 1 /* 定义为1，如果你有<string.h>头文件 */ #define HAVE_STRING_H 1 /* 定义为1，如果`st_blksize'是`struct stat'的一个成员 */ #define HAVE_STRUCT_STAT_ST_BLKSIZE 1 /* 定义为1，如果你的`struct stat'有`st_blksize'。这个已经过时了，使用 `HAVE_STRUCT_STAT_ST_BLKSIZE'标志 */ /* #undef HAVE_ST_BLKSIZE */ /* 定义为1，如果你有<sys/file.h>头文件 */ #define HAVE_SYS_FILE_H 1 /* 定义为1，如果你有<sys/stat.h>头文件 */ #define HAVE_SYS_STAT_H 1 /* 定义为1，如果你有<sys/types.h>头文件 */ #define HAVE_SYS_TYPES_H 1 /* 定义为1，如果你有<unistd.h>头文件 */ #define HAVE_UNISTD_H 1 /* 定义本软件包的bug报告地址（一般为开发者的E-mail地址) */ #define PACKAGE_BUGREPORT "" /* 定义包的全名 */ #define PACKAGE_NAME "gdbm" /* 定义包的名称和版本 */ #define PACKAGE_STRING "gdbm 1.8.3" /* 定义包的简称 */ #define PACKAGE_TARNAME "gdbm" /* 定义包的版本 */ #define PACKAGE_VERSION "1.8.3" /* 定义为1，如果你有ANSI C的头文件 */ #define STDC_HEADERS 1 /* 定义为空，如果`const'不符合ANSI C。现在的gcc早就符合包含了const的ANSI C了，故这里无需定义*/ /* #undef const */ /* 定义为`long'，如果<sys/types.h>没有定义。一般<sys/types.h>中都会把off_t定义为long，故这里无需定义 */ /* #undef off_t */

（2）system.h：包含平台相关的头文件和代码。一些函数（如文件锁操作）有的平台上有，有的平台上没有（必须通过更底层的函数来实现），而有时又可能不同平台上的名称不同。system.h把这些函数和代码编写成统一的接口，以供程序使用，这样就隐藏了底层不同平台的实现差异。

/* systems.h - 许多平台相关的头文件和代码都放在这 */ /* 首先包含所有的系统头文件 */ #if HAVE_SYS_TYPES_H /* 这样的常量标志定义在autoconf.h中 */ #include <sys/types.h> /* 平台独立的一些类型，如size_t,pid_t,uid_t等 */ #endif #include <stdio.h> /* 标准IO库(C语言标准库) */ #if HAVE_SYS_FILE_H #include <sys/file.h> /* 对文件加锁或解锁的flock函数 */ #endif #include <sys/stat.h> /* 封装了文件信息的struct stat结构 */ #if HAVE_STDLIB_H #include <stdlib.h> #endif #if HAVE_STRING_H #include <string.h> /* 标准的字符串库 */ #else #include <strings.h> #endif #if HAVE_UNISTD_H #include <unistd.h> #endif #if HAVE_FCNTL_H #include <fcntl.h> /* open调用，封装文件锁的struct flock结构等 */ #endif #ifndef SEEK_SET #define SEEK_SET 0 /* 表示加锁的位置从文件头开始 */ #endif #ifndef L_SET #define L_SET SEEK_SET #endif /* 我们有flock函数吗？(例如BSD)，flock函数是从BSD衍生出来 的，目前在很多类UNIX系统上还能找到。唯一具有移植性的锁定函数是 fcntl，它符合POSIX标准 */ #if HAVE_FLOCK /* 如果有flock函数 */ #ifndef LOCK_SH /* 如果没有定义共享锁 */ #define LOCK_SH 1 /* 定义共享锁LOCK_SH */ #endif #ifndef LOCK_EX #define LOCK_EX 2 /* 定义独占锁LOCK_EX */ #endif #ifndef LOCK_NB #define LOCK_NB 4 /* 定义读或写的锁 */ #endif #ifndef LOCK_UN #define LOCK_UN 8 /* 定义解锁 */ #endif /* 用flock函数来定义解锁、读锁、写锁 */ #define UNLOCK_FILE(dbf) flock (dbf->desc, LOCK_UN) /* 对文件解锁，dbf->desc为文件的描述符 */ #define READLOCK_FILE(dbf) lock_val = flock (dbf->desc, LOCK_SH + LOCK_NB) /* 加只读锁 */ #define WRITELOCK_FILE(dbf) lock_val = flock (dbf->desc, LOCK_EX + LOCK_NB) /* 加写锁 */ #else /* 否则没有flock函数 */ /* 我们自定义解锁、读锁和写锁(用fcntl函数)，行为像System V中的一样 */ /* 锁的类型为解锁，从文件头开始，解锁的区域由l_start和l_len控制，由于是宏，因此在一行上 */ #define UNLOCK_FILE(dbf) / { / struct flock flock; / flock.l_type = F_UNLCK; / flock.l_whence = SEEK_SET; / flock.l_start = flock.l_len = 0L; / fcntl (dbf->desc, F_SETLK, &flock); / } /* 其他类似理解 */ #define READLOCK_FILE(dbf) / { / struct flock flock; / flock.l_type = F_RDLCK; / flock.l_whence = SEEK_SET; / flock.l_start = flock.l_len = 0L; / lock_val = fcntl (dbf->desc, F_SETLK, &flock); / } #define WRITELOCK_FILE(dbf) / { / struct flock flock; / flock.l_type = F_WRLCK; / flock.l_whence = SEEK_SET; / flock.l_start = flock.l_len = 0L; / lock_val = fcntl (dbf->desc, F_SETLK, &flock); / } #endif /* 我们有bcopy函数吗？ */ #if !HAVE_BCOPY /* 如果没有 */ #if HAVE_MEMORY_H #include <memory.h> #endif #define bcmp(d1, d2, n) memcmp(d1, d2, n) /* 通过memcmp及memcpy函数来定义所需的函数 */ #define bcopy(d1, d2, n) memcpy(d2, d1, n) #endif /* 我们有fsync函数吗？ */ #if !HAVE_FSYNC /* 如果没有 */ #define fsync(f) {sync(); sync();} /* 通过sync函数来定义所需的函数 */ #endif /* 默认的块大小。有些系统的stat结构中没有blocksize，这里的代码使用BSD的stat中的块大小（为1024字节） */ #if HAVE_STRUCT_STAT_ST_BLKSIZE #define STATBLKSIZE file_stat.st_blksize #else #define STATBLKSIZE 1024 #endif /* 我们有ftruncate函数吗？ */ #if HAVE_FTRUNCATE #define TRUNCATE(dbf) ftruncate (dbf->desc, 0) #else /* 没有的话通过open和close及其相关标志来实现 */ #define TRUNCATE(dbf) close( open (dbf->name, O_RDWR|O_TRUNC, mode)); #endif #ifndef STDERR_FILENO #define STDERR_FILENO 2 /* 定义文件错误码 */ #endif

（3）gdbmerror.h：gdbm的错误码列表。主要有内存分配、文件读写、文件锁定、数据库操作方面的错误。

/* gdbmerrno.h - 描述所有的dbm错误码 */ /* gdbm设置下面的错误 */ #define GDBM_NO_ERROR 0 /* 没有错误 */ #define GDBM_MALLOC_ERROR 1 /* 内存分配出错 */ #define GDBM_BLOCK_SIZE_ERROR 2 /* 块大小出错 */ #define GDBM_FILE_OPEN_ERROR 3 /* 文件打开出错 */ #define GDBM_FILE_WRITE_ERROR 4 /* 文件写入出错 */ #define GDBM_FILE_SEEK_ERROR 5 /* 设置文件读写位置时出错 */ #define GDBM_FILE_READ_ERROR 6 /* 文件读取出错 */ #define GDBM_BAD_MAGIC_NUMBER 7 /* 文件头校验出错 */ #define GDBM_EMPTY_DATABASE 8 /* 访问空的数据库 */ #define GDBM_CANT_BE_READER 9 /* 文件不能加共享锁 */ #define GDBM_CANT_BE_WRITER 10 /* 文件不能加排它锁 */ #define GDBM_READER_CANT_DELETE 11 /* 数据不可删除 */ #define GDBM_READER_CANT_STORE 12 /* 数据不可检索 */ #define GDBM_READER_CANT_REORGANIZE 13 /* 数据不可重组 */ #define GDBM_UNKNOWN_UPDATE 14 #define GDBM_ITEM_NOT_FOUND 15 #define GDBM_REORGANIZE_FAILED 16 #define GDBM_CANNOT_REPLACE 17 #define GDBM_ILLEGAL_DATA 18 #define GDBM_OPT_ALREADY_SET 19 #define GDBM_OPT_ILLEGAL 20 typedef int gdbm_error; /* 为了兼容性 */ extern gdbm_error gdbm_errno; /* 记录错误码的全局变量 */

（4）extern.h：gdbm函数需要的一些全局变量声明。如文件信息结构、firstkey和fetch等要用到的一些全局变量等。

/* extern.h - gdbm函数需要的一些外部变量声明 */ /* 用作“原始”接口的全局变量 */ extern gdbm_file_info *_gdbm_file; /* 为“原始”接口返回数据的内存 */ extern datum _gdbm_memory; extern char *_gdbm_fetch_val;

（5）gdbmconst.h：gdbm要用到的一些常量定义。包括gdbm_open、gdbm_store、gdbm_setopt的一些常量参数，桶缓存的大小等。

/* gdbmconst.h - gdbm中要用到的常量定义 */ /* 开始常量定义 */ #define TRUE 1 #define FALSE 0 /* gdbm_open的参数，即打开数据库文件时的打开参数 */ #define GDBM_READER 0 /* 只读 */ #define GDBM_WRITER 1 /* 可读可写，但不能创建 */ #define GDBM_WRCREAT 2 /* 如果没有发现，则创建db（可写） */ #define GDBM_NEWDB 3 /* 总是创建新的db(可写) */ #define GDBM_OPENMASK 7 /* 为上面这些参数定义的掩码 */ #define GDBM_FAST 0x10 /* 快速写入！=> 没有fsyncs时。已经过时了 */ #define GDBM_SYNC 0x20 /* 对磁盘的同步操作（sync），即将所有未写的系统缓冲区写到磁盘中 */ #define GDBM_NOLOCK 0x40 /* 不对文件做锁定操作 */ /* gdbm_store的参数，这个函数用来插入数据或覆盖已有的数据（当给定的关键字在数据库中已经存在时） */ #define GDBM_INSERT 0 /* 不覆盖数据库中的数据 */ #define GDBM_REPLACE 1 /* 用新值覆盖已有的值 */ /* gdbm_setopt的参数，这个函数用来指定要执行的操作类型 */ #define GDBM_CACHESIZE 1 /* 设置缓存大小 */ #define GDBM_FASTMODE 2 /* 打开或关闭快速模式，已经过时 */ #define GDBM_SYNCMODE 3 /* 打开或关闭同步操作（sync） */ #define GDBM_CENTFREE 4 /* 保持文件头中的所有空闲数据块 */ #define GDBM_COALESCEBLKS 5 /* 试着合并空闲数据块 */ /* 在释放数据块时，我们将忽略任何小于或等于IGNORE_SIZE个字节的数据块 */ #define IGNORE_SIZE 4 /* 保持在哈希桶中的关键字的字节数 */ #define SMALL 4 /* 哈希桶中的bucket_avail个数，即桶对应的可用块个数的上限 */ #define BUCKET_AVAIL 6 /* 桶缓存的大小 */ #define DEFAULT_CACHESIZE 100

（6）gdbmdefs.h：包含了gdbm数据库文件的结构。这些定义具有兼容性，它们既用在gdbm中，也用在dbm、ndbm中。理解这些结构体是理解gdbm怎样实现的关键。

   一般数据库的实现大体思路就是用一个数据文件来存放数据，这个数据文件其实就是普通的文件，但是文件的结构可能设计的很复杂。另外，也可以拿一个文件来保存索引，如果数据量不是非常大，可以把索引全都放在内存里，例如mysql的heap型数据库就是这么做的。gdbm数据库的存储方式采用的是可扩展散列表。
   先解释一下散列技术。散列技术的核心是散列函数。散列函数是一种将键值映射为散列表中的存储位置的函数。对任意给定的动态查找表T，如果选定了某个"理想的"散列函数H及相应的散列表L，则对T中的每个数据元素X，函数值H（X.key）就是X在散列表L中的存储位置。插入（或建表）时数据元素X将被安置在该位置上，并且查找X时也到该位置上去查找。由散列函数决定的数据元素在散列表中的存储位置称为散列地址。因此，散列的基本思想是通过由散列函数决定的键值与散列地址之间的对应关系来实现存储组织和查找运算。按散列存储方式构造的存储结构称为散列表。
   gdbmdefs.h主要的数据结构（桶缓存数组和散列目录表是为了便于理解另加的，可参看具体的源代码实现文件）：
   封装数据或关键字的datum结构：数据起点指针、数据长度
   文件信息结构gdbm_file_info：文件名、一些读写模式标志、文件锁标志、错误处理函数的指针、文件描述符、文件头的指针、散列表目录的指针、桶缓存数组指针、当前桶指针、当前缓存项的指针、当前目录项的索引、一些记帐信息。
   文件头gdbm_file_header：魔数、最佳传递块大小、散列目录表的偏移地址、目录项的大小、目录地址占用的比特数、桶中的元素个数、下一个未分配的块的偏移地址、可用块。
   散列桶hash_bucket：可用块元素的个数、可用块元素列表、标识桶的二进制系列、桶中的元素个数、桶的元素列表。桶元素列表才是真正的可扩展散列表，它会随着文件的增长而分裂。可用块元素中包含了可用存储块的地址和大小，桶元素中包含了我们要管理的关键字/数据的地址和大小，其他的域都是一些记帐信息。
   桶元素bucket_elem：哈希值、关键字的前SMALL个字节、关键字记录的偏移地址、关键字的大小、数据的大小。
   可用块avail_block：可用块元素的大小、可用块元素的个数、下一个可用块的偏移地址、可用块元素列表。
   可用块元素avail_elem：可用块的大小、可用块的偏移地址。注意磁盘文件上的各个可用存储块本身的位置不会有任何改变，而是通过操作指示可用块的avail_elem元素来对可用块进行存取。
   桶缓存数组bucket_cache[size]：由多个缓存项组成的一个数组，在桶缓存初始化时，文件信息结构dbf中有指针bucket_cache指向它。
   桶缓存中的缓存项cache_elem：指向实际桶的指针、偏移地址、更改标志、数据缓存。注意缓存中的缓存项（cache_elem）不仅包含了实际的桶，还包含了数据缓存块及一些标志。在桶缓存初始化时，dbf中的指针cache_entry初始时指向桶缓存中的第一个缓存项。
   缓存项中的数据缓存元素data_cache_elem：哈希值、数据长度、关键字长度、指向数据起点的指针、偏移位置值。
   散列桶目录表dir[dir_size/4]：每个元素是一个off_t类型，根据元素中存放的偏移地址值访问磁盘上相应的散列桶。文件信息结构dbf中有指针dir指向它。
   各个数据结构之间的关系如下图：

dbm各数据结构间的关系

/* gdbmdefs.h - dbm的包含文件，定义gdbm实现需要的结构和常量 */ #include "systems.h" /* 包含平台相关的头文件和函数声明 */ #include "gdbmconst.h" /* 包含gdbm要用到的一些常量 */ /* 下面是类型定义 */ /* 封装数据项和关键字的结构，这个定义具有兼容性 */ typedef struct { char *dptr; /* 指向数据的起始点 */ int dsize; /* 数据的长度 */ } datum; /* 可用的文件空间存放在一个可用块元素列表中。其中活动的那个可用块列表被包含在文件头中（参看下面），当 它填满时，会分裂成两半，其中一半被被压入到文件的可用块列栈中。当活动的可用块列表为空且可用块栈非空时 栈顶元被弹出并存入活动的可用块列表中 */ /* 下面的结构是可用块元素列表中的元素的类型，一个avail_elem元素指示了磁盘上一个可用存储块 */ typedef struct { int av_size; /* 可用块的大小 */ off_t av_adr; /* 可用块的偏移地址 */ } avail_elem; /* 占8个字节 */ /* 实际的可用块（在avail_elem添加了一些记帐信息）。可用块在内存中的映像由malloc来分配（使用一个合适的大小参数） */ typedef struct { int size; /* 表中可用块元素的总个数 */ int count; /* 当前可用块元素的个数 */ off_t next_block; /* 下一个可用块的偏移地址 */ avail_elem av_table[1]; /* 可用块元素列表，这是表中第1个元素 */ } avail_block; /*占20个字节 */ /* dbm文件头，可以跟踪散列目录和文件可用块空间的当前位置 */ typedef struct { int header_magic; /* 魔数，值为0x13579ace，用来确保头部的完好性 */ int block_size; /* 最佳的传递块的大小（由用户给出，或与stat中的blocksize一致） */ off_t dir; /* 散列目录表的偏移地址 */ int dir_size; /* 目录表的长度 */ int dir_bits; /* 目录地址占用的比特数，2^dir_bits恰为dir_size */ int bucket_size; /* 散列桶的大小，一般为blocksize */ int bucket_elems; /* 桶中的元素个数 */ off_t next_block; /* 下一个未分配的块的偏移地址 */ avail_block avail; /* 由于avail中的伪数组（即那个看起来像数组的表格）的缘故， 这个必须放在末尾，其中的可用块列表会不断地填充 */ } gdbm_file_header; /* 占4*8+20=52个字节 */ /* dbm散列桶元素包含完整的31比特哈希值、指向关键字和数据（存储在一起）的“指针”（附带其大小）， 同时还含有实际关键字值的一小部分值。这可以在无需读取实际关键字的情况下，验证关键字的开始面部 分是否有正确的值 */ typedef struct { int hash_value; /* 完整的31比特哈希值 */ char key_start[SMALL]; /* 关键字的前SMALL个字节，SMALL定义在gdbmconst.h中，目前值为4 */ off_t data_pointer; /* 关键字记录的文件地址，数据记录直接跟在关键字后面 */ int key_size; /* 文件中的关键字的大小 */ int data_size; /* 数据的大小 */ } bucket_element; /* 占20个字节 */ /* 桶是一个小型的散列表。它由一系列附带记帐域的桶元素组成。元素的个数取决于存储设备的块大小和 文件创建时给出的参数值。桶占一个块。当桶中的桶元素列表被填满时，分裂成两个散列桶。内容也会在它们 之间进行分裂（通过使用31比特散列函数的开始几个比特）。元素在桶中的位置为散列值与桶容量作模运算的结果。 桶在内存中的映像由malloc来分配（使用一个依赖于文件系统缓存大小的合适大小参数）。为了加快写的速度， 每个桶最多对应有BUCKET_AVAIL（定义在gdbmconst.h中，目前值为6）个可用块 */ typedef struct { int av_count; /* 桶当前对应的可用块个数，最大为BUCKET_AVAIL=6 */ avail_elem bucket_avail[BUCKET_AVAIL]; /* 桶当前对应的各个可用块，可用块由avail_elem结构指示 */ int bucket_bits; /* 桶号的二进制位数 */ int count; /* 当前的桶元素个数 */ bucket_element h_table[1]; /* 桶元素列表，看起来像一个数组，这是表中的第一个元素 */ } hash_bucket; /* 占4+48+4+4+20=80个字节 */ /* 我们要尽量避免对桶的读取。下面要实现一个桶缓存。当它满时，我们将用最近最少从磁盘读取的顺序来删除桶 */ /* 为了加快获取过程和“序列化”访问，我们需要为从文件中读取的关键字/数据对实现一个数据缓存。 为了查找关键字，我们必须精确地匹配文件中的关键字。为了减少开销，数据将会同时被读取（在查找 关键字时）。关键字和其数据将会被存储在数据缓存中。每个缓存项除持有实际桶外，还将会有一个数据缓存块元素 */ /* 内存中的数据缓存，本来只需缓存要查找的关键字，但为了减少开销，数据也会同时被读取（在查找关键字时）， 因此，我们把关键字/数据同时缓存起来，用一个哈希值标识它 */ /* 数据缓存块的结构 */ typedef struct { int hash_val; /* 哈希值 */ int data_size; /* 数据长度 */ int key_size; /* 关键字长度 */ char *dptr; /* 指向数据的起点 */ int elem_loc; /* 表示本数据缓存元素的位置索引 */ } data_cache_elem; /* 占20个字节 */ /* 缓存项的结构 */ typedef struct { hash_bucket * ca_bucket; /* 指向实际桶的指针 */ off_t ca_adr; /* 桶在磁盘上的偏移地址 */ char ca_changed; /* 更改标志 */ data_cache_elem ca_data; /* 数据缓存元素 */ } cache_elem; /* 占29个字节 */ /* 最后一个结构包含一个gdbm文件的所有基本信息的主要存储。这允许一个程序在同一时间打开多个gdbm文件 包括文件名、一此访问标志、错误处理函数、文件描述符、文件头指针、散列目录表、当前散列桶指针、桶缓存列表指针、 当前缓存项指针、记帐信息等 */ /* 文件结构 */ typedef struct { /* 全局变量和指向gdbm使用的动态变量的指针 */ /* 文件名 */ char *name; /* 读/写状态 */ int read_write; /* fast_write设为1,如果没有做同步操作（fsync） */ int fast_write; /* central_free被设置，如果所有的空闲块被保留在文件头中 */ int central_free; /* coalesce_blocks被设置，如果我们需要合并空闲块时 */ int coalesce_blocks; /* 是否需要文件锁 */ int file_locking; /* 错误处理函数 */ void (*fatal_err) (); /* 由gdbm_open设置的gdbm文件描述符 */ int desc; /* 含有数据库信息的文件头 */ gdbm_file_header *header; /* 来自于可扩展散列法的散列目录表.参看Fagin et al, ACM Trans on Database Systems, Vol 4, No 3. Sept 1979, 315-344 */ off_t *dir; /* 桶缓存 */ cache_elem *bucket_cache; int cache_size; int last_read; /* last_read表示最近最后一次读取的桶在桶缓存数组中的索引 */ /* 指向缓存中的当前散列桶的指针 */ hash_bucket *bucket; /* 用来获取当前散列桶的目录索引 */ int bucket_dir; /* 指向桶缓存数组中的当前缓存项的指针 */ cache_elem *cache_entry; /* 在最后一次更新时需要写回的一些记帐信息 */ char header_changed; char directory_changed; char bucket_changed; char second_changed; } gdbm_file_info; /* 占68个字节 */ /* 现在定义所有要用到的例程原型（函数原型） */ #include "proto.h"

注意存放在磁盘上的一个新的数据库文件只包括文件头gdbm_file_header、桶目录表dir[dir_size/4]、初始的一个桶hash_bucket（以后随着文件的增长会分裂为多个桶），它们按顺序依次存放。这里gdbm_file_header中存放了活动的可用块avail_block以及下一个未分配的可用块的偏移地址，avail_block中的avail_elem才真正指出了数据存储块的大小和偏移地址。hash_bucket中的bucket_element有指向关键字/数据的指针data_pointer（注意数据直接存储在关键字之后），关键字大小及数据的大小，同时还含有关键字的一小部分实际值。其他结构都是操作这个文件的一些工具（一般在内存中）。用户对数据库文件的所有访问和存取操作都是通过gdbm_fine_info结构来完成的。
为了高效地对数据进行存取，这里实现了一个缓存系统，主要有缓存项cache_elem结构和数据缓存元素data_cache_elem结构。cache_elem中有指向实际的桶的指针（桶在磁盘上，用来对数据进行定位、查找、存取等），还包含了数据缓存元素及一些标志。数据缓存元素中指明了我们要存取的实际数据，通过内存中的缓存系统，我们可以大大提高数据的存取速度。

【上篇】Qt xp下显示中文的解决方法
【下篇】Linux系统使用time计算命令执行的时间

作者: zhenghuchuan

该日志由 zhenghuchuan 于10年前发表在综合分类下，最后更新于 2013年11月26日.
转载请注明: dbm数据库源代码分析(3)：头文件部分 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

dbm数据库源代码分析(3)：头文件部分

作者: zhenghuchuan

书签

最新文章New

本站推荐

返回首页