现在的位置: 首页 > 综合 > 正文

数字资产管理系统 – DSpace 研究

2019年05月14日 ⁄ 综合 ⁄ 共 5437字 ⁄ 字号 评论关闭

【题】数字资产管理系统  -- DSpace 研究

【作者】蔡华利

【出处】《情报科学》2006年9月刊

摘 要: 本文简要叙述了 DSpace 的开发背景以及 DSpace 的优点, 进而提出了构建基于 DSpace 数字图书馆的优越性。最后笔者叙述了如何构建基于DSpace 的数字图书馆。

关键词: DSpace; 数字图书馆; 文件存储系统

目前, 各大学都有很多的科研院所和研究中心, 一些研究人员在自己的科研过程中, 会产生一些数字化的资料, 而且这些资料的数据格式各异,如果想存储并能充分利用这些资料, 必须将它们进行集成。与此同时, 目前数字图书馆所采用的数据存储技术很难解决这个问题。正是基于这样的原因, MIT 和HP 合作开发了 DSpace。

1 DSpace 简述

2000 年 3 月, 惠普公司向麻省理工学院图书馆资助了 180 万美元, 计划用 18 个月的时间合作建立一个智能化的动态数字对象存储系统, 实现对多个分布式的成员单位的数字资源进行仓储式管理。2002 年 11 月 4 日, DSpace 系统正式对外公布【1】。DSpace 是一个以内容管理发布为设计目标,遵循 BSD 协议的开放源代码数字存储系统。该系统可以收集、存储、索引、保存和重新发布任何数字格式、层次结构的数据。

DSpace 能够对各社区的预印资料 ( Preprint ) 和电子出版品 ( Eprint) 进行存储传递, 为不同学科的资料建立虚拟馆藏, 并将各个单位的资料库联结为有机的整体。对于已有的独立资料库, DSpace可以与之建立连接, 实现资源的共享。各社区无需考虑资料的格式, DSpace 接受所有格式的数字化资料, 包括文本、图片、视频以及声音资料等。DSpace 会将这些资料进行统一的标引, 以方便用户检索。

DSpace 中, 把不同的科研院所和研究中心称为一个社区 ( Community) , 把其要提交的数字化资料称为馆藏 ( Collection) , 把描述馆藏属性的条目称为项目 ( Item) , 这些项目由 DC 元数据 ( Dublin Core Result ) 来描述, 项目再分为数据束 ( Bundle) , 数据束由数字流 ( BitStream) 组成, 数字流是不可以再划分的、最小的描述单位。资料描述模型如图 1 所示 【2】。

图1 DSpace 资料描述模型图

2 DSpace 的优点

2.1 用户多

DSpace 的用户包括高等院校的研究中心和科研院所、博物馆、图书馆、档案馆、一些政府部门、关联企业。我国目前使用 DSpace 的机构主要有国家图书馆、浙江大学图书馆、厦门大学图书馆、山西大学科技哲学中心等。DSpace 官方网站所登记的用户数已经超出 110, 软件下载次数超出 10000。广大的用户为 DSpace 提供了广阔的发展空间。

2.2 不断发展的系统

DSpace 是一个开放的系统, 它每时每刻都在关注用户的反馈信息, 从而不断完善系统的功能。2005 年 12 月 5 日, DSpace version 1.3.2 公布于世。此版本在以前版本的基础上又增加了以下功能:(1)户界面遵从 XHTML/WAI, XHTML 综合利用了HTML 和 XML 的优点, XHTML/WAI 使用户界面易用性增强; (2)优化了描述项目的元数据;(3)与Oracle 兼容; (4)补充了一些文献资料;(5)填补了程序的一些漏洞。

2.3 功能集成度高

DSpace 集数字资源采集、数字对象存储与管理、搜索技术、信息传递技术和权限认证等功能于一体, 高度集成了数字图书馆的五个技术环节。呈现在用户面前的是一个高度集成的、拥有诸多功能的系统【3】。

2.4 功能模块化程度高

DSpace 将整个系统划分为三个大的功能模块。(1) 社区提交数据模块。社区成员利用此模块来提交资料, DSpace 又将整个提交过程划分为 8 个模块,分别是: 描述上传文件信息、对项目进行描述、项目描述、上传文件、文件格式、确认提交、许可、完成提交;(2)用户查询模块。用户查询模块是体现DSpace 价值最重要的模块, 该模块体现了简单易用的原则, 系统界面罗列 DSpace 各社区的名字,比如国家自然科学基金资助项目网上采集试验系统(
利用 DSpace) 将社区划分为: 国家自然科学基金相关新闻报道、信息科学部、化学科学部、地球科学部、工程与材料科学部、数学物理科学部、生命科学部、管理科学部。用户根据自己的需要选择相关社区, 然后检索其馆藏;   (3)系统管理模块。该模块使用户方便管理自己提交的资料的信息, 该模块在 DSpace 中主要体现在 “我的DSpace” 上, 所有经授权的 DSpace 提交者, 及 DSpace 馆藏和元数据的维护人员都会有一个 “ 我的DSpace” 网页。在该页上有:
所有处于处理中的提交文件的列表, 可以通过该列表继续未完成的提交任务, 或移除该任务并删除该项目; 等待处理的提交任务的列表; 所有已经被 DSpace 接收项目的链接。

2.5 使用小程序接口 ( API)

DSpace 提供了几个支持 API 接口的内置程序, 通过它可以简化和加速数字馆藏的开发,  在一定程度上为系统提供了扩展和修改的能力。

2.6 具有详细的用户说明书

DSpace 备有详细的用户说明书, 说明书中详细的介绍了: 如何使用搜索功能、如何提交资料、如何使用 "我的DSpace"、如何编辑个人信息以及订阅电子邮件提醒等。

3 基于 DSpace 数字图书馆的优越性

3.1 DSpace 技术架构的优势

DSpace 的技术架构如图 2 所示, 整个技术框架分为三层, 分别是: 存储层、交易逻辑层和应用层。处于底层的是存储层, 它实际上是一个文档管理系统, 用PostgreSQL 关系数据库管理系统进行管理, 整个系统主要代码采用
JAVA 语言编写, 选择JDBC ( JAVA API) 驱动连接数据库; 交易逻辑层是 DSpace 功能集成的地带, 包括工作流、内容操作、系统管理及检索、浏览和授权等模块, 每个模块有一个 API 允许 DSpace 用户按自己的需要修改或扩展功能; 应用层为用户的使用界面, 主要功能包括 CNRI 资源调度系统、WEB 用户界面、OAI 协议、输入输出数据项, CNRI 为数字图书馆提出了完整的命名系统 " 调度系统( Handle System)", 它是一个独立的系统, 其职能是负责数字资源的全球唯一的、长期的、独立于地址命名的分配,
管理和解析, WEB 用户界面为用户提供了一个简单易用的窗口,  OAI 是元数据收割的一种协议, 该协议增强了社区之间数据的互操作性, 输入数据项允许授权用户提交资料, 输出数据项为所有用户下载和浏览资料提供了一个窗口。

图 2 DSpace 技术架构

3.2 DSpace 是基于存储的系统

目前数字资源的管理和存储、资源加工、异构资源的整合、资源调度是数字图书馆建设中几个关键的技术。而 DSpace 建设的初衷正是解决数字资源的存储问题。它虽然不是为数字图书馆而开发,但天生就有为数字图书馆服务的优势。正如上文所提及的, DSpace 可以存储任何格式的文献资料,文档、书籍、数据库、计算机程序、多媒体出版物和声音视频等。对于这些资料的存储, DSpace 支持两种模式: “ 数字流保存” 和 “功能性保存”。前者是把一个数字文档按照原始形状保存起来, 可能数年后不再有软件读出来, 只有使用特殊的软件或者由特殊的专家对其进行编码才能辨认出来;
后者则要求在技术格式和媒体介质变化的情况下始终保持其可用性。显而易见, “ 功能性保存” 是比较理性的存储模式。为了尽量完善存储功能, DSpace 把文件格式划分为三个层次【4】:(1) 支持的格式,DSpace 利用格式迁移技术对这种文件进行功能性保存; (2) 知道的格式, 此格式的文件意味着无法完成功能性保存, 但是作为一种流行的格式, 可以尝试通过第三方提供的转换工具完成格式迁移从而实现功能性保存;  (3) 不支持的格式, 此格式意味着DSpace 按照目前的技术不能完成功能性保存。

有些文件格式很容易向通用格式转换, 也有一些格式会由于专利等原因很难实现 " 功能性保存",但由于信息技术的飞快发展, 可能有一天一些不支持的格式能够转变为支持的格式, 进而能够实现功能性存储。所以在日常的存储过程中, 两种存储模式尽量同时使用。

3.3 具有分级权限的管理体系

信息社会, 信息技术的发展使得安全认证和版权保护成为法律界一个全新的研究方向。作为知识核心地带的图书馆, 对知识产权的保护更是慎之又慎, 以使得知识被正当的传播。

DSpace 采用分级权限的管理体系, 每种用户都有自己特定的使用范围, 每种资料也都有各自的使用权限。匿名用户可以使用的功能有: 检索、浏览、下载资料; 需要经过授权才能使用的功能有:提交、订阅、系统管理。匿名用户成为授权用户需要提交个人的电子邮件、姓名、密码、联系电话( 可选) 等信息。DSpace 对于每种资料使用权限的设定也是比较严格的。DSpace 可以设置的权限有:(1)READ ( 读) , 浏览某资料的元数据; (2)WRITE( 写) , 修改和某资料相关的元数据;  (3)ADD (
添加) , 可以提交资料;  (4)REMOVE ( 移除) , 删除资料;  (5)WORKFLOW ( 工作流) , 可以加入某个专题社区的工作流, 从而拥有特定的权限, 比如拥有拒绝一个特定提交的权限【5】。

4 构建基于 DSpace 的数字图书馆

基于 DSpace 数字图书馆的构建进度需要遵循一个项目进度表, 如表 1 所示【6】。

4.1 确定 DSpace 的服务内容

在确立系统技术框架之前, 需要明确建立该系统的目的以及其服务内容。比如 MIT 使用 DSpace的目的是为了存储科研机构在研究过程中所产生的数字化的资料, DSpace 在 MIT 的扮演的功能实际上是一个数字资料的档案馆。为了确定 DSpace 的服务内容需要做到:

( 1) 明确服务的目的, 常见的目的有: 提高学科研究的知名度、罗列学校的研究成果、存储研究过程中生产的数据资料、帮助图书馆减轻存储的负担等等。

( 2) 确定系统接受的内容, 常见的内容有: 印刷版资料、预印文献、数据库、科研资料、会议记录、电子杂志等。

( 3) 确立主要用户, 用户主要包括学术团体、图书馆馆员、学生、机构外的研究团体等。

( 4) 明确其它一些影响要素, 这些因素包括主要受益方、是否收取服务费用等。

4.2 DSpace 系统实施

( 1) 下载源代码,
DSpace 的源代码
可以从其官方网站上免费获取。

( 2) 搭建技术平台, 由于 DSpace 源代码是由HTML 和部分嵌入的 Java 代码组成的, 所以令需要下载 Java 服务器组件 ( 如 Tomcat) 和 Java 开发包( JDK) , 然后在环境变量中进行配置, 直到能够运行所下载的程序。

( 3) 修改 ( 或翻译) 源代码, DSpace 是由 MIT和HP 合作开发, 所以呈现在用户面前的是英文网页, 其它语种的国家 ( 比如中国) 需要对源代码进行翻译。对它的修改基本上不需要触动其核心的Java 代码 ( < % 和% > 之间所包含的部分) , 所以笔者推荐使用 FrontPage 2003 来完成此任务, FrontPage 2003“ 设计” 窗体下显示的文字就是用户需要修改的部分。

4.3 成立服务机构

每一个数字图书馆都要考虑使用什么样的模式才能满足它的用户。若想使一个数字图书馆实现它的最大价值, 服务机构必须综合考虑人员配置、图书馆制度等。基于 DSpace 的数字图书馆的服务机构需要集成图书馆员工、管理者、研究机构和院系领导等人员的思想, 然后就图书馆政策、员工设置、商业计划、咨询台的设置以及员工培训等方面做出统一部署。

4.4 宣传 DSpace 服务

DSpace 系统创建成功并不等于万事大吉, 接下来的工作就是要宣传 DSpace, 要尽量让各院系、图书馆馆员、管理者以及其他用户知道这个系统能为他们做什么。宣传的手段很多, 可以在学校网站上发出通知, 可以以海报的形式宣传, 也可以借助市场营销的工具来宣传。

4.5 创建社区和馆藏

DSpace 中的馆藏源于各社区提交的数字化资料, 所以拥有素质较高的社区也是非常必要的。常见的社区主要包括院系、图书馆、研究中心和其它机构的研究单位, 每一个社区都拥有自己的规章制度, 每一个社区都可以将自己馆藏的使用权授予特定用户。为了实现社区之间的互访问性以及各自政策的宏观统一性, 每个社区需要选择一个人来担任社区间的联络员。

在 DSpace 正式运行之前, 需要由几个社区配合试运行该系统, 在试运行过程中发现系统的不足之处或者服务机构的缺陷, 并进行及时诊断和改善, 直到系统能够成功的运行。这样一个基于DSpace 的数字图书馆就构建成功了。


5 结 语


DSpace 集资源加工系统、异构资源库整合系统、数字资源的管理与存储系统、资源调度系统、联合编目和馆际互借系统、用户查询和服务系统、安全认证系统、版权保护系统于一体, 实现了数字图书馆所要解决的所有功能, 是新一代数字图书馆的里程碑。只要围绕 DSpace 这个核心、制定完善的策略、设计合理的工作流、采用成熟的标准和协议, 构建一个高效、稳定、易用的新一代数字图书馆是完全可能的。


参考文献


【1】何朝晖, 王 波, 朱 强. 国外复合数字对象管理研究撷要[J]. 现代图书情报技术, 2005, (5): 12- 13.

【2】陈亚宁, 陈淑君, 钟丰谦. Dspace 跨机构虚拟典藏库之可行性研究[ J] . 教育资料与图书馆学, 2004, ( 12) : 243-256.

【3】http://lib.utsz.edu.cn/adl2004/zhangjia-2.ppt 2005-12-1

【4】http://libweb. zju. edu. cn: 8080/04/dspace/, 2005- 12- 02.

【5】http://www. dspace.org , 2005- 11- 20.

抱歉!评论已关闭.