新闻中心 > 环球

DROID:一个数字档案开源工具

作者:贺怡桥 编译

来源:中国档案报

2022-03-01 星期二

    开源工具在许多存储机构中都扮演着非常关键的角色。它可以用于公开分享知识、交流思路,在档案行业也至关重要。近年来,开源工具层出不穷,它们可以帮助档案馆收集存储电子文件并为其提供接口。

    英国国家档案馆持续开发更新了一个名为“DROID(网络收集器)”的开源工具,它汇集了各地的电子档案资源。2020年5月,英国国家档案馆研发出了新一代开源工具——DROID6.5。

    准确识别文件格式在电子文件保护中是非常重要的一步。DROID是一个能够进行文件格式化识别的工具,它可以扫描电子文件夹并识别里面文件的格式化建构,能够知道你最关心的数据类型,有助于预知风险并制订计划,方便今后保持对馆藏数据的成功访问。

    从2005年首次发布开始,DROID就是一个开源工具,它的源代码最早存储在名为“SourceForge”的开放源代码软件开发平台和仓库的数据库中。2012年开始,其源代码在名为“GitHub”的代码托管平台上储存。开源项目托管平台可以从英国国家档案馆官方网站上免费下载。

    尽管DROID的大部分开发工作由英国国家档案馆负责,但也有许多馆外技术人员为软件开发作出贡献。馆外的技术人员会指出软件存在的问题、协助测试,有些技术人员甚至提交了DROID新特性的代码来帮助修复系统漏洞,使其更加适应本地化应用,并通过额外的测试提升代码质量。在推进最新版本研发工作的13名技术人员中几乎有一半来自馆外。

    DROID用于文件格式化识别的数据来自一个名为“PRONOM”的英国电子文件格式登记系统的文件格式登记处,英国国家档案馆也一直维护着这个文件格式登记处。PRONOM具备社区协作功能,任何机构都可以对其提供支持。截至目前,全球共有超过60家机构为PRONOM提供了支持性数据。

    在数字保护领域中还有许多其他发明,例如“遗产档案馆”软件,它能归集所有公开可用的软件源代码,有助于确认其保存无误。DROID的源代码也能在该软件中找到。

    开源的宗旨是把透明度和协作作为软件开发的前沿方向。显而易见,DROID一开始就在进行公开协作开发的过程中受益。数字保护领域有能力将各个机构的专业知识集中起来,互相学习,这比单独由一家记忆机构完成开发工作更有成效。

    (原文作者系国际档案理事会会员大卫·克利普舍姆)

    原载于《中国档案报》2022年2月28日 总第3798期 第三版

 
 
责任编辑:实习编辑 程子淇
 
版权所有,未经许可,不得转载。