新闻中心 > 要闻

互联网档案馆推出新网站可供搜索大量CD和软盘资源

作者:王春蕾 编译

来源:中国档案报

2022-12-14 星期三

    近期,互联网档案馆(Internet Archive)宣布正式推出一个名为DiscMaster的新网站。该网站通过重构旧文件格式的方法筛选出网页存档中的CD和软盘资源,将其全部放入可供多版本浏览器搜索的数据库中,使用户能够方便快捷地进行访问和利用互联网早期的数百万个旧文件。

    互联网档案馆存储着数以千计CD和软盘的TB级数据,这些数据内容繁杂,包括音乐、文本文档、Flash动画等,难以被分类、搜索和利用。此外,由于这些数据在存储时尚处于互联网和大数据技术较为落后的时期,因此缺乏标准化的文件格式,没有采用固定的视频渲染方式和通行的音频解码器。

    此前,用户需要精细识别旧的数据格式,并将其搬运到新的浏览器中才能进行无障碍访问、识别和利用。因此,一直以来,大部分用户都认为,浏览这些过时许久的档案资料会耗费他们大量的时间和人力成本。

    DiscMaster通过精密的算法模型,能够在线生成可以在旧版浏览器上使用的解码程序,使用户可以轻松地浏览CD和软盘的数据库。目前,该网站已经涵盖7000多张CD和1100万个文件的数据信息。DiscMaster根据文件的大小和类型,自动处理数据库中的每张CD和软盘,对其进行数据分类和编码重构,并正在不断拓展数据库资源。

    自上线以来,DiscMaster受到广泛关注,访问量持续上涨,特别是对档案管理员、历史学家、寻找历史记忆的媒体和认为自己作品已经被时间遗忘的作者而言,DiscMaster是一个非常棒的工具。

    原载于《中国档案报》2022年12月12日 总第3919期 第三版

 
 
责任编辑:实习编辑 阮伸伸
 
版权所有,未经许可,不得转载。