新闻中心 > 要闻

档案与数字人文的“和”与“合”

——国外开展档案数字人文项目的实践

作者:李子林 王玉珏 龙家庆

来源:中国档案报

2018-10-17 星期三

    数字人文最早可追溯到20世纪40年代末期的“人文计算”。1949年,意大利学者罗伯特·布萨首次将计算机技术用于人文领域书籍编撰,开启了计算机领域与人文、社会科学领域的关联与合作。随着计算机技术深入发展,数字化被视为扩展传统人文学术研究工具的一种方法。2004年,美国学者约翰·昂斯沃思等在《与数字人文相随》一书中首次提出“数字人文”概念,该概念逐渐取代“人文计算”成为计算机协同人文社会科学领域开展合作性研究的代名词。数字人文研究与档案、档案工作紧密相连,目前,全世界的档案学者都已对档案在数字人文中的角色、功能和参与实践活动等进行探讨和研究。

档案工作与数字人文的关系

    档案工作与数字人文的关系主要体现在以下四个方面。首先,从数字人文研究对象来看,档案与历史文献是数字人文研究的核心对象之一。从人文计算到数字人文,文本分析始终是该领域研究的重点。档案作为具有真实性、证据性价值的书面文本,是数字人文研究选择的理想对象。其次,从数字人文协作发展来看,档案馆与档案工作者是数字人文研究团队的成员之一。这主要是因为数字人文与档案工作存在内容上的交叉重合。数字环境下,档案馆业务工作涉及的纸质档案数字化、数字档案元数据方案设计、档案信息检索可视化等与数字人文项目实施中的文献遗产数字化处理、历史文献元数据著录、资料库数据可视化等“不谋而合”。这为档案馆与档案工作者加入数字人文研究团队提供机会。第三,从数字人文学科建制来看,档案研究方向逐渐嵌入数字人文教育体系。例如,美国芝加哥洛约拉大学文学研究与数字人文研究中心开设数字人文专业,并特别设置档案学研究方向。第四,从数字人文已有实践项目来看,档案相关项目方兴未艾。以美国为例,据统计,美国高校数字人文项目研究热点主要集中在历史研究、档案与文献研究、数字人文工具开发、语言与文化研究四大领域。由此可见,档案工作与数字人文紧密关联,良性互动。

国外开展档案数字人文项目的实践方式

    当前,国外开展档案数字人文项目的实践方式主要分为以下3种类型。

    建立数字人文研究中心。数字人文研究所涉及领域的专业性、技术性在一定程度上决定了其具有较强的实践特点,这也决定了数字人文研究成果往往以数字人文项目制形式展现。据国际数字人文组织联盟统计,截止到2018年3月,全球有194个“数字人文”机构正在运行。当前,全球范围内数字人文中心的成立主体主要分两大类。一是以高等院校为主体建立的数字人文中心,其中高等院校的图书馆、历史研究、信息研究机构是主要参与成员。二是以公共图书馆、档案馆、博物馆等文化事业机构为主体建立的数字人文中心。数字人文中心作为数字人文项目的主要实施与运营机构,极大地推动了数字人文研究领域的繁荣发展。

    整合各类数字档案资源。数字人文项目可以将数字化材料与原生数字材料进行整合处理,实现传统人文与社会科学的方法论同计算机技术工具(如数据可视化、信息检索、数据挖掘、文本挖掘工具)、数字出版的紧密结合。当前数字人文项目中基于主题的数字档案资源整合较为普遍。数字环境下,借助数据关联技术、数字资源管理平台实现对某一主题各类档案资源的聚类与整合,强化档案资源间的关系,为人文研究提供内容全面、高附加值的档案资料。另外,众包成为数字档案资源整合的特色方式,与档案馆、博物馆、图书馆等文献保管机构参与档案资源整合的传统方式实现优势互补。借助社会力量,立足公众视角,实现数字档案资源的收集、组织和整合,有利于弥补官方叙事档案占主体地位而造成的社会整体叙事不足,全面构建社会群体记忆。例如,美国“911数字档案馆项目”借助网络平台面向社会收集到账单、邮件、图片等档案资料15万余件,旨在利用记录该事件的第一手资料构建事件原貌,从社会公众视角叙述这一事件。

    运用数字人文技术开展档案内容研究。数字人文技术为档案内容研究提供新技术和工具,帮助人文与档案学者深入推进档案内容研究工作,发掘档案内容背后隐藏的人文、社会科学知识。以数字历史研究的数字人文项目为例,无论是GIS历史地理系统、历史资料库建设还是社会历史场景重建,均需要借助数字技术实现档案文献资源的内容组织、整合与挖掘。同时,档案领域逐渐以开放的姿态尝试运用数字人文技术拓展档案内容研究的跨界合作。在2017年美国档案教育与研究协会年会上,一位学者介绍了如何利用GIS系统工具、数字计算等数字人文技术,从档案中分析移民家庭的族系关系与地理迁移变化,同人类学学者共同探寻黑人家族与白人农场主之间的关系,反映出美国与加拿大在历史、文化等社会各方面的宏大关联。

国外档案数字人文项目具体类型

    档案数字人文项目作为数字人文项目的重要组成部分,受到数字人文学者和档案学者的共同关注。根据国内外学者档案数字人文项目划分标准,当前国外档案数字人文项目主要包括GIS历史地理可视化项目、语料库建设项目、历史资料库建设项目、社会及历史场景重建项目、档案数字化项目五大类。

    GIS历史地理可视化项目。GIS历史地理可视化项目是将地理空间和特定的历史事件、事物或数据联系起来,实现地理空间与时间空间的相互叠加,多维度呈现以主体为核心的时空状态。GIS历史地理可视化与档案工作紧密关联,档案资源中的地图集等为GIS建设提供基础地理数据。另外,记录人口迁移、地理资源分布、城市公共设施建设等内容的档案文件为地理空间和社会历史的结合提供关联点,推动GIS历史地理可视化的实现。

    例如,美国弗吉尼亚大学图书馆主持、荷兰阿姆斯特丹大学图书馆、美国国家人文基金会及美国国会图书馆共同参与的“地图线”项目借助GIS技术和数字资源管理平台为社会公众搭建时空展览平台。社会公众可以在此平台上自行导入其收藏的文档资源(历史地理地图、手稿、高分辨率的地理照片等),并将其与时间表进行关联,增加描述性注释,为更多的地理与人文研究者提供研究资料与素材。又如加州大学洛杉矶分校“丹麦人口与铁路映射”项目整理了8个不同历史时期丹麦不同区域人口和铁路站点、铁路路线数据,并将这些数据影射到丹麦地图中制作成动图形式,反映了人口和基础设施建设的关系,将人文与地理紧密关联,推动人文研究与地理研究的交互性发展。GIS技术与档案资源的完美结合,既为人文研究提供新的工具和思路,也为档案社会价值的发挥及档案工作的创新发展提供契机。

    语料档案库建设项目。语言学是人文学科的重要分支,语言研究是人类社会文化传承、发展的重要构成。语料库建设与利用项目是数字人文项目关注的重点领域。语料库指为语言研究而收集、使用电子形式存储的语言素材。口述档案与文本档案资料是语料库建设的理想资源基础。

    例如,加州大学伯克利分校“保加利亚传统方言库”项目通过对记载保加利亚68个村方言的181篇档案文本进行摘录,实现对保加利亚方言数据的组配与整合,建立支持检索和互动功能的方言数据库。同时,该语料库提供方言语音播放服务和多途径检索(词形、词位、语言特征)服务,为方言研究者提供全面复合型的语料资源。又如芝加哥大学人文与电子文本服务部开展“法语生活字典”项目,收录3000余篇经过数字化处理的法国文献全文,并借助特定搜索引擎实现语料数据库的查询与利用。为增强用户检索满意度,提高语料库的社会利用率,项目研究人员正在研发新型检索工具。数字人文技术为口述档案资源的开发提供助力,丰富了基于口述档案、文本档案资源的语料库建设成果。

    历史资料库建设项目。历史资料库建设项目中,历史学家、考古学家、档案工作者共同参与采集第一手历史资料,或将纸质、模拟历史资料进行数字化处理形成数据资源并存储于数据库中,多数项目提供支持检索或分页导航的Web站点作为数据库访问入口。在历史资料库建设过程中,历史档案资源的组织、存储、关联、检索、可视化等操作的实现至关重要。

    例如,哈佛大学费正清研究中心发起的“中国历代人物传记数据库”项目是利用历史档案建设历史资料库的典型。该项目利用文本挖掘、关联数据等技术对中国历代人文传记档案的内容信息与外部特征进行捕获与收集,分类组织并提供多种档案检索途径,致力于提高文学历史研究者的利用档案率,辅助中国文学历史研究的开展。又如北卡罗来纳大学教堂山分校图书馆联合该校历史系、内梅亨大学性别研究所启动“性别和战争”项目,对馆藏1600年以来有关性别史与战争史的书籍、手稿、电影等进行数字化处理与组织,搭建“性别和战争”历史资料数据库,为用户提供多种检索途径,帮助用户全面快速获取所需档案。

    社会及历史场景重建项目。社会历史场景还原与重建是数字化时代档案馆实践领域和数字人文研究领域共同关注的热点。档案作为社会记忆建构过程中不可替代的要素,是社会记忆的重要表现形式和承载主体,肩负着记录社会和历史的重大责任。在档案工作者、人文机构等共同确立的选择机制的作用下,通过对档案内容进行深度挖掘和分析,可以实现社会历史场景的还原与再现。

    例如,英国国家档案馆为纪念第一次世界大战100周年推出的“沃顿小镇”项目对英国国家档案馆馆藏文件、图像资料进行分析、挖掘,高度还原英国维多利亚时代爱德华时期的城镇建筑风格以及一战期间各类兵种的制服和装备等。该项目运用计算机建模、关联数据等技术重现一战时期英国小镇社会历史风貌,帮助公民从社会生活视角深入了解一战历史。又如杜克大学数字艺术历史与视觉文化实验室的“数字雅典”项目运用计算机拟合技术,将考古发掘的墓葬、雕塑、水利系统等雅典城邦遗迹旧址与档案馆所藏雅典地图集等地理档案资料进行叠加,建立覆盖“过去”和“现在”的交互式数字地图,实现古代雅典城邦与现代城市的互联与对话。

    档案数字化项目。档案数字化项目是档案领域主导数字人文项目的典型实践。例如,弗吉尼亚大学1993启动的“影谷项目”专注于将美国内战时期的档案资料,如报纸、书信、日记、地图集、人口统计数据等以数字化形式重新组织、展现,并以线上开放存取的方式供人文学者、普通社会公众浏览利用。这种以档案为主导的互动参与式人文研究项目为人文学者在浏览、检索档案资源时提供自由创建标签、笔记的技术性工具,为开展人文领域的研究工作服务。

    又如,荷兰国家电影博物馆的“眼睛项目”将包括4万多部电影、6万张电影海报及数十万张静态照片的档案资源进行数字化处理,借助此项目网站面向全世界提供利用,该项目注重与教育部门、电影行业及图书馆领域的密切合作,利用数字化电影档案资源开展小学和中学教育项目,培养年轻人的媒体素养和艺术欣赏能力。另外,达特茅斯学院的“犹太音频档案项目”通过建设音频资料库,收录20世纪初期以来记录犹太人生活、文化、历史的音频档案、犹太音乐唱片封面扫描件等。达特茅斯学院的研究人员和学生通过访问该音频资料库网站,使用“快速检索”和“热点专题推送”等功能查询所需音频档案,同时可使用网站提供的播放器工具收藏自己感兴趣的音频曲目,以备后期研究之用。

    国外档案数字人文项目的实施与发展为我国档案界参与数字人文项目提供了借鉴。一方面档案馆要积极迎接数字人文时代带来的新技术与新挑战,深入了解数字人文背景下人文社会学科利用档案开展研究方式的转变,及时调整档案资源建设、档案利用服务工作;另一方面,档案馆作为丰富馆藏资源的“守门人”应主动参与到数字人文研究中,为数字人文项目开展提供研究平台和资源,凭借档案资源原始性、真实性的特质,发挥档案资源尤其是数字档案资源在人文研究中的重要作用。

    原载于《中国档案报》2018年10月15日 总第3284期 第三版

 
 
责任编辑:张雪
 
版权所有,未经许可,不得转载。