新闻中心 > 要闻

瑞士联邦档案馆使用人工智能实现敏感元数据的自动匿名化

作者:何露彤 编译

来源:中国档案报

2022-11-03 星期四

    瑞士联邦档案馆(Swiss Federal Archives)发布了在线访问服务新版本,新增加的“匿名发布”服务运用人工智能技术实现了敏感元数据的自动匿名化,使用户能够以合法的方式搜索和访问此前处于封闭期的140万个档案元数据。

    依据瑞士法律规定,包含敏感个人信息的元数据只能在其封闭期结束后对外公布,但同时,每位公民又具有从公共来源获得和传播信息的基本权利。为在法律规定和公众需求之间取得平衡,最大限度地释放档案数据的潜在价值,联邦档案馆决定在法律允许的范围内尽可能地公布更多数据,由此产生了匿名化服务。匿名化服务基于由苏黎世大学文本处理中心的专家代为开发的计算语言学程序,一系列机器学习系统从手动注释的数据、记录和上下文中学习单词是否需要进行匿名化处理。多种算法的集成使该服务具有更高的识别准确率,目前自然人的姓名能较好地被识别和匿名化,受保护较少的法律实体则相对逊色。对于其中可能存在的匿名化错误,用户可向瑞士联邦档案馆报告,由档案馆手动进行纠正。

    借助智能的匿名化服务,元数据中包含的敏感个人数据如自然人和法人代表的姓名、出生日期以及能够识别他们的号码(如社会保险号码)被匿名化,原先处于封闭期的档案元数据被开放给公众以供进一步的研究利用,既遵循法律要求保护了个人数据,又保障了公民获取、传播信息的基本权利。

    原载于《中国档案报》2022年11月3日 总第3902期 第三版

 
 
责任编辑:张雪
 
版权所有,未经许可,不得转载。