新闻中心 > 要闻

让军工人像照片档案实现智能化管理与应用

——访中国航天科工集团有限公司二院二部档案室主任陈洪磊

作者：本报记者李安涛

来源：中国档案报

2024-02-26 星期一

受访人简介

    陈洪磊，中国航天科工集团有限公司二院二部档案室主任，高级工程师，国防科工局档案专家库专家，全国青年档案业务骨干。研究领域涉及电子档案管理、人工智能、档案智能化开发与利用等，科研成果荣获国家档案局、国防科工局优秀案例奖。

    当前，人工智能、区块链、大数据等新一代信息技术的广泛应用，使档案工作的环境、对象、内容发生巨大变化，迫切要求档案部门创新工作理念、方法和模式，加快全面数字转型和智能升级。军工档案因其特殊性，在数字化、智能化应用等方面面临一些挑战。为此，航天科工集团二院以人像照片档案为突破口，通过自主研发智能化技术，让军工人像照片档案实现智能化管理与应用。关于此项研究进展，近日，记者专访了集团二院二部档案室主任陈洪磊。

    记者：您开展此项研究的原因有哪些？

    陈洪磊：一方面，这是贯彻落实有关政策的务实举措。《“十四五”全国档案事业发展规划》要求，“档案信息化建设进一步融入数字中国建设，新一代信息技术在档案工作中的应用更为广泛，信息化与档案事业各项工作深度融合，档案管理数字化、智能化水平得到提升”“重大理论和实践课题攻关有新突破，科研成果转化应用加速推进”。

    另一方面，也有一些现实需求。一是在高质量发展、数字中国及数字航天新形势下，档案管理及利用亟须数字化、智能化转型，尤其要从概念、研究落到实实在在的应用、实践、推广层面。二是军工企业档案的特殊性质和保密要求，呼唤军工企业自主研发人工智能技术与模型，并应用于涉密档案信息系统。三是数字时代海量的照片档案及其中海量的人物，对档案整理与著录、数据治理提出了严峻挑战，如何实现高效整理、检索定位、利用等，迫切需要人工智能技术的有效加持。

    此外，我们期望通过自主研发智能识别技术，让档案领域具备数码照片智能管理和应用的能力，迈出档案数据智能化管理的重要一步。

    同时，研发的模型成果具备通用性及拓展性，可以集成于各类架构灵活的档案系统中，满足数码照片档案高效著录整理、便捷利用的实际需求，也为后续的视频、文字、数据的智能化管理奠定基础。

    记者：此项研究的主要内容是什么？采用了何种技术方案？

    陈洪磊：我们基于航天企业技术创新能力与基础，自主研发智能识别技术与模型，与涉密档案系统深度集成并应用于实际工作。该技术模型将优于常见的智能图册APP的技术与能力，使军工企业档案系统实现基于人像的照片档案智能专题库建设、人员信息数据一键批量治理、以人像搜图、以文字搜图等功能，实现军工企业涉密人像照片档案的智能化管理及开发利用，以智能化手段为军工企业提质增效赋能，为档案事业智能化发展提供一项可复制的解决方案。

    在整体技术架构上，我们优先将典型的人物类照片作为研究和测试对象。具体包括3个部分。

    一是人脸特征数据集的构建。由于深度学习算法的效果与训练数据密切相关，因此数据集的构建至关重要。为了能够满足算法在不同应用场景下的使用需求，需要收集足量的不同场景下的数据。

    数据集的数据图片应满足但不限于以下条件：包含密集人群的场景；包含不同场景下的图片，如会议、试验、办公室等；图片总量不少于10万张，同时保证各类图片数量尽可能均衡。

    完成数据收集后，需要采用开源数据标注工具对所收集图像进行标注。标注前应对人员进行训练，以保证质量。标注应包含图片中人脸的边界框坐标等信息。

    二是面向密集人群人脸识别的智能算法设计。人脸检测可以看作是目标检测方法在人脸识别领域的应用，因此我们拟采用经典的SSD（单发多框目标检测）算法作为基础方法。该算法在检测精度和检测速度上性能良好。

    检测合影中占比小的、模糊的单个人脸，通常需要高分辨率的底层特征，但由于高层卷积的视觉感受野较大，导致直接使用底层特征进行检测会引入大量非人脸噪声。因此，为确保算法针对不同尺度的人脸均具有良好的检测效果，我们在SSD主干网络的基础上，使用FPN（特征金字塔网络）对底层特征和高层特征进行聚合。同时，基于CPM（环境敏感预测模块），利用一个广而深的网络来吸收目标人脸周围的环境信息，进而提升预测网络的能力和最终输出的准确度。

    在SSD架构基础上，我们进一步引入DenseNet（密集卷积神经网络）模块加深CPM网络，以提升模型性能。密集连接结构可以更有效地传递信息，并保持更多的多尺度上下文特性，将此模块与CPM模块结合，增大视觉感受野，加深网络深度，以实现模型精度的提升。

    三是面向实时准确识别的算法设计。深度模型需要大量矩阵运算，其推理速度通常较慢，且需要较大算力才能满足实际需求。而且，由于深度模型可能部署在移动计算设备或边缘计算设备，导致其算力通常受到较大限制，这也将极大限制模型在实际场景下的应用。为了对模型进行压缩，提高模型运行速度，我们采用模型蒸馏的方式对复杂模型进行去冗余压缩，同时采用MobileNet（轻量级神经网络）对卷积操作进行分解，以加快模型的推理速度，进而满足模型的实时性需求。

    记者：目前，此项研究取得了哪些成果？存在哪些问题？

    陈洪磊：目前，通过自主研发的智能识别技术已经能够实现对我们单位近20万张数码照片档案的智能化整理和开发利用，人像照片档案单次查找利用时间从几天的人工排查缩短至分钟级甚至秒级的智能检索定位。可以说，研究已经取得了阶段性成果。具体来讲，有以下6个方面的成果。

    一是实现数码照片档案基于人像自动分类。人脸识别模型对所有人像照片档案进行人脸特征识别，并两两进行相似度计算，同时人脸识别模型设定照片内容相似度的阈值，相似度大于阈值的两张人像被认为是同一个人，赋以同类标识。

    二是支持对海量人像照片档案中人员信息数据的一键著录、批量智能治理。对一张人像照片档案进行人名等元数据信息著录，人脸识别模型将该著录项内容自动同步给该人员所有图片。

    三是支持以人像搜照片档案。对上传的人像图片进行人脸特征识别，并与照片档案中人像进行特征比对，瞬间检索出所有该人员的照片档案。

    四是实现照片档案群体人像识别。对密集人群进行人脸识别，如大礼堂中的成百上千张人像，可实现对每个人的人脸特征进行提取、比对。

    五是实现照片档案跨越长时间尺度人像识别。经过人脸特征提取、比对，可将某人两张分别形成于年轻时和十余年后的照片档案准确识别为同一人。

    六是实现照片档案模糊人像识别。人脸识别模型可对照片档案中处于角落的、侧脸的、低头的人员进行准确识别。

    当然，我们也遇到了一些问题有待进一步解决。如，智能识别技术应用后，对数码照片档案智能检索利用的权限控制有待进一步开发和细化；对于多人照片，不仅需要检索到该照片，还有待定位标识出具体的人物对象；人像照片分类展示界面的美观度有待优化等。

    记者：对于下一步如何推进和完善此项研究，您有什么计划？

    陈洪磊：首先，我们将完善现有模型，解决上面提到的问题。然后，进一步攻关能够识别照片中的文字的技术，如牌匾、奖状、题词等文字，实现以文字搜对应内容的照片。最后，依据武器装备、仪器设备、工程建筑等主要事物对照片进行智能分类。当然，更高目标是依托该技术，对照片中的人像、事物、场景、环境、活动等的识别和认知能够达到人类水平。

    原载于《中国档案报》2024年2月26日总第4102期第四版

责任编辑：实习编辑阮伸伸

版权所有，未经许可，不得转载。