近日,为安全稳妥有序推进人工智能在档案行业应用,加快塑造档案工作数字化、智能化新形态,国家档案局办公室印发了《关于推进人工智能在档案行业应用的意见》(以下简称《意见》),现将有关情况给予说明。
背景与过程
当前,人工智能成为引领新一轮科技革命发展、推动产业变革的决定性力量。党中央、国务院高度重视人工智能发展。国务院印发《关于深入实施“人工智能+”行动的意见》,推动人工智能与各行业各领域广泛深度融合。《“十四五”全国档案事业发展规划》提出,要“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用”。即将出台的档案事业发展“十五五”规划落实国家部署,提出实施“人工智能+档案”。经过多年信息化建设,档案行业探索人工智能技术应用,形成了一定规模的信息化基础设施、丰富的档案数字资源,为人工智能应用奠定了基础,实践中重点推动人工智能技术同档案整理、鉴定、编研、利用、保存等业务的深度融合,取得积极成效。2025年7月,国家档案局成立起草组,拟写《意见》初稿。在已建成高水平数字档案馆的单位中征求意见,12月报国家档案局馆局长办公会审议。2026年1月,按照办公会要求,面向全国档案部门广泛征求意见,根据反馈意见形成《意见(报批稿)》,3月经国家档案局馆局务会审议通过后印发。
思路与方向
《意见》深入贯彻落实党中央、国务院有关政策要求,紧扣当前档案行业人工智能应用实际,立足档案行业信息化发展需求,着眼人工智能应用目标任务提出相关业务要求,进一步丰富和拓展人工智能与档案行业深度融合。对加快典型应用场景建设、依托档案科研攻关提升人工智能技术创新应用质量和效果、重点加强档案数字化建设、推进高质量数据集建设、完善档案数据安全管控、构建算力基础设施、创新应用场景建设等方面提出具体要求,为档案行业规范应用人工智能提供指引。《意见》还针对在建设过程中遇到的数据集建设质量不高、算法安全监控措施不足、算力资源保障力度不够、档案数据汇聚风险防范不强、智能应用场景应用不多、相关制度标准体系不全、云资源使用管理不规范等诸多问题提出了相应的管理要求和解决路径。
结构与内容
《意见》共四部分十条。
第一部分“总体要求”。明确档案行业推进人工智能应用工作的指导思想、工作原则和业务要求。
第二部分“有序推进应用”。针对人工智能应用中数据、算力、算法、场景、安全等方面提出落实要求,点出重点任务,指明发展方向,提出安全要求。
第三部分“强化安全支撑”。强调人工智能应用中存在安全风险,从安全管理制度建设、安全管控机制建设、防范档案数据失泄密风险等方面提出管理要求。
第四部分“统筹组织实施”。要求落实主体责任,推进应用落实落地。加强科研支持力度,整合科研力量,重点研究共性技术问题;加强制度标准体系建设,围绕系统框架、功能要求、应用场景、数据管理、评估审核等制定完善一批制度规范;坚持需求导向,避免重复浪费,提高大模型建设和复用能力;强调档案部门职责履行,不能过度依赖人工智能而忽视部门职责,应加强工作人员对人工智能应用结果的审核把关。
问题与措施
《意见》围绕档案行业应用需求,从基础能力建设、应用场景赋能、关键技术供给、创新模式应用等方面,细化明确了工作重点和方向,对部分共性难点问题指明了解决方向。
1.针对高质量档案数据集建设问题
高质量数据语料是深度应用人工智能的基座,没有数据就没有智能应用,数据质量不高、语料遭到污染,就会影响大模型判定结果,发生算法幻觉,产生安全风险。要坚持“存量数字化”战略,继续开展档案数字化工作,把馆藏纸质档案转化为档案数字化成果,按照标准规范要求,建设档案目录数据库,做好目录与前文挂接,确保目录数据质量和数字化成果质量。要推进档案数字化成果OCR识别,加快非结构化档案数据转为结构化数据,加强重要档案的文字、语音、图像识别工作力度,应用人工智能技术提升识别效率和质量。要加强档案数据质量管理,要做好档案数据收集,开展数据清洗、去除掉多余数据,形成具备数据完整性、准确性、安全性、可追溯性等特征,并且具有文字、视频等多模态的高质量档案数据集。
2.针对档案业务典型应用场景建设问题
业务场景创建的质量决定了档案业务与人工智能技术融合的质效。《意见》坚持需求导向,以档案工作需求为牵引,针对档案收集、管理、保存、利用等大业务环节,提出人工智能业务场景建设方向,明确了10余个典型场景应用方向。要求不断深化数据分析、深度学习、多模态、知识图谱、大模型等新技术应用,深化档案整理、档案著录、档案脱密脱敏、数据清洗、开放审核、档案编研、档案检索、专题库构建、影像档案修复、档案知识问答等典型应用场景建设,更好赋能档案业务发展。鼓励在现有实践基础上进一步创新丰富档案业务场景,推动档案业务全过程数智化建设,将单点场景进行整合,实现整体性、系统化场景构建,覆盖档案业务全过程、各方面。
3.针对档案部门建设使用算力等资源问题
国家正在推进建设全国一体化算力网,整合算力、数据等基础设施,各级档案部门要抓住机遇,争取算力资源,鼓励探索人工智能基础设施共建共用新模式,支持有条件的单位建设档案智能算力平台,向档案部门提供算力支持、模型训练、语料处理和推理研究等服务。要在确保档案数据安全的前提下,规范使用云算力资源,使用人工智能云算力服务时,要符合档案部门使用政务云等政策的要求。在部署人工智能应用时,未经档案部门授权,不得私自访问、修改、披露、利用、转让、销毁档案数据。同时明确了档案部门的安全底线,即不得将档案数字资源总库部署在非自建算力平台上。
4.针对人工智能算法安全管控问题
《意见》要求各级档案部门要加强算法安全风险的思想认识,开展人工智能应用时,应按照相关部门风险监测和安全预警信息,及时做好算法安全风险排查,查漏补缺、防患未然。要加强人工智能算法备案情况审核,做好相关应用的合规性审查,查看是否通过工信、公安、保密等部门的准入审批,做好应用上线前和使用过程中算法漏洞、数据泄露、数据污染、后门嵌入等风险防范。重视人工智能算法安全伦理风险研判,对潜在负面影响开展预见性风险评估。
5.针对档案数据安全管理问题
《意见》坚持底线思维,高度重视安全问题,对档案数据安全管理提出了明确的禁止性要求。针对人工智能应用时,需调用大量档案数据开展语料投喂、模型训练、关联分析、数据挖掘等操作中存在的安全风险隐患,提出防范失泄密管理要求。通过制定完善保密管理制度,规范人工智能技术选型、部署、训练、使用、废止等全过程保密管理。采取技术措施,对档案数据进行筛查,拦截涉密敏感信息,严禁将涉密档案、敏感档案数据用于开放大模型训练。防止档案数据被非法获取、篡改和泄露,防止未经审核审批开展多维度档案数据的交叉关联、深度挖掘,防止数据汇聚、关联引发的泄密风险。同第三方合作开发人工智能场景时,不得将档案数据用于测试。
6.针对人工智能应用支撑保障问题
《意见》要求加强统筹协调,强化组织实施,夯实保障支持措施,形成上下联动的工作格局,推动人工智能应用落到实处、取得实效。要加强科研支撑,整合科研机构、高等院校、企业的技术优势和资源,对人工智能应用的基础模式、关键技术、核心算法、业务场景等开展研究攻关,推动人工智能档案应用算法模型创新,加快模型研发和推广。要审慎评估档案业务应用人工智能的必要性,应注重场景、模型、算力兼容适配,推动大模型能力复用,尽量使用轻量化解决方案避免为“追热点”而盲目投入,造成资源浪费。
档案行业数字转型和智能升级,需要各级档案部门协同发力,国家档案局科技信息化司将紧紧围绕档案工作数字转型目标任务,进一步强化人工智能应用顶层设计、政策供给和业务指导,抓好《意见》贯彻落实和各项工作推进。
(作者:国家档案局 冯剑波 来源:《中国档案》)