2026年档案信息化升级方案.docxVIP

  • 18
  • 0
  • 约4.43千字
  • 约 11页
  • 2026-03-04 发布于四川
  • 举报

2026年档案信息化升级方案

第一章现状与痛点

1.1存量结构

2025年底,市档案馆馆藏3.8万卷纸质档案、1.2万卷照片底片、0.7万卷缩微胶片、0.3万卷音像磁带,电子目录420万条,原生电子文件87万件,容量42TB。其中68%的电子文件为2003年以前扫描的单页TIFF,分辨率200dpi,无OCR;15%为2010年以后移交的PDF/A-1b,未做长期保存封装;17%为2019年以后形成的OFD、版式公文,已做数字签名,但未与纸质归档联动。

1.2系统孤岛

现有“馆藏管理系统”“电子文件接收平台”“数字化加工系统”“利用服务平台”四套应用,数据库异构(Oracle11g、SQLServer2012、MySQL5.7、PostgreSQL9.6),接口封闭,元数据字段互不一致,导致同一全宗同一案卷在四个库中存在4套档号,年度对账需3人·月。

1.3安全短板

①离线备份:采用LTO-6磁带,单盘2.5TB,满盘即封存,未做定期抽检,2024年抽检30盘,其中4盘CRC报错,占比13%。

②在线防护:互联网利用平台与内网物理隔离,但数据库审计日志仅保留90天,无法追溯“先查后改”型篡改。

③加密体系:仅做传输层TLS1.2,未实现对象级加密,敏感个人数据(出生医学证明、婚姻档案)可被内部高权限账号整库导出。

1.4业务堵点

查档窗口平均等待23分钟,其中80%时间消耗在“纸质调卷—扫描—打印”环节;跨馆利用需发函,平均耗时6.5个工作日;档案开放鉴定仍以Excel台账人工流转,2025年完成1985年前档案鉴定4.2万件,仅占应鉴定量的7%。

第二章目标与原则

2.1总体目标

到2026年底,建成“可信、可用、可持续”的市域档案数字中枢,实现“三个一百”:

①100%馆藏纸质档案完成600dpi彩色扫描+OCR+双层PDF/A-2;

②100%电子文件完成四性检测并封装为基于METS的长期保存包;

③100%民生档案实现“秒批秒办”,线上利用不超过3分钟。

2.2设计原则

①合规先行:严格遵循《电子文件管理暂行办法》《档案法实施条例》《GB/T18894-2016》;

②长期保存:采用“格式无关化+自描述+独立验证”策略,确保30年可读;

③微服务化:业务拆分为8个可独立部署的微服务,单服务故障不影响全局;

④零信任:默认不信任任何身份,每次访问均动态鉴权、最小授权、全程审计;

⑤绿色低碳:新机房PUE≤1.25,数字化加工环节单卷耗电下降20%。

第三章技术路线

3.1架构总览

采用“混合云+湖仓一体”模式:

①私有云:承载涉密及敏感数据,采用ARM架构国产服务器,麒麟V10操作系统,达梦8数据库;

②公有云:承载公众查询、预约、支付等非敏感业务,选用可信金融云,通过VPN+SSL加密隧道接入;

③数据湖:基于Hadoop3.3+Iceberg,统一存储影像、文本、音视频、日志,支持秒级回滚;

④微服务:SpringCloudAlibaba+Kubernetes,灰度发布、限流熔断、链路追踪。

3.2核心组件

层级

组件

选型

关键参数

接入

API网关

Kong3.4

单节点2万TPS,支持mTLS

服务

内容管理

FSCrawler2.10

日索引80万页,支持OCR并行

存储

对象存储

CephPacific

3副本+2纠删,可用性99.995%

元数据

图数据库

Neo4j5.11

十亿节点、百亿关系,毫秒级多跳查询

安全

加密模块

国密SM4/SM9

单CPU核心1.2Gbps加解密

3.3数据流转

①接收:电子文件通过OFTP2协议进入“接收微服务”,自动触发四性检测;

②转换:影像经ImageMagick+OpenCV实现去污、纠偏、压缩,生成JP2无损+双层PDF;

③封装:使用Python调用lxml生成METS文件,嵌入PREMIS事件、AES256加密;

④长期保存:写入蓝光光盘塔(12盘位100GB层),同时推送至数据湖冷存;

⑤利用:公众检索请求经图数据库定位档号,回源对象存储,CDN边缘节点缓存30分钟。

第四章数据治理

4.1元数据标准

以《DA/T46-2021》为核心,扩展5个自定义字段:

①敏感级别(0公开、1内部、2秘密、3机密);

②个人敏感信息标识(0无、1身份证、2婚姻、3房产);

③开放审核批次

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档