平谷区档案馆档案数据整合和存储策略分析.docVIP

平谷区档案馆档案数据整合和存储策略分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
平谷区档案馆档案数据整合和存储策略分析

平谷区档案馆档案数据整合和存储策略分析   摘要:本文以平谷区档案馆为例,对档案数据整合与存储提出策略分析,即通过从分散到集中、从异构到同构、从综合到专题、从独立到共享实现档案数据的整合;在档案数据的存储上,实现分布式集中存储策略。   关键词:档案数字化数据整合数据存储   档案数据整合是指把原来通过各种渠道收集到的零散的档案数据,通过技术手段和方法,进行数据结构重构或数据结构匹配,以形成相对规范的档案数据。档案数据存储则是把档案数据以某种格式记录在计算机内部或外部存储介质上。档案数据的整合与存储主要是为了实现档案数据结构的合理配置及优化,通过对档案数据的整合,形成体系完整、内容丰富的档案数据。目前,北京市平谷区档案馆保存着大量的档案数据,而且呈TB级增长,特别是档案数字化后,数据的整合和存储变得更为复杂。基于此,笔者以平谷区档案馆的在相关方面的具体做法为例,对档案馆的数据整合与存储提出建议,以供探讨。   一、平谷区档案数据来源及其分类   (一)案卷级、文件级电子目录   1.从各立档单位接收的案卷级、文件级电子目录。平谷区档案馆以每五年为一轮从各立档单位接收纸质档案,且每年都要接收案卷级电子目录和文件级电子目录。比如1996~2005年期间,共接收电子目录26万条。   2.从各村接收的案卷级、文件级电子目录。平谷区档案馆在新农村档案示范区的建设中,从各村收集了部分案卷级、文件级电子目录。内容主要涉及10类村级重点档案,包括两委换届、林改档案、产改档案、养老保险、合作医疗、网格化管理、村集体经济管理、户口底册、计划生育、承包合同。此外,村务管理档案、农村科技档案作为涉农档案的重要来源,其形成的档案数据量也很大。   (二)从各立档单位接收的电子文件   自2005年至今,平谷区档案馆共接收电子文件11.6万件,数据总量73.5GB,包括文本文件、数据文件、图形文件、图像文件、影像文件、声音文件。   (三)各类档案的电子目录和数字化形成的电子版扫描件   平谷区档案馆馆藏目录主要分成14类基础数据库,包括文书档案、婚姻档案、房产档案、老土地照档案、招工档案、知青档案、兵役档案、独生子女档案、教学档案、二胎档案、现行文件档案、开放档案目录、老报刊目录、声像档案目录。截至2015年,共整理案卷级目录13.7万条,文件级目录153万条。数据总量1.5GB。据2015年5月传统载体档案数字副本的统计数据显示,历年来,平谷区档案馆共数字化纸质档案12.38万卷,700万页,数据总量8TB。数字化录音、录像131盘,数据总量1.5TB。   (四)通过档案业务系统采集的数据   平谷区档案馆业务系统主要包括4个,一是平谷区档案信息网,二是平谷区数字档案平台,三是平谷区村级档案信息管理发布平台,四是平谷区档案工作管理系统。这四个系统每年产生的数据总量在40GB左右。以2011年平谷区村级档案信息管理发布平台为例,全年度,平谷区村级档案信息管理发布平台产生数据总量1.2GB。其中,从镇罗营镇上镇村采集案卷级电子目录283条,文件级电子目录2030条;从大华山镇大华山村采集案卷级电子目录481条,文件级电子目录1809条。   二、平谷区档案数据整合的策略分析   平谷区档案数据来源于不同的基层单位(全宗),不同的数据库,不同的系统,无论数据结构还是数据内容上都会存在差异。结构化数据(行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)也好,非结构化数据(视频、音频、图片、图像、文档、文本等)也好,虽然已经按照全宗进行分类,但依然零乱、不便管理。通过整合、存储,数据清晰、结构统一,更便于档案数据的收管用。   (一)从分散到集中,将分散于乡镇、行政村的档案基础数据集中到档案馆保存   平谷区档案馆要求各立档单位每年6月到10月,将上一年度的电子目录和电子文件,通过平谷区数字档案平台和平谷区村级档案信息管理发布平台来实现数据的集中上交。   1.利用平谷区数字档案平台实现对乡镇档案基础数据的集中。该平台链接在平谷区政务内网中,可以覆盖到平谷区所有乡镇、委办局,这样每个单位的档案室都可以连接政务内网,因此实现了档案数据在乡镇、委办局这一层级的数据集中。自2008年至2014年底,平谷区档案馆利用该平台共接收档案目录3万卷、24万条,电子文件1.2万件,数据总量达20GB。可以说,通过这种方式,基本上实现了网络环境下文件归档、移交馆室的一体化;档案管理馆室的一体化;档案利用馆室的一体化;档案工作监督指导馆室一体化的工作模式,为各立档单位电子目录和电子文件的实时归档移交提供了支持平台。   2.利用平谷区村级档案信息管理发布平台,实现对全区273个行政村的案卷级和文件级目录的收集工作。2010年

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档