- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非结构化档案信息和档案异构数据库管理系统研究
非结构化档案信息和档案异构数据库管理系统研究随着信息化进程的深入和加快,特别是电子政务建设的稳步推进,各行各业产生了各种数据类型的电子文件、电子档案,如何科学有效管理这些非结构化和不同数据库结构的档案信息是各级档案馆面临的迫切问题。与结构化档案数据相比,非结构化档案数据的数量增长速度更快,管理难度也更大。调查显示,全球数据量的85%都是非结构化数据,针对非结构化档案数据的归档和归档后的管理成了档案信息化工作的当务之急。为此,国家档案局档案科学技术研究所在财政部申请了科研专项课题――“非结构化档案信息及异构数据库管理系统研究”,以探索较佳的档案信息整合模式,实现对分散在各地档案部门异构的、非结构化的开放档案信息资源进行有效整合、安全存储、高效维护、便捷利用。该课题获XX年国家档案局优秀科技成果一等奖。本文主要对总体架构的选择和优化、信息交换平台和档案资源利用平台进行介绍。
一、总体架构的选择和优化
课题对三种系统架构模式进行了比较,最终选择了一套适合本课题的系统架构模式
大型网络应用系统在架构选型上基本可以分为两大类型,即集中式与分布式,两种方案的基本思想如表1所示
综合集中式架构与分布式部署方案一的优点,尽量避免不同构架的缺点,结合各地档案馆实际建设情况,经全面考虑,项目提出并采纳了分布式构架方案二
基本实现思想是:
(1)中心服务器主要从管理的角度人手,各地方档案馆按要求到中心服务器注册;
(2)各地方档案馆自己维护索引服务,全文数据;
(3)各地方档案馆提供索引查询服务、开放接口,中心服务器通过web Service的方式检索文件;
(4)各地方档案馆提供全文展示服务站点;
(5)中心服务器提供门户、档案检索服务、系统后台管理平台
分布式方案二(表2)具备以下优点:
(1)中心服务管理方便,中心服务器管理人员主要负责管理与审核等工作;
(2)系统建设资金投入比集中式架构需要的软硬件配置大大降低;
(3)中心服务器不存在索引服务器和全文服务器的管理维护问题,没有存储压力;
(4)各地方档案馆各自维护档案数据,索引文件和全文数据都不需要上报;
(5)单个档案馆子系统一旦不能正常运作,不会影响对其他档案馆系统资源的查询;
(6)各地档案资源更新的周期取决于各自的索引创建计划,在数据更新的时候只要启动索引文件创建任务即可,避免了索引文件与档案资源不匹配的问题;
(7)开放档案数据的权限由各地方档案馆控制
分布式方案二缺点:
(1)档案资源检索展示效率没有集中式架构快,因为索引文件和全文内容是分布式部署,访问效率取决于网络状况和各地档案全文服务器性能;
(2)各地方档案馆都需要一定的软硬件资金投入
二、信息交换平台
课题对子站点的架构进行了设计,提出了既有数据的使用方案,开发了中心服务器后台管理平台
1.子站点总体设计
前置机子站点分布安装于各地档案馆中,主要负责各地档案馆可公开的档案信息的整理、索引创建,向中心服务器提供查询服务,并且向普通用户提供指定信息的档案浏览功能。具体架构设计用图(表3)表示:
子站点具有数据维护、查询服务、索引创建、档案信息浏览4类功能
2.既有异构档案数据和非结构化档案信息的使用方案
既有的异构档案数据,可以分为基础数据库和特色档案数据库两部分,为此课题组定义了基础数据库的结构,以便于开放档案信息资源的利用
(1)基础数据库。对于基础数据库的档案数据,子站点软件预先在系统中预装表结构,并提供标准的导入导出工具,安装软件后可以立即进行标准数据的导人工作。导入导出工具提供通过中间文件和直接对数据库导入两种方式。中间文件导人的具体操作方式是:先将既有数据库中的数据导出到预定义格式的XML文本文件中,如果数据量大可以根据主键分批导出,再导人到新数据库中;直接数据库导人的处理方式是:在应用系统中,提供设置新旧数据库字段对应关系的功能,并且可以根据主键灵活指定导入计划,可一次导入或分批导人
(2)特色档案数据库。对于特色档案数据库,子站点软件提供根据用户要求灵活建立数据库表的功能,先根据个性化数据要求,建立相应的数据库表,然后再利用标准化数据的处理手段,导入个性化数据
(5)非结构化档案信息。对于非结构化档案信息,子站点软件提供了基于软件的文件拷贝功能;如果数据量比较庞大,可以不采用拷贝的方式,而是根据既有数据的实际情况采用网络或本地资源直接读取的方式进行资源访问,以提高数据的利用效率,这种数据利用的前提是通信链路须畅通。如果现有数据存储在与本系统物理隔离的地方,应该采用存储中介进行数据迁移
3.中心服务器后台管理平台
中心服务器后台管理
原创力文档


文档评论(0)