基于Trip数据库的档案管理系统的设计与实现.doc

基于Trip数据库的档案管理系统的设计与实现.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Trip数据库的档案管理系统的设计与实现

第23 卷第1 期 2012 年2 月 中原工学院学报 JOURNAL OFZHONGYUAN UNIVERSITY OFTECHNOLOGY Vol.23 No.1 Feb.,2012 文章编号:1671-6906(2012)01-0044-05 基于 Trip数据库的档案管理系统的设计与实现 程传鹏 (中原工学院,郑州 450007) 摘 要: 结合 Trip 数据库在处理非规范性文档方面的优势,设计出了一种基于 Trip 数据库的档案入库系统,实现了纸质 档案的电子存储,为电子文档内容的直接检索做好了前期工作.实验结果表明,本系统提高了数据存储空间的利用率. 关 键 词: 非规范性数据;档案管理;Trip数据库;文本提取 中图分类号: TP391.07 文献标志码: A DOI:10.3969/j.issn.1671-6906.2012.01.011 随着计算机无纸办公技术应用的普及,各种格式 的电子文件 资 料 大 量 涌 现,不 仅 有 文 字 资 料,还 有 声 音、图像、动画、视频等等[1].这些文档结构无定、类型 各异、规格不一、长度参差,不能直接转化成关系数据 库的字段信息,因而不能被传统的关系型数据库管理 系统有效地处理,大大降低了这些数据的使用价值.据 统计,诸如此类的非规范性数据信息占了互联网上数 据的80% .传统 的 关 系 型 数 据 库 由 于 自 身 的 局 限 性, 已经远远不 能 满 足 今 天 非 规 范 性 数 据 快 速 增 长 的 需 要.为了解决关系数据库在非规范性数据处理上的不 足,1985 年瑞典 Paralog 公司在皇家工学 院 的 图 书 情 报检索专用软件3RIP 基础上,开发出了专为处理非规 范性数据的软件系统 Trip 系统[1].本文分析了 Trip 数 据库在处理非规范性电子文档上的优势,并在此基础 上,利用 Trip 数据库设计出了一种电子文档管理系统. 由字段组成,每一个字段容许存放任意多个实体.子字 段自动带有编 号,彼 此 相 互 独 立.Trip 记 录 的 字 段 长 度不限,设计数据库字段时不需预定其大小.关系型数 据库的字段长度在设计数据库时必须设定,装库时如 果数据内容不够量,它就不会“省”出没用完的空间,而 数据多于设定 值 时,超 过 部 分 又 没 法 存 进 去.Trip 是 多维结构的数据库,比较适合于大量不定长数据的存 储.Trip数据库 是 面 向 大 数 据 对 象 设 计 开 发 的,数 据 库文件只由3 个文件组成,分别是数据文件 baf、检索 词文件 bif和词根文件 vif,因此数据库的 存储、复制、 查询、维护都很方便.对于数据量以“百万字节”计的多 媒体信息的存储而言,Trip是很好的选择. 此外,Trip可 随 时 追 加 新 字 段.如 首 次 设 计 数 据 库时建立了20 个字段,使用一段时间后要增加5 个字 段,这时只需加上这5 个字段即可,已有记录中的数据 照常使用.而关 系 型 数 据 库 则 做 不 到.Trip 是 管 理 存 储各种电子文档资料的最佳解决方案,它有一种专门 存储二进制数据的字段,不仅能存储多达 200 多种不 同格式 的 电 子 文 件,如 Word、PDF、PowerPoint、Ex- cel、Access等[2],而且 能 自 动 抽 取 这 些 文 件 之 中 的 文 字信息,形成倒排文件,供人们进行全文内容的快速查 找.在处理非 规 范 性 数 据 方 面,尤 其 是 当 前 普 遍 面 临 Trip 在处理非规范性数据方面的 优势 1 目前的档案管理系统大都是基于关系数据库的, 但关系型数据库是二维平面结构,表的一行表示一个 记录,表的一列代表记录中的一个字段,一个字段只允 许 放 一 个 实 体 .Trip是 多 维 结 构 的 数 据 库 系 统 ,记 录 文、图、音、视 信 息 等 大 量 多 媒 体 信 息 管 理 的 情 况 下, Trip要比关系型数据库强很多. 收稿日期:2012-02-04 作者简介:程传鹏(1977-)男,河南信阳人,讲师,硕士. 机能够存储的数字化成果,即对所有未数字化的档案 进行扫描,整理其属性信息,并进行数据存储,最终为 数字化档案提供安全高效的管理方法,从而取代现有 的管理方式[3].档案管理系统结构如图1 所示. 档案管理系统主要实现如下4 个方面的功能: (1)档 案 扫 描 .改 变 了 传 统 的 用 扫 描 仪 扫 描 档 案 系统分析及设计 2 系统目标 档案数据库管理,首先要将纸质档案转变为计算 2.1 图1 档案管理系统结构图 的方法,采用系统控制高速扫描仪方式进行扫描,既保 证了扫描档案的

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档