- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Trip数据库的档案管理系统的设计与实现
第23 卷第1 期
2012 年2 月
中原工学院学报
JOURNAL OFZHONGYUAN UNIVERSITY OFTECHNOLOGY
Vol.23 No.1
Feb.,2012
文章编号:1671-6906(2012)01-0044-05
基于 Trip数据库的档案管理系统的设计与实现
程传鹏
(中原工学院,郑州 450007)
摘 要: 结合 Trip 数据库在处理非规范性文档方面的优势,设计出了一种基于 Trip 数据库的档案入库系统,实现了纸质
档案的电子存储,为电子文档内容的直接检索做好了前期工作.实验结果表明,本系统提高了数据存储空间的利用率.
关 键 词: 非规范性数据;档案管理;Trip数据库;文本提取
中图分类号: TP391.07
文献标志码: A
DOI:10.3969/j.issn.1671-6906.2012.01.011
随着计算机无纸办公技术应用的普及,各种格式
的电子文件 资 料 大 量 涌 现,不 仅 有 文 字 资 料,还 有 声 音、图像、动画、视频等等[1].这些文档结构无定、类型 各异、规格不一、长度参差,不能直接转化成关系数据 库的字段信息,因而不能被传统的关系型数据库管理 系统有效地处理,大大降低了这些数据的使用价值.据 统计,诸如此类的非规范性数据信息占了互联网上数 据的80% .传统 的 关 系 型 数 据 库 由 于 自 身 的 局 限 性, 已经远远不 能 满 足 今 天 非 规 范 性 数 据 快 速 增 长 的 需 要.为了解决关系数据库在非规范性数据处理上的不 足,1985 年瑞典 Paralog 公司在皇家工学 院 的 图 书 情 报检索专用软件3RIP 基础上,开发出了专为处理非规 范性数据的软件系统 Trip 系统[1].本文分析了 Trip 数 据库在处理非规范性电子文档上的优势,并在此基础 上,利用 Trip 数据库设计出了一种电子文档管理系统.
由字段组成,每一个字段容许存放任意多个实体.子字
段自动带有编 号,彼 此 相 互 独 立.Trip 记 录 的 字 段 长 度不限,设计数据库字段时不需预定其大小.关系型数 据库的字段长度在设计数据库时必须设定,装库时如 果数据内容不够量,它就不会“省”出没用完的空间,而 数据多于设定 值 时,超 过 部 分 又 没 法 存 进 去.Trip 是 多维结构的数据库,比较适合于大量不定长数据的存 储.Trip数据库 是 面 向 大 数 据 对 象 设 计 开 发 的,数 据 库文件只由3 个文件组成,分别是数据文件 baf、检索
词文件 bif和词根文件 vif,因此数据库的 存储、复制、
查询、维护都很方便.对于数据量以“百万字节”计的多
媒体信息的存储而言,Trip是很好的选择.
此外,Trip可 随 时 追 加 新 字 段.如 首 次 设 计 数 据 库时建立了20 个字段,使用一段时间后要增加5 个字 段,这时只需加上这5 个字段即可,已有记录中的数据 照常使用.而关 系 型 数 据 库 则 做 不 到.Trip 是 管 理 存 储各种电子文档资料的最佳解决方案,它有一种专门 存储二进制数据的字段,不仅能存储多达 200 多种不 同格式 的 电 子 文 件,如 Word、PDF、PowerPoint、Ex- cel、Access等[2],而且 能 自 动 抽 取 这 些 文 件 之 中 的 文 字信息,形成倒排文件,供人们进行全文内容的快速查 找.在处理非 规 范 性 数 据 方 面,尤 其 是 当 前 普 遍 面 临
Trip 在处理非规范性数据方面的
优势
1
目前的档案管理系统大都是基于关系数据库的,
但关系型数据库是二维平面结构,表的一行表示一个 记录,表的一列代表记录中的一个字段,一个字段只允 许 放 一 个 实 体 .Trip是 多 维 结 构 的 数 据 库 系 统 ,记 录
文、图、音、视 信 息 等 大 量 多 媒 体 信 息 管 理 的 情 况 下,
Trip要比关系型数据库强很多.
收稿日期:2012-02-04
作者简介:程传鹏(1977-)男,河南信阳人,讲师,硕士.
机能够存储的数字化成果,即对所有未数字化的档案
进行扫描,整理其属性信息,并进行数据存储,最终为 数字化档案提供安全高效的管理方法,从而取代现有 的管理方式[3].档案管理系统结构如图1 所示.
档案管理系统主要实现如下4 个方面的功能:
(1)档 案 扫 描 .改 变 了 传 统 的 用 扫 描 仪 扫 描 档 案
系统分析及设计
2
系统目标
档案数据库管理,首先要将纸质档案转变为计算
2.1
图1
档案管理系统结构图
的方法,采用系统控制高速扫描仪方式进行扫描,既保
证了扫描档案的
您可能关注的文档
- 场景选择.ppt
- 场强识别技术在TPMS自动定位中的应用.doc
- 均势谈判技巧.ppt
- 坏帐损失会计处理存在的问题及其改进.docx
- 坏账说课稿.ppt
- 坐标测设.ppt
- 均匀增粘剂.ppt
- 块体模型储量估算原理的应用研究.docx
- 坚守媒体责任弘扬亲情孝道.docx
- 坚守党员旧信仰_培养服务新意识.ppt
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)