计算机检索技术论文.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机检索技术论文 档案信息计算机的检索 一、档案信息计算机检索的特点 一是信息存储量大、检索速度快、检索效果好。二是检索途径多元化。三是档案信息的检索对计算机系统的依赖性强。运用计算机检索档案信息的查全率、查准率与档案工作者、利用者熟练掌握计算机检索文档的知识及检索技能的掌握有着密切的关联,特别是在档案信息服务经济建设和服务民生工作中,要求档案工作者不仅要掌握计算机档案检索知识,而且要向广大的利用者普及档案检索知识,才能有效地提高档案信息的利用效益,极大地扩展档案工作的社会影响力,提高档案工作的社会地位。 二、档案计算机检索系统的建立 建立功能完善的档案计算机检索系统,应科学地进行检索流程和档案信息检索级别设计。 一计算机检索流程设计。档案计算机检索流程包括档案文献信息的输入和档案文献信息的输出两部分,具体流程如图所示。 1 档案文献信息的输入。计算机文献检索系统的基础是数据库的建立,包括文献的选择、标引、加工和输入等一系列的过程,数据库的数据数量和质量对于计算机检索系统的性能具有直接影响。为适应档案现代化管理需要,建立统一的档案检索和管理体系,更好地开发档案信息,实现档案信息共享,目前,我国各省市国家档案馆均制定了《综合档案馆电子目录数据库结构与交换格式》。该标准分别制定了适用于文书立卷改革前的档案目录的《案卷级目录数据库结构与著录格式》和适用于按照DA/T22-2000《归档文件整理规则》整理的档案目录的《文件级目录数据库结构与著录格式》。文档管理系统机读目录输入规范,采用1992月1日实施的《档案著录规则DA/T 18-1999》的著录项,文档管理软件在案卷级著录和文件级著录选取的主要著录项目字段有:题名、并列题名、文件编号、责任者、附件、稿本和文种、密级与保管期限项、文件形成时间项、载体类型、数量及单位、分类号、档案馆代号、档号、电子文档号、缩微号、主题词或关键词。 2 档案文献信息的输出。利用者根据对档案文献的信息需求,编制恰当的检索条件,形成检索表达式,并将其输入计算机,在数据库查找后将结果输出。 二档案信息检索级别设计。检索级别是衡量检索深度和检索精度的重要标准。档案信息计算机检索,检索级别越小、越低、内容越具体,说明检索的精度越高、检索的深度越深。 1 案卷级检索。案卷级检索是指检索出的档案只能是案卷级目录,而无法一次检索出其卷内的具体文件,其检索依据是用案卷目录来建立的案卷级目录数据库。档案工作者都知道拟写案卷题名是一件比较困难的事情,规定字数不能超过五十个汉字,且题名要尽可能涵盖卷内文件的内容,即案卷题名的内涵尽可能等于卷内文件的外延。由于档案工作者水平不一,拟写的案卷题名涵盖不了该案卷所有的文件内容。检索文书档案内容方面,档案馆室很少采用案卷级检索功能,而在科技档案和专门档案检索中经常使用。 2 文件级检索。利用计算机检索工具不仅可以按著录项目进行单项检索,还可以把若干项目结合起来检索,均可检索出具体的文件即文件级检索,以满足利用者获取档案信息的需求。作为文件级检索,是档案馆室经常采用的档案文献检索手段,其具有一次输入、多次输出、多样化输出的功能。文件级档案文献的查准率和查全率,取决于操作者对档案著录项目的组合而设置检索条件,凡输入计算机的每一个检索著录条目为一个检索,如把文件的责任者、题名、时间3项目结合起来检索,可以获得满足这3个检索条件的档案文献。在检索工具中还可通过主题标引和分类标引的手段揭示出文件内容所涉及到的概念性主题或所属逻辑类别,这类检索有时被称为“内容级检索”。但因文件内容不能脱离开文件而单独存在,检索成果依然是一份份的文件,所以“内容级”严格说起来无法成立,只能归入“文件级”。 3 全文检索。全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。在功能上,全文检索系统需要具有建立索引、处理查询返回结果集、增加索引、优化索引结构等功能。结构上,全文检索系统具有索引引擎、查询引擎、文本分析引擎和对外接口等。全文检索弥补了文件级检索存在的不足之处,因为有的文件标题拟写不准确,或综合性的文件很难用标题完全表达,造成了计算机误检或漏检现象时有发生。全文检索系统是自然语言处理技术与海量内容管理技术的完美结合,它对网页、文本、电子文档和图像等非结构化的信息提供强大的管理功能,能有效地解决以上问题。 4 多媒体档案文献检索。所谓多媒体档案,是集声、光、电多种媒体于一体的档案。这种档案可以更真实地记录人

文档评论(0)

软件开发 + 关注
官方认证
服务提供商

十余年的软件行业耕耘,可承接各类需求

认证主体深圳鼎云文化有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91440300MA5G24KH9F

1亿VIP精品文档

相关文档