- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
C计算机检索基础知识
计算机检索原理 计算机信息检索是指利用计算机存储和检索信息。 具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。 计算机 通信网络 检索终端设备 数据库 计算机检索基础知识 逻辑算符 截断算符 位置算符 检索词的确定 检索式的制定 逻辑“与”:AND ;and;* 定义:用于交叉概念或限定关系的组配,即被命中的文献必须同时含有检索项A和B。 作用:可缩小检索范围,提高查准率。 要求:运用时,把出现频率低的检索词置于“与”的左端,可使答案尽早出现,节省机时。 作用:减少检索词的输入量,扩大检索范围 ,提高检索效率。 注意:使用截词检索必须慎重,词干不要太短,以免检出许多与原来检索词不相关的文献记录 位置算符 (W)与(nW)算符—— (W)表示其两侧的检索词必须按照前后顺序出现在记录中,而且两词之间不允许插入其他字符和单词,只允许有空格或一个标点符号。 (nW)中的n表示两检索词中间允许插入的单词数目少于或等于n个,算符两侧检索词的词序不能颠倒。(nW)算符主要用来代替检索式中出现的the,of等禁用词。 (N)与(nN)算符—— (N)表示其两侧的检索词位置可以颠倒,但两词之间不允许插入其他字符和单词。 (nN)中的n表示两检索词中间允许插入的单词数目少于或等于n个。 (nN)算符也是用来代替检索式中出现的the,of等禁用词,不过两检索词的词序可以颠倒。 选择检索词时应注意以下问题: 1、选择能代表本课题技术特征的、具有实质意义的词。这些词应为专业通用词、惯用词和术语。 2、注意同义词(包括缩写)、词的英美式不同拼写及不同词性的词。这些词之间的关系均为“或”。如上部分所举的例子。 相同概念检索词扩展 1、同义词扩展法 同一概念,尽量选择不同名称(学名、俗名、简称、全称)、不同拼写、单复数形式等。 2、截词法 词干相同,词义相近,但词尾或词中有变化时,可采用截词算符扩展检索词。 3、主题词表法 尽量选用词表中的规范词。利用词表的上位概念、下位概念扩大或缩小主题范围。 恰当选择检索词 1、要尽量使用单元词 2、概念不能过大或过小 3、多主题概念的选词以“简”为主 4、词语要规范化 计算机检索的特点 检索速度快 检索途径多 更新快 资源共享 检索方便灵活 直接输出检索结果 数据库结构 记录 record:描述一个原始信息的外部特征和内部特征 字段 field:组成记录的数据项目 文档 file:数据库中一部分记录的有序集合 记录 是数据库的基本单元,是对某一实体属性进行描述的结果。一个数据库由若干条记录构成。每条记录相当于文摘型或题录型检索刊物的一条著录款目。 字段 是文献记录的基本单元。一条记录有若干个字段,一个字段有时还可分为几个子字段(Subfield)。在书目数据库中,一条记录应包含原始文献的篇名、作者、刊名、出版时间、分类号、文摘、主题词等字段。 数据库的字段可分为基本字段和辅助字段: 基本字段主要是描述文献内容特征的字段,如篇名、文摘、叙词、自由标引词等字段; 辅助字段主要是描述文献外表特征的字段,如著者、机构名称、语种、文献来源等字段。 文档 若干条逻辑记录构成的信息集合。文档是书目数据库和文献检索系统中数据组织的基本形式。 根据数据库的内部结构,一个数据库至少包含一个顺排文档和一个倒排文档。 顺排文档 是按文献记录的输入顺序(即文献序号)排列的文档。相当于印刷型检索工具的正文部分。 在顺排文档中,记录按顺序一个接一个地存放,一个存取号对应一条记录,存取号愈大,对应的记录就愈新。由于它存贮有记录的最完整的信息,所以,通常又把它称之为主文档(Master File)。 这种存贮方式决定了对记录的存取只能按顺序进行。如果在顺排文档中检索,对每个检索式都得按顺序从头到尾进行扫描,存贮的记录愈多,扫描的时间愈长,从而严重影响了检索的速度。 主要供用户输出和打印文献记录用。 倒排文档 把顺排文档中的标引词抽出,按标引词的字母顺序依次排列而成的文档。倒排文档实际上相当于印刷型检索工具中的辅助索引。 倒排文
文档评论(0)