- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四节 计算机信息检索概述 一、计算机信息检索概况 计算机信息检索是指利用个人计算机或计算机网络终端,运用特定的检索指令将检索提问标识输入计算机,在计算机检索系统的数据库中查询和输出所需信息的过程。 计算机检索分为信息存储和检索两个过程。 历史 1.脱机检索阶段(1954-1964) 2.联机检索阶段(1965-) 3.光盘检索(1985-) 4.网络检索(1990-) 二、计算机检索原理和特点 (一)检索原理 数据库:数据库是存储文献信息的仓库,是在存储设备上合理有效信息的集合。 记录和字段:是构成数据库的信息单元,每条记录都描述了一个信息体的外表和内容特征,描述和构成记录的各个数据项叫字段,如题名字段、著者字段等。 (二)计算机检索特点 1.检索速度快 2 .内容新 3.范围广 4.途径多、功能完善 5.操作简单、易用 6.不受时空的限制 7.检索结果的输出方式丰富多样 三、计算机检索基本技术 (一)布尔逻辑运算: and、or、not (二)截词检索: *、? 、#。如,smok* 、apple? 。 (三)位置运算:(W)和(nW)、(N)和(nN)、(F)、 (S)等 如,information(3W)retrieval (四)限制检索:solar energy in ti solar energy /ti (一)布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过“与(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来 。 逻辑算符举例 查找关于“动物保护”的文献: “动物”和“保护” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检出记录中既涉及动物又涉及保护的相关文献。 查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献中包含三者任意一种即被检出。 查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。 检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为:(西红柿+番茄)*(种植+栽培+培育) (二)截词检索 截词检索(truncation retrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。 由于西文的构词特性:单复数形式不一致、英美拼写不一致 、前缀+词干、词干+后缀。 检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。 按截断的位置来分;按截断的字符数量来分。 截词符多采用通配符“?”、 “*” 、 “$”等,因此,截词检索有时也称为通配符(wildcard)检索。 按截断字符数量: 有限截断:computer? ?(0-1个字符);coputer??(0-2个字符);computer???(0-3个字符。 无限截断:computer?(0-N个字符) 按截词算符位置: 前截词:?computer 后截词:computer? 前后截词:?computer? 中间截词:wom?n (三)位置检索 位置检索又称为“邻近检索”、“词位检索”是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。 检索“生物防治”的文献,若用检索式“biologcal * control” 检索,则会将“抑制生理”(control biological)的文献也查出来。 (W)与(nW)算符 (W)算符是“With”的缩写,表示此算符两侧的检索词必须按此前后邻接的顺序排列,顺序不可颠倒,而且检索词之间不允许有其他的词或字母,但允许有空格或连字符号。例如:输入gas(W)condensate可检索出包含gas condensate 和gas-condensate的记录。 (nW)算符是“nWords”的缩
您可能关注的文档
- 盗窃罪及职侵占的区别.doc
- 公司概论平作业简答题.doc
- 公司解散与算的法律问题.doc
- 公司清算组法律地位探讨.doc
- 公司社会责文献检索报告.doc
- 公司营业执被吊销后责任承担的法律理论依据.doc
- 估算课题研方案.doc
- 川大图书馆页介绍.ppt
- 公司治理大业试卷.doc
- 顾问工作内.doc
- 心脏监护病房护理实践.pptx
- 2024四川省泸州市江阳职业高级中学校工作人员招聘考试真题及答案汇总.docx
- 2024四川省绵竹市职业中专学校工作人员招聘考试真题及答案汇总.docx
- 交通运输与物流行业物流行业物流园区物流园区物流园区物流园区智能化升级报告.docx
- 交通运输与物流行业物流行业物流园区物流园区智能化管理报告.docx
- 2024四川省南部县职业技术学校工作人员招聘考试真题及答案汇总.docx
- 交通运输与物流行业物流行业物流园区物流园区物流园区物流园区物流大数据分析与应用报告.docx
- 2024四川省南充市高坪职业高级中学工作人员招聘考试真题及答案汇总.docx
- 交通运输与物流行业物流行业物流园区智慧化运营报告.docx
- 2024四川省南充外国语中等专业学校工作人员招聘考试真题及答案汇总.docx
文档评论(0)