- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四节 计算机信息检索概述 一、计算机信息检索概况 计算机信息检索是指利用个人计算机或计算机网络终端,运用特定的检索指令将检索提问标识输入计算机,在计算机检索系统的数据库中查询和输出所需信息的过程。 计算机检索分为信息存储和检索两个过程。 历史 1.脱机检索阶段(1954-1964) 2.联机检索阶段(1965-) 3.光盘检索(1985-) 4.网络检索(1990-) 二、计算机检索原理和特点 (一)检索原理 数据库:数据库是存储文献信息的仓库,是在存储设备上合理有效信息的集合。 记录和字段:是构成数据库的信息单元,每条记录都描述了一个信息体的外表和内容特征,描述和构成记录的各个数据项叫字段,如题名字段、著者字段等。 (二)计算机检索特点 1.检索速度快 2 .内容新 3.范围广 4.途径多、功能完善 5.操作简单、易用 6.不受时空的限制 7.检索结果的输出方式丰富多样 三、计算机检索基本技术 (一)布尔逻辑运算: and、or、not (二)截词检索: *、? 、#。如,smok* 、apple? 。 (三)位置运算:(W)和(nW)、(N)和(nN)、(F)、 (S)等 如,information(3W)retrieval (四)限制检索:solar energy in ti solar energy /ti (一)布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过“与(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来 。 逻辑算符举例 查找关于“动物保护”的文献: “动物”和“保护” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检出记录中既涉及动物又涉及保护的相关文献。 查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献中包含三者任意一种即被检出。 查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。 检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为:(西红柿+番茄)*(种植+栽培+培育) (二)截词检索 截词检索(truncation retrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。 由于西文的构词特性:单复数形式不一致、英美拼写不一致 、前缀+词干、词干+后缀。 检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。 按截断的位置来分;按截断的字符数量来分。 截词符多采用通配符“?”、 “*” 、 “$”等,因此,截词检索有时也称为通配符(wildcard)检索。 按截断字符数量: 有限截断:computer? ?(0-1个字符);coputer??(0-2个字符);computer???(0-3个字符。 无限截断:computer?(0-N个字符) 按截词算符位置: 前截词:?computer 后截词:computer? 前后截词:?computer? 中间截词:wom?n (三)位置检索 位置检索又称为“邻近检索”、“词位检索”是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。 检索“生物防治”的文献,若用检索式“biologcal * control” 检索,则会将“抑制生理”(control biological)的文献也查出来。 (W)与(nW)算符 (W)算符是“With”的缩写,表示此算符两侧的检索词必须按此前后邻接的顺序排列,顺序不可颠倒,而且检索词之间不允许有其他的词或字母,但允许有空格或连字符号。例如:输入gas(W)condensate可检索出包含gas condensate 和gas-condensate的记录。 (nW)算符是“nWords”的缩
您可能关注的文档
最近下载
- 《项目现场管理组织机构图及人员职责.doc VIP
- 2025年9月13日河北地级市遴选笔试真题及解析.docx VIP
- 1315002-0000-e0_生物化学需氧量(BOD5)测定仪通用技术规范.doc VIP
- 视频号0粉开播的3大技巧.docx VIP
- 2025年陕西电信校园招聘笔试备考试题及答案解析.docx VIP
- 部编版九年级语文上册艾青诗选PPT课件.pptx VIP
- 1405031-32-0000-00_±400~±800kV直流盘形悬式瓷(玻璃)复合绝缘子通用技术规范.doc VIP
- 2802003-0000-00-新一代高可靠变电站辅助设备采购技术规范(通用部分).docx VIP
- 2025年福建电信校园招聘笔试备考试题及答案解析.docx VIP
- 9014001-0000-00-劳务分包服务采购范本(第1部分:通用技术规范).docx VIP
文档评论(0)