- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三节 信息检索技术
The Information Retrieval Technology
;
1.检索算符
2.检索策略
3.检索评价
;第三节 信息检索技术;首先列出相关的检索词:互联网、青少年、影响。要注意的是,通常名词比形容词、介词、代词更适合作为检索的主题词,你知道吗?有些没有实际意义的虚词在检索中被称为禁用词(stopword),禁用词在检索时通常会被忽略掉;接下来试着把这些检索词组配起来:“互联网”和“青少年”和“影响” 常用到的连接词有AND(与)、OR(或)和NOT(非),下面的篇幅??向你展示连接词的用法;;(1)逻辑“与”(AND或*);当你希望所找的文章中包含两个或两个以上的检索概念时,你可以在检索式中用“AND”将这些关键词连接起来,表示这些关键词必须同时出现在记录中的某处。使用“AND”将缩小检索范围。 如: students AND Internet? 输入上面这个检索式,会找到关于students和internet同时出现的文章,只包含其中一个词的文章是不会被检索到的。因此, 在连接不同概念的检索词时,AND是非常有用的。在一个检索式中,AND可以被使用多次。如: students AND Internet AND assignments有的中文数据库用“*”来代替AND,就象下面的这个例子。当然,不是所有的中文数据库都支持这种用法,你可以查看帮助文件加以确认。如:学生 * 互联网 ;(2)逻辑“或”:用“OR”或“+”表示 ;例如 Internet OR Web 使用上面这个检索式,使用了网络的同义词。会找到有关Internet 或 Web的文献或Internet 与Web 同时出现的文献。也可以在一次搜索中多次使用OR:如:Internet OR Web OR online OR digital OR wired有的中文数据库在使用OR时需用“+”来代替:互联网 + 网络 + 在线 OR用于组配具有并列关系、概念相同或相近的检索词,如同义词、相关词等。用OR算符的基本作用是扩大检索范围,增加命中的文献量,提高检索的查全率。如:查找“肿瘤”的检索式为:cancer(癌)or tumor(瘤)or carcinoma(癌);(3)逻辑非:“not”或 “-”表示;需要注意的是,有的中文数据库在使用NOT时需用“-”来代替,就象下面的例子。当然,不是所有的中文数据库都支持这种用法,你可以查看帮助文件加以确认.如: 计算机 - 软件上述检索式用于查找只出现计算机而不出现计算机软件的文献,用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念。用NOT连接检索词A和检索词B,检索式为:A NOT B (或A—B)表示检索含有检索词A而不含检索词B的信息,即将包含检索词B的信息集合排除掉。 如:查找“动物的乙肝病毒”的文献的检索式为:hepatitis B virus(乙肝病毒) not human(人类);;1.2 截词算符( truncation )
;截词符用来对检索词(干)进行扩展。在不同的检索系统中,截词符有不同的表示方法,通常用 “?”或者“*”来表示。截词方式: 按截断的位置来分共有三种:后截断、中间截断、前截断;按截断的字符数量来分:有限截词(limited truncation)、无限截词(unlimited truncation)。平时用得较多的是后截断(无限截词和有限截词)和中间截断(仅允许有限截词)。 (1)后截断后截断即前方一致检索,是最常用的检索技术。将截词符放在一个词干的后边,以表示其后可有无限或有限个字符。;★后截断无限截词不说明具体截去字符的数量。截词符是在一个词尾加一个 ? 号,表示在其后可添加任意多个字符,这些字符都被作为检索词进行检索。无限截词通常用 ? 或 * 来表示把截词符放在字根的最后。如:behav?; 系统将找出 “behave, behaviour,behavioural”等等。 ★后截断有限截词说明具体截去字符的数量,截词符是在一个词尾加有限个 ?号,n个 ?号表示其后可添加的字符数少于等于n个。 如:smok?? ;系统 将对smoke , smoky , smoked , smoker , smokes等进行检索。对于最多允许添加一个字符的情况, 则用 ? ? 的形式表示。如:smok? ?;将只对 smoke , smoky进行检索。;(2)中间截断 中间截断是把截词符号放在一个检索词的中间。一般中间截断只允许有限截断。中间截词符也称通配符,是在一词中间用若干个
您可能关注的文档
- 保险理赔讲座.pptx
- 保险精算基本概念讲解.pptx
- 保险的起源培训课程.pptx
- 保险直通车轻松聊保险培训课件.pptx
- 保险营销心理学3.pptx
- 保险精算第一讲.pptx
- 保险精算学特殊年金与寿险.pptx
- 保险行业财产保险合同的基本原则.pptx
- 保险行业信息化建设建议书.pptx
- 保险规划培训教材.pptx
- GE PanaFlow MV82涡街流量计样本.pdf
- 中国东方电气集团公司校园招聘模拟试题附带答案详解最新.docx
- 上海迪比特实业有限公司校园招聘模拟试题附带答案详解及参考答案.docx
- 上海西门子移动通信有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版推荐.docx
- 2025年新疆维吾尔自治区巴音郭楞蒙古自治州和静县高三下学期物理基础题、中档题型强化训练.docx
- 2025年四川省凉山州盐源县高三下学期4月联考物理试卷.docx
- 上海西门子移动通信有限公司校园招聘模拟试题附带答案详解学生专用.docx
- 2025年四川省攀枝花市西区高三下学期第八周周测物理试卷.docx
- 中兴通讯股份有限公司校园招聘模拟试题附带答案详解含答案.docx
- 中国南方航空股份有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版完整版.docx
文档评论(0)