信息检索技术课件.pptVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索技术课件.ppt

第三节 机检基础知识 计算机检索式(逻辑表达式): 检索词+有关算符 1、布尔逻辑算符 2、截词算符 3、字段限定符 4、位置算符 造成误检或漏检的原因 1)课题分析不透;“学科归属”不清。 2)“语言”不通。 3)主题概念不是大了,就是小了。 4)“同义词库”不全 5)核心词太多 6)选择的检索工具专业性不够。E-journal or search engine? 1)课题分析不透;“学科归属”不清。 对课题的真正含义和学科归属不清楚,会造成最大的失误。 如查找有关“玻璃钢”制造工艺方面的资料,如果从字面含义着手,以为它属玻璃工业或金属材料的范畴,而事实上,玻璃钢既不属硅酸盐工业里的玻璃类,也不属金属材料里的钢铁制品,而是合成树脂与塑料工业里的增强、填充塑料制品。 如果没有认真分析课题的真正含义和学科归属,就匆匆着手检索,往往会欲速不达,或多走弯路,甚至导致失败。 2)“语言”不通。 基于计算机的文献检索的特点与其说是人机对话,不如说是标引人员与检索人员的对话,只有标引人员与检索人员所表达的“语言”一致,才能顺利实现文献检索。 往往检索工具使用的是标引语言,而检索者使用的多数是自由词,未经规范化,这样在表达方式上有差异,造成了检索障碍。如: 自由词:维生素 C (vitamin C);标引词 :抗坏血酸 (ACID,ASCORBIC) 自由词:艾滋病 (AIDS); 标引词:ACQUIRED IMMUNODEFICIENCY SYNDROME(后天免疫缺陷综合症);又如“沙示”(SARs), 禽流感(Bird flu)……. 3)主题概念不是大了,就是小了。 检索者不知道如何正确定位课题的主题概念,往往会不是大了,就是小了,初学者更容易把概念偏大。 主题概念的范畴太大造成大量没用的文献被误检,太小造成重要的的文献被漏检。 如“石油工业的废水处理”,若用“废水处理”作为主题概念,就会太大,在《中国期刊网》中有1400多篇,如果我们知道石油工业主要排放的是毒性较大的含酚废水,那么主题概念定位在“含酚废水处理”就比较恰当了,此时查出的文献大概有20~30篇。 4)“同义词库”不全 往往同一件事情或事物,不同作者喜欢用不同的词来表达,这就造成了庞大的同义词库,如果偏偏你头脑中的“同义词库”不是那么全,造成漏见就不足为怪了。例: 艾滋病——艾滋病、爱滋病 碳纤维——碳纤维、炭纤维 聚四氟乙烯——PTFE,polytetrafluoroethylene, Teflon 设备——apparatus,equipment,device…… 汽车——car,automobile,vehicle…… 5)核心词太多 对于由A、B、C、D、E多个主题组合的多主题概念课题,如果将所有主题混在一起同时组配,会造成“零结果”现象。 因为,只要A、B、C、D、E其中之一的检索结果为零,则经过布尔逻辑“和”的运算,检索结果=A*B*C*D*E =0 。 6)选择的检索工具专业性不够 E-journals: 中文:中国期刊网、万方数据库系统、维普。。。。。。 英文:Elsevier…… Search engine: 北大天网,百度, GooGle, Yahoo! Openfind, ……. THE END THANKS A LOT * * 一、布尔逻辑检索 在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。 布尔逻辑(组配)算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、NOT/—(非)。 布尔逻辑检索: 即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。 1. AND 或 * 算符 实现逻辑“与”组配 检索时,命中信息同时含有两个概念,专指性强。 如:logistics AND e-commerce 一、布尔逻辑检索 在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。 布尔逻辑(组配)算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、NOT/—(非)。 布尔逻辑检索: 即运用布尔逻辑算符对检索词进行逻辑组配,表达两个

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档