哈工程-信息检索课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2021/10/15 * ③ 二次检索 (Refined Search) 又称“在结果内检索” 在检索结果内进一步检索,使结果更精炼、准确。 2021/10/15 * ④ 组合检索(combined search) 在一个不间断的检索操作过程中,数据库会自动记录每一次检索所用的策略、时间、检出记录数。用户可以根据需要在此基础上进行合并检索。合并检索时,每一个单独检索所用的限制条件,在合并检索时会同时满足。 如下图,先行执行了S1与S2两个检索操作,S3是执行S2与S1的“与”运算。具体操作步骤是在S2执行结束的当前状态下,选中S1前的“添加至检索中”的复选框,点击“合并检索”后的“添加”按钮。需要注意的是,并不是所有的数据库系统都有这项功能。 2021/10/15 * 2021/10/15 * ⑤ 跨库检索 2021/10/15 * 八 信息检索技术 布尔逻辑检索 位置算符检索 截词检索与词根检索 字段检索 全文检索 其他检索技巧 2021/10/15 * 例:在维普数据库查找有关UFO的资料 概念分析:UFO 不明飞行物 2021/10/15 * 1 布尔逻辑检索 布尔逻辑检索即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。 A AND B A*B A OR B A+B A NOT B A-B A B A B A B 2021/10/15 * 课堂练习 WTO框架下的中国市场经济 WTO 中国 市场经济 对宋词韵律的美学思考 宋词 韵律 美学 潜器的文献普查 潜器 潜水器 水下机器人 2021/10/15 * 在EI中了解一下我校师生发表论文的情况 2021/10/15 * Ei数据库的位置算符: near/0 与 onear /0 near /0 词间顺序不固定 onear /0 词间顺利固定 Harbin onear/0 Engineering onear/0 University 2021/10/15 * 2 位置算符检索 位置算符检索即运用位置算符表示两个检索词间的位置邻近关系,又叫邻接检索。这种检索技术通常只出现在西文数据库,在全文检索中应用较多。 如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。 2021/10/15 * 3 截词检索(truncation)与词根检索(stemming) 用截词符号“?”“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索技术可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。 2021/10/15 * 2021/10/15 * 4 字段(field)检索 字段检索即指定检索词出现的字段,被指定的字段也称检索入口、检索点、检索途径。检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。 在数据库中,字段名称通常放置在下拉菜单中。 检索字段可以几个字段同时使用,以提高查准率,这种方式通常出现在数据库的复杂检索或高级检索中。 2021/10/15 * 2021/10/15 * 5 全文检索 全文检索是指直接对原文进行检索,从而更加深入到语言细节中去。它扩展了用户查询的自由度,使用户能对原文的所有内容进行检索,检索更直接、更彻底。 全文检索技术通常用于全文数据库和搜索引擎中,使用全文检索可能会提高查全率,但同样也会有很多不相关的信息出现。因此在标引工作做得比较好的数据库中,这种方法是在进行其它字段的检索后,仍无法得到满意的结果时才会使用。 2021/10/15 * 6 其他检索技术 嵌套技术(优先算符nesting):即用括号将优先检索的检索式括起来,系统会首先检索括号中的概念。也有检索系统会使用默认布尔逻辑算符顺序或二次检索方式来提供优先运算方式。 2021/10/15 * 大小写敏感(case sensitive):指西文检索系统中对用户检索式包含的大小写的处理方法。不同的系统处理方式不同。例如:检索词为“Apple”,有些系统严格地按照用户输入的大小写来处理,则检索结果只是“苹果”计算机、“苹果”牛仔裤或其他苹果品牌,这就是大小写敏感。有些系统的检出结果还会包括苹果等植物名称,就是大小写不敏感。 2021/10/15 * 禁用词表(stop words):在西文数据库检索中,系统对信息进行标引时,不能做标引词或检索词的语词,包括介词、冠词、代词、连接词、某些形容词或副词等。这部分词语由于使用频率过高,不能反映信息的实际内容,即使用户输入,系统也不会对其进行检索,又称停用词。如a an in for the should she well only等。由禁用词构成的

文档评论(0)

微微 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档