- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲_计算机检索技术及搜索引擎应用,搜索引擎信息检索实践,搜索引擎的检索方法,搜索引擎检索,百度搜索引擎检索技巧,信息检索与搜索引擎,信息检索搜索引擎,全文检索搜索引擎,搜索引擎检索方法,信息检索库搜索引擎
计算机检索技术及搜索引擎应用 必须找? 哪里找? 如何找? 第一节 计算机检索技术 计算机检索的实质:匹配运算 计算机检索技术 1.1 布尔逻辑检索技术 布尔逻辑检索技术就是利用布尔逻辑算符进行检索项的逻辑组配,用以表达检索者的提问概念。 布尔逻辑算符指规定检索词之间相互关系的运算符号,在检索表达式中起着逻辑组配的作用 1.1 布尔逻辑检索技术 常用的布尔逻辑运算符: 逻辑“与(AND)” 逻辑“或(OR)” 逻辑“非(NOT)” 运算顺序 1.1.1 逻辑“与” 运算符:AND 或 * 用于交叉概念或限定关系的组配,实现检索词概念范围的交集。 表达式: 1.1.1 逻辑“与” 作用 缩小检索范围,提高查准率。 举例 检索“人口控制”或者“控制人口”方面的文献信息。 人口 and 控制 1.1.2 逻辑“或” 运算符:OR 或 + 用于检索词并列关系(同义词、近义词)的组配,实现检索词概念范围的并集。表达式: 1.1.2 逻辑“或” 作用 扩大检索范围,防止漏检,提高查全率。 举例 检索“计算机” 方面的文献信息。 计算机 or 电脑 使用的注意事项 如果检索词涉及表达整体概念,要针对具体情况分别列出每个表达部分概念的检索词,否则将出现漏检。 1.1.3 逻辑“非” 运算符:NOT 或 - 一种排斥关系的组配,用来从原来的检索范围中排除不需要的概念。表达式: 2.1.3 逻辑“非” 作用 缩小检索范围,增强检索的准确性。但使用不当,易排除有用文献信息,从而导致漏检 举例 检索有关能源方面的文献信息,但不包括核能。 energy not nuclear 使用的注意事项 两个关系紧密的检索词不宜用not 1.1 布尔逻辑检索技术 有关 搜索引擎 2.1 搜索引擎的定义、原理、分类 2.2 Google及其使用技巧 2.3 其它搜索引擎 2.1.1 搜索引擎的定义 搜索引擎是一个提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 搜索引擎常常是用户利用网上资源的第一途径。 2.1.2 搜索引擎原理 从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 大多数搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。 2.1.3 搜索引擎的分类 按检索机制划分 按检索内容划分 按数据来源划分 (1)按检索机制划分 全文搜索引擎 目录式搜索引擎 元搜索引擎 全文搜索引擎 从互联网上提取的各个网站的信息而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。 优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等高级功能。 缺点:繁多而杂乱的感觉。 代表性的全文搜索引擎是Google、百度。 目录式搜索引擎 通过用户浏览层次类型目录来寻找所需信息。 分类一般按主题分类,并辅之以年代、地区等分类。 网站多以此方式组织。例如:新浪分类目录计算机与互联网 硬件行情报价。 优点:使用户清晰方便地查找到某一大类信息,尤其适合那些希望了解某一范围内信息,并不严格限于查询关键字的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。 代表性的目录式搜索引擎是Yahoo、搜狐、新浪网站 元搜索引擎 同时在其他多个引擎上进行搜索,并将结果返回给用户。 没有自己的数据库,利用一个统一的界面,查询其他独立的搜索引擎。 优点:快捷,信息覆盖面更加广泛 缺点:高级检索功能不完善,检索结果没有经过处理 著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有北斗、等。 MetaCrawler 1995年由华盛顿大学推出,1997年被InfoSpace购买。 支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。 检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。 高级检索模式可实现:搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最
您可能关注的文档
最近下载
- (湘科2024版)科学一年级上册全册教学案.pdf VIP
- 环氧磨石地坪施工方案.doc VIP
- 2024-2025学年统编版(2024)小学道德与法治五年级下册(全册)教学设计及反思(附目录P110完整版).docx VIP
- 四川省2024年普通高等学校高职教育单独招生文化考试(普高类)语文真题及答案解析(真题解析版).docx VIP
- 混龄游戏活动对小班幼儿社会性发展的影响研究.pdf VIP
- 2025道路沥青红外光谱法快速识别技术规程.docx VIP
- 输变电工程标准工艺(变电工程电气分册)2024版.pptx VIP
- 《VFD-E_使用手册》.pdf VIP
- 小学五年级数学课题研究计划.docx VIP
- 2025《基于S7-1200控制器的S电站渗漏排水系统电气控制设计》14000字.docx VIP
文档评论(0)