搜索高手炼成三部曲——搜索引擎的原理、技巧与运用.docVIP

搜索高手炼成三部曲——搜索引擎的原理、技巧与运用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索高手炼成三部曲——搜索引擎的原理、技巧与运用.doc

  搜索高手炼成三部曲——搜索引擎的原理、技巧与运用   搜索高手炼成三部曲——搜索引擎的原理、技巧与运用      徐 炜      (江苏省靖江高级中学)      摘 要:《普通高中信息技术课程标准》中信息采集与加工模块是信息处理的起点。其中,通过计算机和网络进行信息的搜索是信息采集的重要途径。为了帮助人们在浩瀚的因特网中快捷、有效地搜索到所需信息,计算机技术专员研发了搜索引擎及相关技术,主要是针对Web页面的文本检索工具,能够迅速、准确地检索到用户需要的信息。在此,将重点研究全文搜索引擎的基本工作原理、提炼关键词的技巧及搜索引擎的灵活运用。      关键词:搜索;关键词;运用      现今时代,网络已经深入我们日常生活的每个角落,因特网已成为当今社会人们获取信息和相互交流的主要渠道。其中,通过计算机和网络进行信息的搜索是信息采集的重要途径。随着信息的不断增长,共享在网络上的信息量迅速膨胀,大容量的信息资源影响着网络信息的有序性,造成了人们及时查找信息或组织信息的困扰。为此,计算机技术专员研究与开发了搜索引擎,解决了人们的这一困扰。作为使用因特网的用户,知道搜索引擎的基本工作原理,掌握提炼关键词的技巧,加上平时的积累、灵活的应用,必定能更加快捷、有效地在浩瀚的因特网中搜索到所需信息。      搜索引擎主要有分类目录导航搜索、全文搜索两种搜索方式。      本文主要讨论全文搜索。      一、知道搜索引擎的基本工作原理      1.搜索引擎      搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。      2.搜索引擎的一般原理      (1)数据采集与处理      现在的搜索引擎大多采用自动信息搜集功能。每隔一段时间搜索引擎主动派出蜘蛛程序,对一定范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和加入自己的数据库。搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理,为搜索做好准备。      (2)信息搜索排名      当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量计算出各网页的相关度及排名等级,然后根据关联度高低,(..)按顺序将这些网页链接返回给用户。      二、掌握提炼关键词的技巧      分析搜索引擎的工作原理,搜索结果主要根据关键词的匹配程度、出现的位置、频次等给出。对于具体搜索问题,提炼关键词成了第一步,也是最关键的一步。      1.表述准确      以百度搜索引擎为例。百度会严格按照提交的关键词去搜索,因此,关键词表述准确是获得良好搜索结果的必要前提。一类常见的表述不准确的情况是,脑袋里想着一回事,搜索框里输入的是另一回事。例如,要查找2013年国内十大新闻,查询词可以是2013年国内十大新闻;但如果把查询词换成2013年国内十大事件,搜索结果就无法满足需求。      2.少用自然语言,从自然语言中提炼关键词      在提炼关键词时,我们尽量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。      例如,有学生参加2014年江苏数学竞赛的复赛,只知道大概时间在7月份。如何搜索到比赛的具体情况?首先要确定的是,不要用自然语言。比如,数学复赛的具体情况,谁能告诉我呀.这是典型的自然语言,但网上和这样的话完全匹配的网页,几乎就是不存在的。因此,这样的搜索常常得不到想要的结果。我们来看这个问题中的核心词汇。对象:高中生。问题:2014江苏数学复赛。关键词中,至少应该出现数学复赛2014江苏,这是问题现象描述。一般情况下,只要对问题作出适当的描述,在网上基本上就可以找到解决对策。例:数学复赛 江苏 2014.      三、积累点滴,灵活运用      知道全文搜索引擎的基本工作原理和掌握提炼关键词的技巧以后,搜索者可以解决绝大多数的搜索问题。想成为真正的高手,还需要积累点滴,灵活运用。      1.使用高级搜索语法      以百度搜索引擎为例。      (1)用减号去除特定关键词      如果你发现搜索结果中,有某一类网页是你不希望看见的,而且,这些网页都包含特定的关键词,那么用减号语法,就可以去除所有这些含有特定关键词的网页。      例如,搜索水浒传,希望是关于小说方面的内容,却发现很

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档