- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【精品】搜索引擎
搜索引擎 1 概述 2 信息搜索工具 3 信息检索技巧 1 概述 网上资源的类型 工具篇 1.主题目录 (Subject Directory) 2.搜索引擎(Search Engine) 3.元搜索引擎 (MetaSearch Engine) 原理篇(搜索引擎) 搜索引擎主要依靠被称为蜘蛛(Spider)、机器人(robot)、爬虫(Webcrawler)、漫游者(Webwanderer)等的网页搜索工具,而不是人工编制。其基本工作可分成以下三个方面: (1)首先搜索引擎派出网页搜索工具如 Spider(蜘蛛)在 Internet网上搜索信息,并把信息带回搜索引擎; (2)将信息进行分类索引,建立网页数据库; (3)通过Web服务器端软件,为用户提供浏览器界面下的信息查询。 一般搜索引擎不仅提供键入一个或多个关键字的简单查询,大多数还提供附加的查询选项。比如说: 布尔运算符号:AND(与) OR(或) NOT(非) 2 信息搜索工具 百度()/谷歌() 2000年1月创立于北京中关村,是全球最大的中文搜索引擎。 百度每天响应来自138个国家超过数亿次的搜索请求。用户可以通过百度主页,在瞬间找到相关的搜索结果,这些结果来自于百度超过10亿的中文网页数据库,并且,这些网页的数量每天正以千万级的速度在增长。 Google 是由英文单词“googol”变化而来。“googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。 据说,2001年的时候Google每天处理大约7000万个网页,有8000台服务器。到2003年,这一数字已变成10万台。而现在,Google拥有超过45万台服务器。分布在全球25个地方,而且平均每月购入新的服务器约有3万台。Google正在美国的俄勒冈州的哥伦比亚河河畔秘密研发新的数据中心,其占地有两个足球场那么大! 布尔运算符号:+、-、OR +:用 “+”来表示逻辑“与”操作,只要空格就可以了。 -:用减号“-”表示逻辑“非”操作. OR:或者 “+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。 “或”操作的前后两个关键字必须是默认的“与”查询,否则,搜索引擎将无法完成搜索。 “+”、“-”和“OR”的混合查询 混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。 如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。 单纯的“或”操作也同样道理。但是,如果“或”查询和其他两种查询混合在一起,问题就复杂了。 问题情景 老师现在需要查找计算机技术或者信息技术领域但是与电子技术领域无关的新技术,请问该如何进行查询? 计算机技术 or 信息技术-电子技术? 计算机技术-电子技术 or 信息技术? -电子技术 计算机技术or 信息技术? 计算机技术or-电子技术 信息技术? 如何才能找到最适合你的关键词呢 选择相关的关键词 选择具体的关键词 选用较长的关键词 别忘、错拼的单词? 3 信息检索技巧 技巧1:site语法 目的:特定站点内容搜索 操作: 进入百度主页,在搜索栏中输入:site:网址 搜索内容 就可以对这个网站进行搜索! 关键语法:site:XXX 举例: 在新浪网站中搜索“教育信息化”的网页?如何确定搜索语句。 教育信息化 Site:? 教育信息化 Site:? 扩展的问题 单个站点内的搜索 不同类型的系列站点搜索 Site:edu/org/com/…… 不同国别的系列站点搜索 Site:cn/tw/hk/jp/kr…… 技巧2: filetype参数 很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。百度支持对Office文档(包括Word、Excel、PowerPoint)、Adobe?PDF文档、RTF文档进行了全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。“filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。 例如:查找张五常关于交易费用方面的经济学论文。?输入“交易费用?张五常?filetype:doc”,点击结果标题,直接下载该文档,也可以点击标题后的“HTML版”快速查看该文档的网页格式内容。 也可以通过百度文档搜索(),直接使用专业文档搜索功能。 (3) domain搜索参数 当我们在百度搜
文档评论(0)