3.1搜索引擎汇编.ppt

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.1搜索引擎汇编

第三章 搜索引擎 Outline 搜索引擎概念(定义、工作原理、特征) 搜索引擎的分类 搜索引擎的选择与评价 常用综合性搜索引擎 常用学术搜索引擎 使用搜索引擎要注意的问题 跟踪搜索引擎的变化 1 搜索引擎概述 你最常用的搜索引擎有哪些? 你认为搜索引擎是什么? 1.1 概念 一种Web上应用的软件系统 以一定的策略在Web上搜集、发现和组织信息 使用者的角度:提供一个网页界面供用户输入词语或者短语,系统将返回一个可能和用户输入内容相关的信息列表 Source: 李晓明,闫宏飞,王继民著.搜索引擎——原理、技术与系统.北京:科学出版社,2005:2 1.2工作原理 1.2 工作原理 网页采集 网站拥有者主动向搜索引擎提交网址 蜘蛛(Spider)扫描网站的所有网页并将相关信息存入数据库 预处理 关键词的提取 重复网页或转载网页的消除 链接分析 网页重要程度的计算 用户输入检索式 提交检索要求 搜索引擎提供查询 接受用户提交的查询请求 按照要求检索索引数据库 返回相关记录 以网页链接形式提供 通过链接指向用户所需网页 2 搜索引擎的分类 按信息内容组织方式划分 Web Directory 人工参与,主题目录 数据有限,专指性强 Yahoo!Directory Open Directory Keyword search engine 无人工控制,由系统完成 数据量大,更新及时 Google 百度 2 搜索引擎的分类 按收录范围划分 综合性搜索引擎 涵盖各学科 涉及生活的各领域 Google Yahoo! 百度 Bing 专业性搜索引擎 特定的功能 特定的学科 特定的用户 特定的信息类型 特定的地域 Lawcrawler,Sciseek Askjeeves for kids IP search 2 搜索引擎的分类 按功能划分 独立搜索引擎 具有独立的数据库 Google Yahoo! 百度 Bing 元搜索引擎 一次检索多个数据库 有的提供结果去重等功能 通常不具有独立的数据库 提供多个搜索引擎的统一检索界面 Metacrawler 独立搜索引擎与元搜索引擎的集成,如万维搜索 万维搜索 初级检索界面:独立搜索引擎 支持关键词检索 万维搜索 高级检索界面:元搜索引擎 集合了多个独立搜索引擎 结果可以按照多种方式排序 3 搜索引擎的选择与评价 提问:百度和Google,你更喜欢哪个?为什么? 搜索引擎优化网站(SEOMOZ)通过SEO领域多位世界级专家的调查,发布两年一度的搜索引擎排名影响因素调查结果。 3 搜索引擎的选择与评价 SEOMOZ(2009)的调查结果 最重要的5个影响因素为: 关注关键词锚文本的外部链接(73%,非常非常重要) 链接所在页面的热门程度(71%,非常非常重要) 链接资源的多样性(67%,非常非常重要) 标题标签中关键词的使用(66%,非常重要) 链接域名的可信度(66%,非常重要) source: /article/search-ranking-factors 3 搜索引擎的选择与评价 SEOMOZ(2009)的调查结果 前5位的负面影响因素为: 恶意隐藏作弊(68%,非常非常重要) 从链接中介购买链接(56%,非常重要) 指向搜索引擎作弊的站点或网页的链接(51%,比较重要) 基于User Agent的伪装(51%,比较重要) 频繁的服务器故障或站点无法访问(51%,比较重要) source: /article/search-ranking-factors 3 搜索引擎的选择与评价 收录范围 分类 检索功能与效果 检索结果的处理方式 页面组织 其他功能与服务 4 综合性搜索引擎选介 全球主要搜索引擎份额(2009.7) Google(67.5%)Yahoo!(7.8%)百度(7.0%) 4 综合性搜索引擎选介 国内搜索引擎首选份额排名(2009.6) 百度(77.2%)谷歌(12.7%) 搜搜(3.1%)搜狗(2.4%) 雅虎(1.6%) source:CNNIC. 2009年中国搜索引擎用户行为研究报告(2009年9月)./img/h000/h11/attach200911241026520.doc 众里寻她千百度 2000年1月 李彦宏和徐勇创立于中关村 全球最大的中文搜索引擎。 2005年8月5日,百度在纳斯达克上市 4.1 百度() 百度的首页 百度的高级检索页面 百度提供的众多产品 参见百度的帮助中心 百度的检索技巧 百度快照 拼音提示功能 支持繁简中文查询 相关搜索 支持:-、| 、“”、filetype、inurl 、intitle、allintitle、site等。 百度的检索功能和特点 百度的结果处理 检索结果排

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档