搜索引擎作业.pptVIP

  • 8
  • 0
  • 约4.33千字
  • 约 43页
  • 2017-03-03 发布于湖北
  • 举报
谷歌炸弹大部分都是出于恶作剧,政治目的,做实验等。 其实现是基于搜索引擎排名算法中的两个事实:   1)外部链接是排名的重要因素之一 2)链接文字很多时候比链接数量更重要 所以当有大量包含特定关键词的链接指向某一个网页的时候,这个网页就算没提到这个关键词,排名也会非常好。 搜索引擎发展趋势 社会化搜索系统重点关注4类关系: 完善的实时搜索系统重点考虑以下四个方面的因子: 用户关注人发布的信息排名应该靠前。 用户查询自动补全 语音识别输入 展示摘要区域; 自动提取页面重要内容 地理位置 感知搜索 跨语言搜索 自动将用户的母语查询翻译成相应的其他语种 多媒体搜索 图片:色彩,纹理 音频:音高,音调 就是能够感知人及人所处的环境,“此时此地此人”来建模,比如苹果专卖; 用户的身份,兴趣,结合查询的时间,地点,周边环境。 参考文献 [1]张俊林.这就是搜索引擎:核心技术详解.北京.电子工业出版社.2012.1 [2]潘雪峰,花贵春,梁斌.走进搜索引擎.北京.电子工业出版社,2011.5 [3]王立清.信息检索教程.北京市.中国人民大学出版社,2008 [4] 李树青,韩忠愿.个性化搜索引擎原理与技术.北京.科学出版社,2008 [5] /view/737447.htm [6] /view/1154.htm [7] /se/ [8] /wiki/Search_engine [9]0/adksvod/PublicFolder/AuthorVideo.aspx?AuthorID=1682 谢 谢 1 搜索引擎基础知识 2 SEO Google炸弹 刘 培 搜索引擎是什么? A web search engine is designed to search for information on the World Wide Web. The search results are generally presented in a line of results often referred to as search engine results pages(SERPs). ——维基百科 定义 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 定 义 虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索。 全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表有Google,国内则有著名的百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。 一类拥有自己的检索程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类; 另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。 (META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。 Greek=after or beyond 该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择。 垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。 1 2 3 免费图标搜索引擎 专为儿童设计的搜索引擎 美国政府网站搜索引擎 搜索引擎 工作原理 搜索引擎 主要需求 ,挥洒“11度青春” 搜索器 索引器 检索器 用户接口 搜索引擎 的结构 搜索引擎利用自动搜索机器人程序来链接每一个网页的超链接 将搜集的信息保存起来,将它们按照一定的规则进行编排,加工处理成数据库 用户向搜索引擎发出查询 搜索引擎接受查询并向用户返回网页链接 搜索引擎 工作原理 下载系统 爬虫 网页抓取 URL 分析系统 网页信息结构化 网页查重 中文分词 Page Rank 例如: 从小/学/电脑 从小学/毕业 索引系统 倒排索引 Z向量空间模型

文档评论(0)

1亿VIP精品文档

相关文档