- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
内事问百度 外事问谷歌 一网打尽找山寨 网络搜索引擎 一、搜索引擎的概念 人们获取网络信息的习惯 什么叫搜索引擎(视频3) 二、搜索引擎的发展(视频1) 三、搜索引擎的作用: 1.检索网络信息 2.进行网络营销(网易、搜狐搜索引擎flash) 四、搜索引擎的工作原理 搜索引擎的关键技术 (1)搜索技术 A.全文关键词型搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。 B.目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。登录目录索引时则必须将网站放在一个最合适的目录(Directory)。 (2)索引技术 理解搜索器所搜索的信息,从中抽取出索引项,(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。 索引器可以使用集中式索引算法或分布式索引算法。当数据量很大时,必须实现即时索引,否则不能够跟上信息量急剧增加的速度。索引算法对索引器的性能(如大规模峰值查询时的响应速度)有很大的影响。一个搜索引擎的有效性在很大程度上取决于索引的质量。 (3)检索技术 检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制. 各搜索引擎都支持常见的计算机检索技术 统计 site: (4)用户接口 用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯。 例Google 并非只使用关键词或代理搜索技术,不仅衡量关键词与页面的匹配度,也考虑外部链接。某个网站拥有越多的外部链接,说明它越受欢迎。于是,Google将其作主要因素来考虑,并发明了PageRank来专门衡量该外部链接 它将自身建立在高级的 PageRank(tm)(网页级别)技术基础之上。这项正在申请专利的技术可确保始终将最重要的搜索结果首先呈现给用户。 网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含 5 亿个变量和 20 多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 还对投票的网页进行分析。 Google 复杂的自动搜索方法可以避免任何人为感情因素。与其它搜索引擎不同,Google 的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。作为您的忠实助手,Google 可以诚实、客观并且方便地帮您在网上找到有价值的资料。 常用的搜索引擎介绍 国外英文目录索引 Yahoo — 最著名的目录索引,搜索引擎开山鼻祖之一。 D/ODP — 由义务编辑维护的目录索引。 Ask Jeeves — 著名的自然语言搜索引擎,2002年初收购Teoma全文搜索引擎。 LookSmart — 点击付费索引目录,2002年收购WiseNut全文搜索引擎。 A — 有其自身特色的目录索引。 国外英文搜索引擎 Google — 以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。 Fast/AllTheWeb — 总部位于挪威的搜索引擎后起之秀,风头直逼google。 AltaVista — 曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。 Overture — 最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。 Lycos — 发源于西班牙的搜索引擎,网络遍布世界各地。 HotBot — 隶属于Lycos Networks,搜索结果来自其他搜索引擎及目录索引。 国内
文档评论(0)