- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文搜索引擎中文类的搜索引擎
01工作原理搜索引擎商务搜索引擎对比发展史目基本信息中文搜索引擎指的是中文类的搜索引擎,中文引擎,国内浏览网页大多均采用中文搜索引擎。
百度、360搜索、搜狗搜索、网易有道。国内目录索引搜狐(Sohu)—国内三大门户之一,最早在国内推出搜索引擎收费登录服务。新浪(Sina)—最大的中文门户网站,同样也推出了搜索引擎收费索引项目。网易(Netease)—网易搜索是ODP的国内翻版,其目录由志愿管理员维护,是google的网页搜索用户。国内搜索引擎百度(Baidu)—国内唯一商业化的全文搜索引擎,提供搜狐、新浪、Tom等站点网页搜索服务。中搜(ZhongSou)—网络猪是一只神奇的小猪,是中国搜索强力推出的桌面软件,但它不仅仅是一个软件,而是代表了新一代的搜索文化――快乐搜索。
搜索引擎对比
搜索引擎对比搜狐、新浪,263等三十多家网站公司均采用中文搜索引擎。相反网易、雅虎、netscape、Deja等全球一百三十多家公司采用Google,各大引擎竞相模仿Google的功能和特色,如网页快照,偏好设置等。而且Google引擎的技术发展很快,经常有更新的技术诞生;而Go,GoTo等许多公司则采用全球另一著名引擎--overturn,其特点是搜索很准,速度尚可,但商业化太重。过去Lycos公司收购了altavista,hotbot,成为全球最重要的搜索公司,然而Lycos的精准、hotbot的全的风格却并没有保留,已经明显逊色于google等著名专业引擎了,尤其是速度太慢。dmoz只搜索站点,但所有站点皆是精选而成。可确保每一个均极佳,而且还可自定义站点,不过对中文支持不理想。All the Web与Google类似,均支持中英文等多语言,速度快,搜索面广,然而必须先选择语言,否则可能出现乱码,而不如Google自动识别多种语言。而且界面较Google逊色。这几大引擎已成为最主要的引擎,另外象search163, search,excite, northernlight,AltaVista,HotBot,Infoseek,等是过去名声赫赫的,但近来发展却不十分如意,尤其是Excite,过去其中文引擎很有特色,被广泛采用,虽仍支持中文,但数据库已太小,无法收到新的内容了,而英文方面又不如Google快捷,数据库大。Hotbot曾全球排名第一(搜索页面数),自从被Lycos收并后,反而不行了,而且不支持中文。wisenut和teoma刚刚兴起,极具代表性引擎,它们还不能对Google构成危胁,而且二者均是英文的,前者速度类似Google,非常快,数据库也较大,而后者界面几乎完成模仿Google,但速度稍差数据库偏小。因而综合引擎主要选择上述几家引擎,如果能恰当应用的话,几乎能找到一切所需的东西。其中Google继承了原Altavista的多语言风格,而且由于网易的购卖,它对简、繁体中文支持都十分良好。但其它英文引擎却不可。
工作原理
工作原理搜索引擎的工作原理大致可以分为:搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。搜索引擎主要返回以网页链接的形式提供的,通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。
发展史
发展史1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,曾一度有“出门找地图,上网找搜狐的”美誉。由于其人工分类提交的局限性,随着网络信息的暴增,逐渐被基于robot自动抓取智能分类的新一代信息技术取代。1998年1月,台湾中正大学吴升教授所领导的GAIS实验室创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(PolyRankTM)核心技术,截止200
您可能关注的文档
最近下载
- 推拿学试题库(附参考答案).docx VIP
- 探讨平台经济下灵活就业人员的劳动权益保护问题.docx VIP
- 重症患者的营养支持PPT.ppt VIP
- 南瑞集团-水轮发电机组状态监测整体解决方案.pdf VIP
- 第二单元第1课《山水相逢》课件2025-2026学年人美版(2024)八年级美术上册 (1).pptx VIP
- 标准图集-华北-08BJ6-1地下工程防水1.pdf VIP
- 第2课 中国人首次进入自己的空间站(1课时)-课件(共23张PPT).pptx VIP
- 物业项目经理面试的53个经典问题(附参考答案).doc VIP
- 《观赏植物介绍》课件.ppt VIP
- 水电站碾压混凝土施工工法--rcc工法.doc VIP
文档评论(0)