- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
浅析搜索引擎的原理及发展前景
[摘要]文章简述搜索引擎定义和服务方式,及搜索引擎的发展、工作原理和
性能指标,分析了搜索引擎面临的挑战,并对特色搜索引擎进行了简要的阐述。
[关键词]搜索引擎;信息检索
信息技术的不断发展,特别是互联网应用的迅速普及,深入到了人们生活的各个方
面,改变了人们生活方式和思维方式,方便了全球信息资源共享。全球目前的网页
超过100亿,每天新增加数百万网页,电子信息爆炸似的丰富起来。要在如此浩瀚
的海洋里寻找信息,就像“大海捞针”一样。能有一种工具使我们可以在不到1秒
钟的时间就迅速找到我们想要的内容吗?答案是“有”,这就是搜索引擎。今天,
搜索引擎已成为人们在网络信息海洋中自如冲浪必不可少的利器。
搜索引擎(SearchEngines)就是指在WWW(WorldWideWeb)环境中能够响应用
户提交的搜索请求,返回相应的查询结果信息的技术和系统,是互联网上的可以查
询网站或网页信息的工具。它包括信息搜集、信息整理和用户查询三部分。搜索引
擎的服务方式分为两种:目录服务和关键字检索服务。目录服务是由分类专家将网
络信息按照主题分成若干个大类,用户可以根据分类清晰地找到自己所需要的内
容。关键字检索服务可以查找包含一个或多个特定关键字或词组的WWW站点。搜索
引擎是互联网的第二大核心技术,涉及到信息检索、人工智能、计算机网络、分布
式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,
所以具有综合性和挑战性。
1搜索引擎的发展
1990年以前,没有任何人能实现搜索互联网的功能。互联网发展早期,信息量较
少,互联网用户多为专业人士,那时查找信息要相对容易。伴随互联网爆炸性的发
展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索
需求的搜索引擎便应运而生了。所有搜索引擎的祖先,都可以追溯到1990年由蒙
特利尔McGill大学学生AlanEmtage、PeterDeutsch、BillWheelan发明的
Archie(ArchieFAQ)。虽然当时WorldWideWeb还未出现,但因为当时网络的主
要用途是传输文件,网络中的文件传输还是相当频繁。由于大量的文件散布在各个
分散的FTP主机中,查询起来非常不便,因此AlanEmtage想到了开发一个可以以
文件名查找文件的系统,于是便有了Archie。
1993年,美国内华达SystemComputingServices大学开发了一个与Archie非常
相似的搜索工具,这个搜索工具既能够检索文件也能够检索网页。
1994年4月,斯坦福(Stanford)大学的两名博士生,DavidFilo和美籍华人杨
致远(GerryYang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念
深入人心。从此搜索引擎进入了高速发展时期。
1998年,斯坦福大学的两位博士生LarryPage和SergeyBrin开发出了现在世
界上最大的搜索引擎――Google。通过对20多亿网页进行整理,Google可为世
界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。现在,Google
每天需要为世界各国用户提供1.5亿次查询服务。
1997年10月29日,北大天网正式在CERNET上向广大Internet用户提供Web信
息导航服务,它是由北大计算机系网络与分布式系统研究室开发的国家“九五”重
点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果,受到学术界广
泛好评。
2000年1月,两位北大校友,前Infoseek资深工程师李彦宏与加州大学伯克利分
校博士后徐勇在北京中关村创立了百度(Baidu)公司。历经5年的高速发展后,
在近两年时间里,百度高居全球网站流量前八名的位置,已经成为全球十大网站之
一。百度每天接受着超过一亿人次来自各个方面的内容检索请求,中国9400万网
民几乎每天使用1次百度。“有问题百度一下”已经成为中国网络流行语之一。
2002年,中国搜索(原慧聪搜索)正式进入中文搜索引擎市场。在一年多的时间
里,就发展为全球著名的中文搜索引擎服务商,为新浪、搜狐、网易、TOM等知名
门户网站提供搜索引擎技术。慧聪搜索引擎的优势是从人工审核网站信息源和设置
禁查词两个方面入手,有效地过滤了不良信息,降低了垃圾信息的含量。在互联网
实时新闻搜索方面,慧聪也实现了网络新闻的实时检索。
2搜索引擎的工作原理
简单的说,搜索引擎是
您可能关注的文档
最近下载
- 23S519小型排水构筑物.pptx VIP
- 湛江市霞山区滨海四中六年级升七年级语-数-英分班考试题.docx VIP
- 2024年深芯盟国产无线通信芯片厂商调研分析报告-深芯盟.pdf
- 第一单元(知识清单)六年级语文上册单元速记巧练(统编版).pdf VIP
- 日产600t双膛窑技术方案(改1).doc
- 众为兴cnc4340系统版说明书附加页.pdf VIP
- SOA架构智能座舱:设计与实现.docx VIP
- 伦茨82EV矢量变频器(内置闭环型)操作手册.pdf VIP
- DB61T-体育赛事信息化建设技术规范 信息系统建设.pdf VIP
- Q-CR 517.2-2023铁路工程喷膜防水材料 第2部分:喷涂橡胶沥青(OCR).pdf
原创力文档


文档评论(0)