- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网上的信息检索
互连网上的信息检索
互连网上的信息检索
主讲 田捷博士
(研究员,博士生导师)
Email: tian@
/tian
第一节 概论
第二节 Web Mining :第二代网络信息
处理技术
第三节 网上信息搜索的利器:元搜索
引擎及其特色
第四节 搜索引擎挑战智能化
第五节 流行的中文搜索引擎
第六节 流行的中文搜索引擎
第七节 中国门户站点的搜索较量
第一节 概论
一、绪论
二、历史
三、了解查询工具是怎样工作的
四、几个搜索概念
五、查询检索中的几个要点
六、搜索引擎的分类
七、搜索引擎的现状
八、未来的发展趋势
一、绪论
WWW 资源内容包罗万象,信息浩如
烟海,其覆盖面之广,对人类生活影响之
大是任何人难以想象的。目前这一庞大的
信息库包含了数千万个页面,并且还在以
惊人的速度增加。毫不夸张的说,它所包
含的信息量足以超过计算机出现以前人类
社会所有有文字记载的信息的总和。
到目前为止,我们在Web上漫游
依靠的是链接点及推荐的URL来知道
目标的可能所在地。在这信息的汪洋
大海中,信步漫游自然是一种消闲时
的享受,但是如果必须用Internet迅速
地查找某一专题或者进行某种严肃的
工作的时候,您需要快速地定位,直
达目的地。
这时“漫游”就不是一种高效率的方
法,有时候根本就帮不了您的忙了。尤
其目前WWW发展突飞猛进,面对无边
无际且不断变化着的信息库,快速准确
获取自己所需的信息显得尤为重要。这
时,指导我们方向的罗盘在哪里? ──
它们就是网上查询工具,或者称做搜索
引擎(Search Engine),它们对WWW页面
进行分类、查询和检索。
在Internet上有好多种有效的WWW搜
索引擎可以用来寻找特定的信息,如
Yahoo (http://www.Y/ )
InfoSeek (/ )等等
。熟练掌握查询工具对我们充分利用WW
W资源,提高工作效率是必需的。下面我
们分别介绍一些目前流行的WWW搜索引
擎,供大家使用参考。其中重点讲解国外
的Yahoo和其它搜索引擎。
每一查询工具使用一个Search Engine
,它定期地探查Internet上的新的信息。
当发现有新的信息,它就把它分类或编成
索引,并同一个URL (统一资源定位器,
是信息存储的地址)上的分类目录联系起
来。在输入一个特定的查询条目时,查询
工具进入索引,找出所有同查询条目相匹
配的条目,并显示一个指向存放这些信息
的链接点清单。由于用这种方式处理查询
,所以查询工具能在数秒钟内完成一项查
询工作。
二、历史
1993年,Internet上出现了最早的Web浏
览器Mosaic ,次年Netscape推出了Navigator ,
浏览器的发展促使Web得到迅速推广,同时也
推动着搜索引擎的发展。1994年初,Internet
上出现了包括Lycos在内的第一批Web搜索引
擎,同年还成立了Yahoo !,后者成为了近年
来最成功的商业目录。现在Internet上已有数
千个提供搜索服务的站点,它们不仅要努力
改进自己的服务以便能在激烈的竞争中生存
下来,还要努力寻求新技术以便能适应
Internet 的迅速扩张。
三、了解查询工具是怎样工作的
当完成了一项查询,我们也许对
查询工具在Internet上彻底搜索所需信
息的能力有所了解。实际上,查询工
具自身早已事先做完了此事。
每一查询工具使用一个Search Engine
,它定期地探查Internet上的新的信息。
当发现有新的信息,它就把它分类或编成
索引,并同一个URL (统一资源定位器,
是信息存储的地址)上的分类目录联系起
来。在输入一个特定的查询条目时,查询
工具进入索引,找出所有同查询条目相匹
配的条目,并显示一个指向存放这些信息
的链接点清单。由于用这种方式处理查询
,所以查询工具能在数秒钟内完成一项查
询工作。
查询工具定期漫游Web ,编辑长
长的索引,它得到了诸如此类的名称
,k
原创力文档


文档评论(0)