- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
交互式网络信息获取工具的设计与实现
任禾曾隽芳
中科院自动化所互联网中心,j£京100080
(renbe,zjr3@irdc.ia.ac.cn
摘要:本文分析设计了一个交互式的网络信息获取工具,该系统具有可定制、交互性
强的特点,用户可以限定检索空间,设定信息更新频率以及定制网络信息。实验验证了系
统的有效性。
关键词:交互式;信息获取:网页分析
AnInteracitveToolForWebInformationRetrieval
HePen
Junfang
Zeng
IntemetRDCenter.Institute of 1 00080
ofAutomation,Chinese
AcademySciences。Beijing
{renhe,zjr}@irdc.ia.ac,cn
this and ofaweb
Abstract:In informationretrieval
paperthedesignimplementation
toolis is and whichuserscan thesearch
interactive.by
presented.Itconfigurable configure
information andsubscribeweb results
space,set updatingfrequency information,Experiment
work
showthe ofthis
efficiency
retrieval;web
Keywords:interaction;informationpageanalyzing
1.引言
随着www的发展,信息量的不断增加,人们寻找所需要的信息变得越来越难‘,搜索引
擎也越来越成为人们获取网络信息的主要方式。然而,在所有知名的搜索引擎中,唯一能保
证所提供的信息更新周期不超过一个月的只有AltaVista。但是它所检索的网页数仅两亿五
千万左右,而目前w聊上的文档数已经远远超出了十亿,并且以每天一百多万的数目增氏”1。
此外,人们通过搜索引擎检索往往得到数以千计的结果,其中相当~部分是重复或是无用信
息。不难看出.检索范围有限、更新周期长、信息定位不准是目前搜索引擎普遍存在的问题。
人们迫切需要这样一种信息获取工具,能够限定搜索空间,从而避免把太多时间和资源浪费
在无用信息上;能够对一些特定类型的网站信息进行定期更新,如新闻站点:当某个网站的
某个版面信息对用户十分重要时,可以通过定制该版面来获得最新信息。针对以上三点需求,
我们设计并实现了一种用户可定制的、交互能力强的网络信息获取工具,使得用户可以通过
人机交互来设定网络信息的搜索空间、信息更新周期以及定制网站栏目,从而达到定位准、
更新快年¨个性化服务的目标。
2.系统结构与功能
通过分析网络信息获取的需求和工作流程,我们设计本系统主要由四个部分组成:人机
交互接口,系统分析器,文件F载器和数据序写入器(如图l所示)。
。数捆军g入嚣
l一口■一—草獾∈劳圄
文降F强器
文档评论(0)