Web上智能化的自动查询工具.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
宴皇:!!!! 笙±星!里主±茎塑兰垒堕塑量垫塑望焦兰查垒坚堡苎 Web上智能化的自动查询工具 黄伟韵詹志远钟昱陶陈俊良郑智祥 (南京大学网络信息中心,南京210093) huang@mai1.nju.edu.Cn 摘要:Web上智能化的自动查询工具能够进行信息的自动获取和选择.减轻网络用户查找信息的工作量,足解决信 息资源利用问题的重要途径之一。通过分析国内外的最新研究成果,本文提出了‘种Web上智能化自动查询_[具的 框架,基于这个框架给出了~个应用系统的实现,并且讨论了相关的实现技术. 关键词:智能化的自动查询工具自动学习模式存储HTML语言 1引言 随着Iniernet的小断发展和普及,|叫上的信息资源正在小断地膨胀.在为广人网络用户带来丰富的资源库的 同时,也带来,检索和使用的难题。为r改善这种状况,许多站点相继推出本站点的搜索引擎.但分立的服务器, 五花八门的查询兜面,在部分解决Ⅲ有问题的情况下又引发新的问题,即站点查找和使用的不便.利用Interne[ 信息发现技术.为用户提供界面一敛、简单的自动查询工只是解决这种不便的途径之一. 自动查询丁其可以提供给用户一个统一的界面.自动连接需要查询的一个或多个搜索引擎,并将返回结果以相 对一致的形式返还给用户。理想的自动置询r具还应当具有一定的智能,对不同的站点肯一定的适应性,SE够自动 学习小『fiJ站点的特衍,井相应地调整查询策略。 2智能化自动查询工具的基本框架 对于纷繁复杂的Web贞血和信息资源而言,一个大而全、能够涵盏各种情况的自动搜索工只足不太现实的。Web 页面l:自然语言的理解也是~个障碍。较为理想的解决方案是充分利用领域知识,构造与内容相关的自动查询工具。 智能化自动查询工具的基本框架如图l所示: 图1智能化自动查询工具的基本框架 2.1查询模块 该模块是与各搜索引擎进行查询和交互的模块.它的主要任务是根据用户的请求.准备好适当的参数,将其发 送给搜索引擎,并将对方返回的结果返还给用户. 查询模块必须给用户提供统一的界面,这带来了与不同搜索引擎之间的翻译问题:一方面,索取信息的请求需 第十届中国计算机学会网络与数据通信学术会议论文 南京·1998 要被翻译成对方引擎可以“理解”的形式;另一方面,对于对方返还的结果需要进行一定程度的整理和转换.以保 持较为一致的信息显示方式.由于查询时网络传输的时间延迟已经在很大程度上考验着用户的耐心,因此查询模块 的翻译和转换工作要尽量的迅速和简洁. 2.2模式存储 对于查询模块而言,它为了实现与各擅索引擎之间的“对话”.就必须掌握各搜索引擎的特征.这些特征被存 储在一个“模式”中.查询模块将利用“模式”的内容来指导查询.对于模式存储这一部分来说,关键在于设计~ 种简单、紧凑而叉易于为查询模块所识别的存储方式,以较小的时空代价保存引擎的所有重要特征. 2.3学习模块 按照上述工作原理.一个奁询工具在有适当的模式存储和有效的蠢询模块之后,应该就可以工作了.那么正确 的模式存储从何而来昵?最为简单而保险的方式莫过于由程序员来手工编写这些模式.然而,为了使鸯询工具有更 大的适应性.将模式的获取过程设计为一个机器自动学习的过程是非常必要的.学习模块正是完成这样的工作. 一个理想的学习模块将能够根据元知识库中的知识,通过与对方引擎的交互来获取其特征.并将其作为一个模 式存储下来t以各查询模块使用.它同时还具各一定的智能.能对于过去没有遇到过的站点特征的含义进行合理的 猜测,一旦这种猜测被实践证明正确,就把它充实八元知识库.这样,不但能够使通用查询工具适用于更多的引擎, 节约程序员的人工.而且可以轻而易举地对付引擎界面的改变。 3智能化自动学习的可行性 在以上三个部分中,查询模块和模式存储都是相对容易解决的问题,而学习模块无疑是难点所在.主要的障碍 在于机器对自然语言的理解仍处于极其初级的阶段.因此,基本框架的可行性就取决于学习模块的可行性. 虽然完全通用的适合于各种领域的搜索引擎界面的学习模块是不可能实现的.但是针对于某一特定领域的学习 模块是切实

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档