- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一届中国计算机学会网络与数据通信学术会议论文
智能浏览器实现算法研究
余一娇刘芹肖德宝
(华中师范大学计算机科学系武汉430079)
丑圳孕篮凹.£du。£n仃ueliuqin《鲈。廿rIail.comdbxiao@ccnu.。dlLcn
摘 要 本文首先定义了智能谢览器及其三种智能行为:智能理解wEB更面信息、观察发现浏览器用户的兴
趣爱好,自主收集与管理罔络信息.然后以www教I览器HwTl.O为实现对象,根据反馈、阔值比较思想提出
了实现智能测览嚣的带反馈的wEB信息理解度算法、词根频数统计算法及信息源树搜索策略.
关键诃 o
智能浏览嚣理I手学纠信息收集与管堙。浏览器H、W.1
l引言
拥有巨大信息容量、快捷信息传播速度的因特网已成为当今世界一种重要的信息检索镖,每天部有大量的
羁络用户通过m潮览嚣在因特礴上寻求自己所需的文献信息.由于因特嘲信息组织形式具有松散性和易变性,
如何实现高速、精确的弼络信息查询就成了现代盹B应用中的一个兜出问趣.目前,搜索引擎和网络导航系统是
提高网络信息控索速度的两种有效途径,但从长远来看以上方式具有一定的局限性,尤其是对模糊检索支持不
足(键入一个关键词.搜索引擎提供几百条查询结果,查询结果数量太多无助于用户迅速查询).鉴于此.本文
提出改进浏览器设计思想,使其具有智能信息搜索能力.本文根据作者用visual
c++设计ww浏览器H耵1.0
过程中的经验和思考,探讨了智能浏览器及其智能行为的实现方法. ’
2智能浏览器及其智能行为
因特罔中的信息量呈爆炸性增长,用户对网络信息的利用效率依赖于用户信息搜索范围和搜索精确度.范
围越广、搜索越准确则利用效率越高。现阶段浏览器只是一种被动的网络信息浏览工具.它仅能根据用户指定
的u豇地址获取}m也文本.而不能主动为用户收集信息.为了提高信息检索速度,我们认为浏览器设计应朝智
能化方向发展.智能浏览器是能正确理解髓页面设计者的设计意图、观察发现浏览嚣用户的兴趣爱好、并自
主为用户完成啦信息收集和管理的浏览器。与普通浏览器相比较,智自E浏览器具有后台的智能学习与■髓信
息收集与管理进程.支持洲览器用户脱线工作。图l示出了潮览器H耵1.0的软件逻辑圈[1].圈2示出了智能
杖I览器}珥叮1.0的软件逻辑圈.图2中虚线右部的功能模块在后台执行,智能理解模块则嵌入到冒EB页面显示模
块中.
人机交互模块
0
w黯页面显示模块
£
}mⅧ语言解释桴
土
数据通信模块
图lH盯l-O的软件逻辑图 图2智能H盯1.O的软件逻辑图
384
第十一届中国计算机学会网络与数据通信学术会议论文
3智齄理解w功页面信息
嘞页面信息可分成数据对象(文本、图象、影像等)信息及冒EB页面的捧版信息两大类[2].主页设计者
往往通过矸EB页面排版风格来展示自己的独特个性和情感.因此即使是同样的数据内容在不同的捧版方式下.
它就代表哪页面设计者不同的情感信息.智能理解WEB甄面信息包括对两类信息的正确理解.理解数据对象
内窖只要¨TTP通信是成功的.则不存在困难,但对排l短格式中包括的情感信息理解则依赖浏览器采用的理解策
略.现阶段谢览器对同一冒EB丽面的排版信息存在多种理解的主要原因是f咖L语言发展过程中出现了多种标准
且废弃的元素依然披用户使用,从而造成了髓B页面中元素混乱的局面.在浏览器H盯1.0设计过程中,我们曾
素集合的一个子集,并且对同样的H州L元素和属性值还存在不同的理解.每种浏览器均是按照自己认定的最佳
麓略(在表格排版信息理解中显得很突出)来理解瓶B页面中的数据排版信息。
}m1
0设计过程中,为了找到一种具有强通用性的表格理解策略.我们曾重复做了大量的理解策略反馈实
验.该实验的具体执行过程是
文档评论(0)