- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于DOM树信息抽取的移动网站开发研究
摘要
随着互联网技术和计算机技术的发展,信息科技正深入地影响着人们的生
活。移动互联网的发展,特别是第三代移动通信(3G)技术的推广和应用,更是
提供了强大的承载通道和丰富的业务能力支持,使人们的日常生活变得更丰富多
彩。人们也迫切地希望通过无线网络,能在任何时间、任何地点、任何场所使用
移动设备方便地浏览Web网页获取信息。而移动设备有着小屏幕、小内存、低带
宽等与PC机无法比拟的缺点,使得原始HTML网页无法在移动设备上良好地显
示,给移动网站的开发提出了新的挑战。
基于以上问题,论文从研究移动网站开发现状开始,提出了基于DOM信息
抽取的移动网站开发研究。本文对移动网站的开发主要研究了两大问题:一是如
何从Web页面中抽取信息,二是如何将信息很好地显示在移动设备上。本平台采
用的是转化服务器和内容转化策略,通过URL获取Web网页信息后,先经过预
处理转化为规范的XHMTL文档。然后以DOM树的形式,根据抽取规则,使用
XSLT文件映射的方法,产生格式良好的抽取结果保存于XML文档中。抽取结
果需通过信息渲染,才能良好地在移动设备上显示。渲染过程要对链接和图片等
内容做相应的处理,通过渲染模板实现将抽取结果转化成能在移动设备上显示的
结构形式。以平台的支撑,最终实现移动网站的开发。该方法在一定程度上满足
了通用性,并以中国海洋大学中文网站为例开发了移动网站,实验结果表明该方
法具有一定的可行性。
关键词:Web信息抽取;DOM;XSLT;移动网站
Mobi I eWebSi te
deveI basedonDOMtree
opment
i nformati onextracti on
Abstract
Asthe oftheIntemet andthe
development technology
computer
technology,
informationis life.The
technology of
deeplyaffecting mobile
people’S development
thethird
Interact,especially a
generation(3G)technology,it
providespowerful
channelandrich
bearing professionalability andmakesthe life
supports people’S
more also tlaat
colorful.People canbrowsethewebto
eagerly
hopethey get
informationat and the
文档评论(0)