网页裁剪中HTML修补器的分析研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网页裁剪中HTML修补器的研究 专业:计算数学 姓名:李锐 导师:李小福副教授 摘要 Information 网页裁剪工具是企业信息门户(EnterprisePortal,简称EIP)中 常用的信息资源获取工具,应用于企业信息门户(EIP)建设中,具有价值很大 的研究开发意义。目前,国外很多大公司,比如IBM、ORACLE等,都开发了 Portal产品,而且在Portal产品中都附带网页裁剪工具。但是网页裁剪工具仍然 存在着很多问题,其中一个比较大的问题就是使用该工具的文本裁剪方法容易产 生HTML结构不完整的情形,造成裁剪得到的门户部件不能正确地运行。 本文的主要工作就是通过研究一个HTML修补器来解决上述HTML结构不 完整的问题,主要工作及创新点如下: (1)综述企业信息门户EIP以及国内外网页裁剪的情况,主要介绍了外国 的大公司IBM和ORACLE的Portal及其网页裁剪的情况; (2)总结HTML语言以及词法分析的理论性知识,在词法分析中重点介绍了 正则表达式和有穷自动机; (3)提出了一个基于有穷自动机的HTML修补器的解决方案。该方案首先利 化,然后根据正则表达式和有穷自动机对HTML代码进行词法分析,虽后提出一 个基于有穷自动机的三次扫描修补算法对HTML代码进行修补,从而使得待修补 的HTML代码结构完整化。 本文的HTML修补器成功地应用在一个实际EIP项目开发的网页裁剪工具 中,并取得了良好的效果。但是该HTML修补器也存在一些不足之处,目前只 能应用于文本裁剪,而不能应用于图像和动画裁剪,这也是将来需要进一步研究 的工作。 关键词:企业信息门户、网页裁剪、HTML、正则表达式、有穷自动机 ll 英文摘要 ResearchonHTML tool repairing in web clipping Mathematics Major:Computational Name:LiRui Xiaofu Supervisor:Prof。Li Abstract Web isan toolof informationin clipping important acquiring Enterprise Information iscalledEIPfor short.Whento countsfor Portal,which EIP,it applied ofresearchand greatmeaning foreign development.Atpresent,manycompanies, suchas theirownPortal in IBM,O

文档评论(0)

tjAfdc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档