基于规则的网页分割预处理算法研究.pdfVIP

  • 3
  • 0
  • 约3.33万字
  • 约 5页
  • 2017-09-03 发布于北京
  • 举报

基于规则的网页分割预处理算法研究.pdf

第 40 卷第llA 期 计算机科学 VoL 40 No. llA 2013 年 11 月 Computer Science Nov 2013 基于规则的网页分割预处理算法研究 彭红超1 童名文1 邹军华2 郝秋红1 (华中师范大学信息与新同传播学院 武汉 430079)1 (湖北大学教育学院 武汉 430070)2 摘 要 针对国家精品课程网站中网页内容和样式独立设计,网页分割算法难以运行的问题,基于规则提出了一种网 页分割预处理算法,建立了网页标签和样式信息的关联。算法包括 3 个步骤2 第一,获取样式信息;第二,关联样式信 息和标签;第三,输出 HTML和PerfectNode 关联类列表。随机选取了 100 个国家精品课程网站的网页运行预处理算 法,实验结果表明该算法可以有效地融合网页标签和样式信息,解决了网页分割算法无法运行的问题。

文档评论(0)

1亿VIP精品文档

相关文档