- 3
- 0
- 约3.33万字
- 约 5页
- 2017-09-03 发布于北京
- 举报
第 40 卷第llA 期 计算机科学 VoL 40 No. llA
2013 年 11 月 Computer Science Nov 2013
基于规则的网页分割预处理算法研究
彭红超1 童名文1 邹军华2 郝秋红1
(华中师范大学信息与新同传播学院 武汉 430079)1 (湖北大学教育学院 武汉 430070)2
摘 要 针对国家精品课程网站中网页内容和样式独立设计,网页分割算法难以运行的问题,基于规则提出了一种网
页分割预处理算法,建立了网页标签和样式信息的关联。算法包括 3 个步骤2 第一,获取样式信息;第二,关联样式信
息和标签;第三,输出 HTML和PerfectNode 关联类列表。随机选取了 100 个国家精品课程网站的网页运行预处理算
法,实验结果表明该算法可以有效地融合网页标签和样式信息,解决了网页分割算法无法运行的问题。
原创力文档

文档评论(0)