（毕业设计论文）大规模网页模块识别与信息提取系统设计与实现.docVIP

下载本文档

4
0
约2.96万字
约 43页
2018-09-12 发布于广西
举报

（毕业设计论文）大规模网页模块识别与信息提取系统设计与实现.doc

lPAGE i MACROBUTTON MTEditEquationSection2 SEQ MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ MTChap \r 1 \h \* MERGEFORMAT 本科生毕业论文题目：(中文) 大规模网页模块识别与信息提取系统设计与实现 (英文) Design and Implementation of Large Scale Web Template Detection and Information Extraction System 姓名：学号院系：计算机系专业：搜索引擎与互联网信息挖掘指导教师： TIME \@ EEEE年O月A日二〇一三年三月三十一日二○一三年三月十三日摘要本文在已有的基于Dom-Tree和启发式规则的网页信息提取算法的基础上，通过为所有符合W3C规范的Html标签分类，逐个分析各Html标签所包含的语义信息，细化规则设置，实现了一种自底向上的无信息遗漏的网页分块算法，并在此基础上，利用统计方法得

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

（毕业设计论文）大规模网页模块识别与信息提取系统设计与实现.docVIP

（毕业设计论文）大规模网页模块识别与信息提取系统设计与实现.doc

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档