Deep Web查询接口模式抽取方法研究.docVIP

  • 7
  • 0
  • 约1.47万字
  • 约 11页
  • 2017-09-13 发布于安徽
  • 举报
 Deep Web 查询接口模式抽取方法研究# 朱会峰,左万利 (吉林大学计算机科学与技术学院,长春 130012) 5 10 15 20 25 30 35 40 摘要:通过对查询接口内部编码和视觉单元信息的研究,提出了 Deep Web 查询接口模式抽 取方法。首先,设计启发式规则对含有查询接口表单的 HTML 网页进行查询接口区域定位以 过滤掉非查询接口表单;其次,利用有效数据单元对查询接口进行解析以获得待结合的查询 接口的标记信息;然后,应用基于观察和统计下的内部编码规则和视觉单元信息规则进行查 询接口属性的抽取;最后,在领域本体的指导下获取表单属性信息中的语义关系用于组合表 单属性,从而在语义层次上获得查询接口的模式。实验结果表明本文提出的模式抽取方法是 高效、可行的。 关键词:Deep Web;模式抽取;领域本体 中图分类号:TP31 Research on Schema Extraction from Deep Web Query Interface ZHU Huifeng, ZUO Wanli (College of Computer Science and Technology, Jilin University, ChangChun 130012) Abstract: In this paper, a novel schema extraction a

文档评论(0)

1亿VIP精品文档

相关文档