- 7
- 0
- 约1.47万字
- 约 11页
- 2017-09-13 发布于安徽
- 举报
Deep Web 查询接口模式抽取方法研究#
朱会峰,左万利
(吉林大学计算机科学与技术学院,长春 130012)
5
10
15
20
25
30
35
40
摘要:通过对查询接口内部编码和视觉单元信息的研究,提出了 Deep Web 查询接口模式抽
取方法。首先,设计启发式规则对含有查询接口表单的 HTML 网页进行查询接口区域定位以
过滤掉非查询接口表单;其次,利用有效数据单元对查询接口进行解析以获得待结合的查询
接口的标记信息;然后,应用基于观察和统计下的内部编码规则和视觉单元信息规则进行查
询接口属性的抽取;最后,在领域本体的指导下获取表单属性信息中的语义关系用于组合表
单属性,从而在语义层次上获得查询接口的模式。实验结果表明本文提出的模式抽取方法是
高效、可行的。
关键词:Deep Web;模式抽取;领域本体
中图分类号:TP31
Research on Schema Extraction from Deep Web Query
Interface
ZHU Huifeng, ZUO Wanli
(College of Computer Science and Technology, Jilin University, ChangChun 130012)
Abstract: In this paper, a novel schema extraction a
原创力文档

文档评论(0)