基于web资源的信息抽取技术.docxVIP

  • 1
  • 0
  • 约6.44千字
  • 约 7页
  • 2019-02-19 发布于广东
  • 举报
基于WEB资源的信息抽取技术 郭志红 (上海交通大学情报研究所,上海200030) 摘要web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据 库型查询系统所利用。如何将这些信息抽取出來,转化成结构化信息,供其它信 息集成系统所利用,成为该顶域的研究热点。本文介绍了-?个简单的web信息抽 取模型,对基于该模型的wrapper归纳技术进行了探讨,并描述了一个wrapper 口动生成系统的原型。 关键词信息抽取wrapper 关键词信息抽取wrapper归纳技术 自动生成原型系统 The Technology of Information Extraction for WEB Resource Guo Zhihong (Informalion Research Institute, Shanghai Jiaotong university, Shanghai 200030) Abstract There is picnty of useful infonueition in web resource. It can,t be used by the traditional database query system because it is not well-structured. Recently considerable attention has been re

文档评论(0)

1亿VIP精品文档

相关文档