一种面向Deep Web数据源的重复记录识别模型.pdfVIP

  • 6
  • 0
  • 约3.28万字
  • 约 7页
  • 2019-08-13 发布于北京
  • 举报

一种面向Deep Web数据源的重复记录识别模型.pdf

第 期 电 子 学 报 2 Vol.38 No.2 年 月 2010 2 ACTAELECTRONICASINICA Feb. 2010 一种面向DeepWeb数据源的重复记录识别模型 申德荣,刘丽楠,寇 月,聂铁铮,于 戈 (东北大学信息科学与工程学院,辽宁沈阳 110004) 摘 要: 重复记录是指描述现实世界中同一实体的不同的记录信息 由于从同一个领域的不同 数据 . DeepWeb 源中抽取的记录信息通常存在许多重复记录,本文针对半结构化的重复记录的识别进行研究 在已知全局模式和全局

文档评论(0)

1亿VIP精品文档

相关文档