基于查询接口文本的DeepWeb数据源分类.pdfVIP

  • 3
  • 0
  • 约1.27万字
  • 约 3页
  • 2018-04-02 发布于河南
  • 举报

基于查询接口文本的DeepWeb数据源分类.pdf

基于查询接口文本的DeepWeb数据源分类

第36卷 第12期 计 算 机 工 程 2010年6月 Vo1.36 No12 ComputerEngineering June2010 · 软件技术与数据库 · 文章编号;10o0-__3428(20lo)l2一-oo66___o3 文献标识码:A 中圈分类号。TP311.52 基于查询接 口文本的DeepWeb数据源分类 华 慧,伏玉琛,周小科 (苏州大学计算机科学与技术学院,苏州 215006) 摘 要:根据DeepWeb数量的爆炸性增长特点,提出一种基于查询接口文本的DeepWeb数据源分类算法,对于分类的查询接13,采用 2种方法:基于向量空间的TF-IDF方法和基于知网的语义相似度方法。综合2种方法获得接 口之间的相似度。借鉴K—NN算法,提出WDB 分类算法,从而实现DeepWeb数据源的分类。实验结果表明,该算法在熵和F—measure2种评价标准上均能获得较

文档评论(0)

1亿VIP精品文档

相关文档