- 3
- 0
- 约1.27万字
- 约 3页
- 2018-04-02 发布于河南
- 举报
基于查询接口文本的DeepWeb数据源分类
第36卷 第12期 计 算 机 工 程 2010年6月
Vo1.36 No12 ComputerEngineering June2010
· 软件技术与数据库 · 文章编号;10o0-__3428(20lo)l2一-oo66___o3 文献标识码:A 中圈分类号。TP311.52
基于查询接 口文本的DeepWeb数据源分类
华 慧,伏玉琛,周小科
(苏州大学计算机科学与技术学院,苏州 215006)
摘 要:根据DeepWeb数量的爆炸性增长特点,提出一种基于查询接口文本的DeepWeb数据源分类算法,对于分类的查询接13,采用
2种方法:基于向量空间的TF-IDF方法和基于知网的语义相似度方法。综合2种方法获得接 口之间的相似度。借鉴K—NN算法,提出WDB
分类算法,从而实现DeepWeb数据源的分类。实验结果表明,该算法在熵和F—measure2种评价标准上均能获得较
原创力文档

文档评论(0)