- 3
- 0
- 约2.17万字
- 约 6页
- 2017-09-09 发布于天津
- 举报
第卷第期武汉工程大学学报第期年月文章编号基于模糊综合评判和长度过滤的改进算法郭文龙董建怀福建江夏学院电子信息科学学院福建福州摘要为了提高数据库的数据质量需要对相似重复记录进行清洗基本邻近排序算法是目前常用的清洗算法之一针对判重过程中属性权值计算主观性过强的问题提出通过多用户综合评判确定属性权值的方法该方法能更客观地评判属性的重要性程度在此基础上结合属性权值计算两条记录的长度比例排除不可能构成相似重复的记录减少了比较次数提高了检测效率实验结果表明改进算法在查全率查准率及时间效率等方面均有所提高关键
第39卷第4期 武 汉 工 程 大 学 学 报 Vol.39 No.4
第4期 2017年8月 JournalofWuhanInstituteofTechnology Aug. 2017
文章编号:1674-2869(2017)04-0403-06
基于模糊综合评判和长度过滤的SNM改进算法
郭文龙,董建怀
福建江夏学
原创力文档

文档评论(0)