哈希快速多标记学习算法
第33卷 第 8期 信 号 处 理 Vol.33 No.8
2017年8月 JOURNALOFSIGNALPROCESSING Aug.2017
文章编号:1003-0530(2017)08-1065-08
哈希快速多标记学习算法
1 1 1 1 2
胡海峰 耿静静 冯巧遇 孙 永 吴建盛
(1.南京邮电大学通信与信息工程学院,江苏南京210003;2.南京邮电大学地理与生物信息学院,江苏南京210046)
摘 要:本文针对多标记学习耗时大、很难处理大规模数据的问题,提出了一种哈希快速多标记学习算法(HFMLL)。
该算法将哈希算法与多标记学习算法结合,采用局部敏感哈希算法快速获得每个样本的近邻样本,并通过最小
独立置换的MinHash算法快速找到每个标记的相关标记,根据其近邻样本及相关标记的信息,运用最大后验概
率准则来预测新样本的标记集。实验表明HFMLL算法在保持较高分类性能的情况下,算法速度明显优于目前的
多标记算法,可以广泛应用于大规模的数据集。
关键词:多标记学习;哈希;快速;标记相关性
中图分类号:TP391 文献标识码:A DOI:10.16798/j.issn.10030530.2017.08.006
FastMultilabelLearningBasedonHashing
1 1 1 1 2
HUHaifeng GENGJingjing FENGQiaoyu SUNYong WUJiansheng
(1.SchoolofTelecommunicationandInformationEngineering,NanjingUniversityofPostsandTelecommunications,
Nanjing,Jiangsu210003,China;2.SchoolofGeographicandBiologicalInformation,Nanjing
UniversityofPostsandTelecommunications,Nanjing,Jiangsu210046,China)
Abstract:AFastMultilabelLearningbasedonHashingalgorithm(HFMLL)isproposedtosolvetheproblemthatmany
currentmultilabellearningalgorithmsareusuallytimeconsuminganddifficulttohandlelargescaledata.Themethod
combinesthehashingalgorithmandthemultilabelalgorithm.TheHFMLLalgorithmtakesadvantageofaLocalitySensitive
Hashing(LSH)togetitsneighboringinstancesforeachunseeninstance,andcalculatesthelabelcorrelationbyestimating
thesimilarityoflabelsthroughaminwiseindependentpermutationslocalitysensitivehashing(MinHash)scheme.Then,
maximumaposterioriprincipleisusedtopredictthelabelsetforunseeninstancesbyconsideringtheirstatisticalinforma
tionattainedfromallrelatedlabels
您可能关注的文档
- 关于举办中小学图书馆业务人员培训班的通知-华东模范中学.DOC
- 公路客运车辆动态资讯管理系统监理人员教育训练中华电信企业客户.PPT
- 兰考加油加气站及电动汽车充电设施专项规划-兰考人民政府.PDF
- 关于举办电力系统继电保护定值整定与计算-中教网联专业技术培训网.DOC
- 关于举办社会体育指导员培训班的通知-广东跆拳道协会.DOC
- 关于举办第二届全国大学生数学竞赛福建预赛的通知-闽南师范大学.DOC
- 关于做好2017年下半年全国计算机等级考试工作的通知.DOC
- 关于做好湖北农民教育培训师资库教师-湖北生物科技职业学院.DOC
- 关于做好实训室机房和多媒体课室期初准备工作的通知-教务处.DOC
- 关于做好项目验收有关准备工作的通知-上海无线传感测控服务平台.DOC
原创力文档

文档评论(0)