哈希快速多标记学习算法.PDF

哈希快速多标记学习算法

第33卷 第 8期 信 号 处 理 Vol.33 No.8 2017年8月 JOURNALOFSIGNALPROCESSING Aug.2017 文章编号:1003-0530(2017)08-1065-08 哈希快速多标记学习算法 1 1 1 1 2 胡海峰 耿静静 冯巧遇 孙 永 吴建盛 (1.南京邮电大学通信与信息工程学院,江苏南京210003;2.南京邮电大学地理与生物信息学院,江苏南京210046) 摘 要:本文针对多标记学习耗时大、很难处理大规模数据的问题,提出了一种哈希快速多标记学习算法(HFMLL)。 该算法将哈希算法与多标记学习算法结合,采用局部敏感哈希算法快速获得每个样本的近邻样本,并通过最小 独立置换的MinHash算法快速找到每个标记的相关标记,根据其近邻样本及相关标记的信息,运用最大后验概 率准则来预测新样本的标记集。实验表明HFMLL算法在保持较高分类性能的情况下,算法速度明显优于目前的 多标记算法,可以广泛应用于大规模的数据集。 关键词:多标记学习;哈希;快速;标记相关性 中图分类号:TP391   文献标识码:A   DOI:10.16798/j.issn.10030530.2017.08.006 FastMultilabelLearningBasedonHashing 1 1 1 1 2 HUHaifeng GENGJingjing FENGQiaoyu SUNYong WUJiansheng (1.SchoolofTelecommunicationandInformationEngineering,NanjingUniversityofPostsandTelecommunications, Nanjing,Jiangsu210003,China;2.SchoolofGeographicandBiologicalInformation,Nanjing UniversityofPostsandTelecommunications,Nanjing,Jiangsu210046,China) Abstract:AFastMultilabelLearningbasedonHashingalgorithm(HFMLL)isproposedtosolvetheproblemthatmany currentmultilabellearningalgorithmsareusuallytimeconsuminganddifficulttohandlelargescaledata.Themethod combinesthehashingalgorithmandthemultilabelalgorithm.TheHFMLLalgorithmtakesadvantageofaLocalitySensitive Hashing(LSH)togetitsneighboringinstancesforeachunseeninstance,andcalculatesthelabelcorrelationbyestimating thesimilarityoflabelsthroughaminwiseindependentpermutationslocalitysensitivehashing(MinHash)scheme.Then, maximumaposterioriprincipleisusedtopredictthelabelsetforunseeninstancesbyconsideringtheirstatisticalinforma tionattainedfromallrelatedlabels

文档评论(0)

1亿VIP精品文档

相关文档