中文微博客的垃圾用户检测.pdfVIP

  • 13
  • 0
  • 约2.02万字
  • 约 8页
  • 2015-09-29 发布于湖北
  • 举报
中文微博客的垃圾用户检测.pdf

第28卷第3期 中文信息学报 V01.28。No.3 2014年5月 OFCHINESE JOURNAL INFORMATl0NPROCESSINGMay.,2014 文章编号:1003—0077(2014)03—0062—06 中文微博客的垃圾用户检测 李赫元1’2,俞晓明1,刘悦1,程学旗1,程工3 (1.中国科学院计算技术研究所,北京100190; 2.中国科学院大学,北京100190; 3.国家计算机网络应急技术处理协调中心,北京100029) 摘要:微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该 文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户 资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集 的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征 具有较好的区分度。 关键词:微博客;垃圾用户;检测 中图分类号:TP391 文献标识码:A on in Research DetectingSpammer Micro-blogs LI Yue 1”,YU 1,LIU 1,CHENG1,CHENG Heyuan Xiaoming Xueqi Gon93 of of (1.Institute 100190,China; ComputingTechnology,ChineseAcademySciences,Beijing ofChinese of 100190,China; 2.UniversityAcademySciences,Beijing 3.National Network Technical Centerof Team/Coordination 100029,China) Computer EmergencyResponse China,Beijing the obtain hasbeeninfiltrated Abstract:Micro—blogschangeswaypeople information.However,Micro—blogsby of tO this researchon inChineseMicro- amount isa normaluser.In large spam,whichchallenge paper,we spare thebehaviorof userand 7newfeaturesfor them.Then,wedescribehow study spam

文档评论(0)

1亿VIP精品文档

相关文档