- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微博谣言识别研究
第57卷 第23期 2013年12月
微博谣言识别研究
■ 贺刚 吕学强 李卓 徐丽萍
[摘 要]指出微博在传播信息的同时,也夹杂着谣言等虚假消息、不实言论。针对微博谣言传播速度快、
影响范围广等特点,深层挖掘微博中的隐含信息,提出符号特征、链接特征、关键词分布特征和时间差等新特
征,将微博谣言识别形式化为分类问题,综合新提取的特征与微博文本特征、用户特征和传播特征构建多个特
征模板,利用SVM分类学习方法对微博进行分类,识别结果可有效辅助人们更好、更快地识别谣言。实验结果
表明,在基本特征的基础之上,新提出的特征能有效提高微博谣言识别的正确率。
[关键词]微博 谣言识别 特征模板 SVM
[分类号]TP391
DOI:10.7536/j.issn.0252-3116.2013.23.019
微博(microblog)是一种全新的信息发布和共享社 积极作用。由于判定标准不一,导致难以识别谣言,
交服务,用户可以通过互联网或移动客户端等传播媒 仅靠人力手段费时且耗力。本文以微博为谣言传播
介,随时随地表达个人观点与兴趣爱好。与以往传统 媒介,针对微博空间中充斥的谣言与谣言相关的短
媒介相比,微博具有无法比拟的信息传播速度,用户可 文本信息进行自动识别研究,为谣言的识别提供参
及时获取信息以了解周边事态;作为一种新的自媒体 考依据。
工具,其发布信息的门槛较低,任意用户均可通过微博
1 国内外研究现状
发表个人意见,表达个人情感。微博的新媒体特性给
公众带来了惊喜和改变,让彼此之间的沟通和交流更 随着微博等网络社交媒体的快速发展,关于微博
加简单、便捷。同时,微博独具的信息多样化、表达自 谣言识别的研究工作越来越多。近几年国外关于
由化、裂变式传播速度等特性,使其成为虚假信息、不 Twitter和网络谣言已经积累了大量研究成果可供借
[2]
实言论传播的绝佳平台,从而助长了微博谣言的产生 鉴。C.Castillo等 研究了Twitter话题可信度评估的
与扩散。 方法,他们获取 Twitter上与热点话题相关的数据集,
谣言一直是心理学与社会认知学研究的主要内容 从中提取微博文本、用户信息和传播特征,然后采用
[1] J48决策树分类学习方法来预测话题的可信性,达到了
之一。胡钰 将谣言定义为一种以公开或非公开渠道
[3]
传播的对公众感兴趣的事物、事件或问题的未经证实 一定的效果。V.Qazvinian等 通过分析Twitter消息
的阐述或诠释。本文在上述谣言定义的基础上得到微 的浅层文本特征、行为特征和元素特征,构建多个贝叶
博谣言的定义:是一种在微博社区环境下,以公开或非 斯分类器和集成分类器,以识别Twitter中的谣言。M.
[4] [5]
公开渠道传播的对公众感兴趣的事物、事件或问题的 Mendoza等 与T.Takahashi等 分别对地震等自然灾
未经证实的阐述或诠释。 害发生时在Twitter上产生的谣言进行分析研究。M.
微博谣言的传播与扩散给人们的正常生活、社会 Mendoza等以2010年智利大地震为例,利用Twitter数
秩序造成了极坏的影响。研究微博谣言识别的方 据分析了紧急情况下用户发布微博的行为特征,并追
法,有助于用户判断信息的真假,营造健康的互联网 踪与地震有关
原创力文档


文档评论(0)