中文社交媒体谣言统计语义分析-欢迎来到清华大学自然语言.PDFVIP

中文社交媒体谣言统计语义分析-欢迎来到清华大学自然语言.PDF

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文社交媒体谣言统计语义分析-欢迎来到清华大学自然语言.PDF

中国科学: 信息科学 2015 年 第45 卷 第12 期: 1536–1546 社会媒体处理专题 论文 中文社交媒体谣言统计语义分析 刘知远 张乐 涂存超 孙茂松 智能技术与系统国家重点实验室, 北京 100084 清华信息科学与技术国家实验室 (筹), 北京 100084 清华大学计算机系, 北京 100084 * 通信作者. E-mail: liuzy@tsinghua.edu.cn 收稿日期: 2015–09–27; 接受日期: 2015–10–20; 网络出版日期: 2015–12–09 国家自然科学基金(批准号:、国家社会科学基金重大招标项目 (批准号: 13ZD190) 和国家重点基础研究发展计划 (973 计划)(批准号: 2014CB340501) 资助 摘要 本文以新浪微博为例, 针对收集的谣言信息进行了不同角度的分析统计. 在统计分析方面, 我 们研究分析了谣言的影响力及其产生与消亡的特点. 在语义分析方面, 根据不同谣言的语义内容, 将 微博谣言划分为5 大类, 并且建立了基于微博谣言的文本分类器. 在时序分析方面, 根据转发趋势进 行了谣言的划分, 分析了不同类别谣言的传播特点. 最后, 本文面向社交媒体提出了一套综合机器智 能和群体智能的自动辟谣框架. 关键词 社交媒体 谣言 语义分析 时序分析 辟谣 引言 谣言是社会心理学等领域关注的重要社会现象∼ 虽然谣言并没有公认的明确定义 但是大多 数学说都认同谣言是在人和人之间传播的 含有公众关心信息的一种特殊陈述 而其真实性不能很快 得到证明或是得不到证明 近年来 随着在线社交媒体的迅速发展 大量不可靠的信息得以快速和广泛地在人群中传播 社交 媒体上谣言泛滥可能导致人们难以从纷繁的信息中甄别得到可信的信息 进而影响人们正常的生活秩 序 特别是在面临突发公共事件 自然灾害、事故灾难、公共卫生事件、社会安全事件、经济危机等 时 广泛传播的谣言可能会具有极大的破坏性 因此 深入定量分析社交媒体中的谣言性质意义重大 社交媒体中的谣言泛滥不仅发生在我国 也成为 等英语世界社交媒体的痼疾 因此近年 来引起国内外学术界和产业界的广泛关注 涌现了大量针对社交媒体谣言的定量分析研究和谣言检测 然而这些研究大都是针对英语世界 等社交媒体∼ 主要利用了社会网络结构 评论等信息 展开分析 也有少数工作是面向中文社交媒体 如新浪微博 的∼ 但要么是针对有限的案例进行 分析 如郭美美事件 要么仅用少数语言学和网络特征进行谣言预测 无法了解社交媒体谣 言的全貌 本文以新浪微博为研究对象 收集了大规模社会媒体谣言数据 对中国社交媒体谣言进行了比较 全面的定量统计语义分析 新浪微博是中国最大的微博服务平台 截至 年 月底 新浪微博注 引用格式 刘知远 张乐 涂存超 等 中文社交媒体谣言统计语义分析 中国科学 信息科学 中国科学: 信息科学 第 45 卷 第 12 期 图 网络版彩图 微博社区管理中心不实信息处理公示页面 (Color online) The web page of Weibo misinformation processing platform 册用户数已超过 亿 日活跃用户达到 万 用户每日发博量超过 亿条 由于谣言泛滥带来的负 面后果日趋严重 新浪微博先后采取多种措施来应对微博谣言 在 年 月底 新浪微博颁布实施 《新浪微博社区公约》及一整套管理体系 明确微博用户权利 用户行为规范及社区管理机制 相应地 新浪微博专门设立了社区管理中心和举报处理大厅 受理用户对各类不良信息的举报 在人工查证后 对相关违规微博进行公示和处理 该中心将不良信息划分为 不实信息、泄露他人隐私

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档