- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
谣言检测算法研究的国内外文献综述
谣言检测的前提是以谣言为基本对象。自古以来,有人的地方就会有谣言,关于谣言的研究不仅局限于单个学科的研究,而是横跨心理学、社会学、政治学、历史学、传播学等众多学科的交叉研究,因而每个学科都从自己的视角来定义和分析谣言。所以,学者们往往根据各自的研究来定义谣言,导致谣言至今为止并没有非常明确统一的定义。
翻阅词典REF_Re\r\h[2]可以找到谣言词语的定义:1.指没有事实存在而捏造的话。2.没有公认的传说。3.民间流传的评议时政的歌谣,谚语。“谣”字本身含义是指凭空捏造的不可信的话,自互联网时代以来,谣言的传播方式从口口相传转变为网络上的文字、图片、音频或视频等方式传播。
查阅相关文献,关于谣言的定义各有不同之处,尽管当前情报学界并未对谣言进行明确的定义与声明,但大部分研究均认为谣言存在于网络空间、社交圈等信息环境中,传递于用户之间,并受到公众关注的虚假信息REF_Re\r\h[3]。文本谣言的定义指的是在网络社交工具中传播的没有事实依据或故意捏造的消息。
所谓谣言检测就是将谣言从所有与本事件相关的真实事件中检测出来虚假的、人为捏造的事件,利用谣言的特征,或者跟谣言传播相关的特征,结合谣言检测模型,将谣言准确的检测出来。谣言检测主要目的在于发现网络谣言,追溯到谣言的制造者,采取辟谣的方法来停止谣言的散播,以此来减小谣言所带来的损失与危害。现在的谣言检测方法大多要依靠辟谣平台,需要网友慧眼识谣并主动举报,这样的方法效率低,虽然可以检测出谣言,但还是需要智者来识别,由机器来检测出谣言就变得非常有必要。
迄今为止,谣言检测都被当作是二分类任务。谣言检测最先以传统的机器方法出现,先手动提取特征,再进行分类器搭建。2016年深度学习方法中的循环神经网络被用来进行谣言检测,它可以自动提取特征,省去手工的麻烦,之后越来越多的深度学习方法被广泛应用于谣言检测。
1.3.1基于传统方法的谣言检测
从目前来看,谣言检测分为传统机器学习方法和深度学习方法两类。谣言检测在机器学习方面,主要采用贝叶斯REF_Re\r\h[5]、决策树REF_Re\r\h[6]-REF_Re\r\h[8]、支持向量机REF_Re\r\h[9]、隐马尔可夫模型REF_Re\r\h[10]、随机森林REF_Re\r\h[9]等方法。学者们通常将其视为二分类任务,即分类为谣言和非谣言。
最开始是在推特上进行谣言检测的。2011年QazvinianREF_Re\r\h[5]等人,他们通过分析推特信息的文本内容特征,构建贝叶斯分类器和集成分类器来识别谣言。同年,CastilloREF_Re\r\h[6]等人从推特帖子中提取特征,并将其分成基于内容的特征,基于用户的特征,基于传播的特征等,采用J48决策树方法进行的谣言检测。之后KownREF_Re\r\h[52]等人利用随机森林方法来进行谣言检测,取得了较高的精确度。DayaniREF_Re\r\h[13]等人提取了用户特征和内容特征,并采用KNN分类器和NB分类器在推特进行检测谣言。Al-KhalifaREF_Re\r\h[14]等人、Gupta等人REF_Re\r\h[15]以推特为研究平台,提取帖子的文本特征和用户特征,构造决策树分类器进行谣言检测。MaREF_Re\r\h[9]等人提取了用户特征、内容特征和传播特征,同时提出上下文特征,在推特数据集上采用线性SVM分类器分别与DT方法、随机森林方法以及SVM-RBF方法作比较,实验结果可以明确看出,该文提出的方法提高了谣言检测精确率并且缩短了用时。
而在新浪微博中最早进行谣言检测的是YangREF_Re\r\h[50]等人在2012年提出新的可以应用的用户特征,利用具有RBF核函数的SVM分类器进行了谣言检测。LiangREF_Re\r\h[11]等人提出利用5个新的用户行为特征,构建决策树分类器进行谣言检测。CaiREF_Re\r\h[12]等人,对信息接收者的行为特征进行分析,以用户的评论行为为重要特征进行判断,通过分析转发、评论以及文本特征,应用机器学习的
您可能关注的文档
- 2025《40Cr热处理车间设备选择分析案例》2900字.docx
- 2025《1500吨日处理量的南宁市某高校生活污水处理工艺设计》11000字.docx
- 2025《A城市商业银行普惠信贷风险管理流程分析案例》6300字.docx
- 2025《A工程项目的质量管理问题分析》12000字.docx
- 2025《A公司薪酬管理的现状、问题及对策研究》11000字.doc
- 2025《CBA联赛中广东与新疆防守战术运用统计和效果分析案例》5800字.docx
- 2025《H房地产公司的纳税筹划方案设计案例》11000字.docx
- 2025《Z房地产公司内部环境分析案例》6400字.doc
- 2025《氨合成碳化工艺中NH3-H2O-CO2 三元体系多温相图分析案例》1500字.docx
- 2025《产业升级的概念、内涵与指标体系测度分析综述》5800字.docx
- 2025年鸡西市麻山区公益性岗位招聘8人(公共基础知识)测试题附答案.docx
- 杭州之江湾股权投资基金管理有限公司招聘参考题库附答案.docx
- 2026江苏辖区农村商业银行常熟农商银行校园招聘200人(公共基础知识)测试题附答案.docx
- 2025年中国石油新疆油田分公司秋季高校毕业生招聘360人(公共基础知识)综合能力测试题附答案.docx
- 2023年攀枝花市直属机关遴选公务员笔试真题汇编附答案解析(夺冠).docx
- 2026广发银行太原分行校园招聘(公共基础知识)测试题附答案.docx
- 2025四川成都医学院招聘事业编制辅导员10人(公共基础知识)测试题附答案.docx
- 2026年毛概期末考试试题库必考题.docx
- 2025年合肥市某国有企业2025年岗位外包招聘(公共基础知识)测试题附答案.docx
- 2026年重庆青年职业技术学院单招(计算机)测试模拟题库附答案.docx
原创力文档


文档评论(0)