网站大量收购独家精品文档,联系QQ:2885784924

【基于向量模型的虚假新闻监测研究13000字】.docx

【基于向量模型的虚假新闻监测研究13000字】.docx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE

PAGEIII

PAGE

PAGEI

基于向量模型的虚假新闻监测研究

摘要

近年来,互联网和社交媒体平台迅速发展,信息传递速度大大加快,各种信息铺天盖地涌向人们,占据着人们的时间。真实的信息接收有助于人们进行判断,虚假的信息会影响人们的判断。而新闻是公众信息的重要组成部分。如今,社交媒体平台飞速发展为虚假新闻的传播提供了很好的土壤,新闻的主要来源已经变成了各种各样的社交媒体平台。虚假新闻的检测可以说是迫在眉睫的。虚假新闻检测的准确度和效率是处理过程中非常关心的问题。同时,在自然语言处理中,虚假新闻检测也是一个非常富有挑战性的任务。

本文的主要研究内容是基于深度学习的虚假新闻检测模型研究。是基于神经网络的相关模型和词向量模型相结合来进行文本分类。首先就要采用词向量模型将词表示为向量,我们分别采用了Word2ver词向量模型和Glove词向量模型。分词工具我们采用了北京大学的pkuseg工具。神经网络模型采用pytorch框架进行构建。本文采用了循环卷积神经网络(RCNN),并实现了卷积神经网络模型和循环神经网络模型进行对比,分析分类的准确率和效率。循环卷积神经网络充分融合了循神经网络和卷积神经网络的优点,采用双向循环神经网络和最大池化层相结合的方法来获取上下文信息,与普通的卷积神经网络模型相比,该模型更加能减少信息中的噪声。

将Word2ver模型和Glove模型作为神经网络中的词嵌入层。不同的词向量模型与不同的神经网络模型搭配使用,得到不同模型搭配使用的结果,分析模型预测结果的准确率和效率。最终的实验表明Glove词向量模型搭配RCNN模型的效果最好,准确率达到了93.44%,Word2ver词向量模型搭配RNN的效果相比之下效果最差,准确率为91.77%。

关键词:虚假新闻检测,循环卷积神经网络,词向量,深度学习

目录TOC\o1-3\h\u

TOC\o摘要 Ⅰ

26123第1章绪论 1

316181.1课题背景及意义 1

284991.2国内外研究现状 1

129121.3本文主要工作 2

71271.4论文结构安排 2

23578第2章相关技术简介 4

102022.1神经网络 4

228332.1.1神经网络基础 4

63632.1.2卷积神经网络 4

272622.1.3循环神经网络 5

247332.2词向量模型 6

98152.2.1Word2ver模型 6

249192.2.2Glove模型 8

15999第3章循环卷积神经网络 10

93413.1长短期记忆神经网络 10

169813.2RNN与CNN的优缺点分析 11

247713.3循环卷积神经网络模型 11

10054第4章数据准备及实验 14

44254.1实验环境 14

291324.2数据准备及处理 14

120484.3模型构建 15

275334.3.1权重初始化 15

264074.3.2Word2ver和Glove词向量模型训练 16

305534.3.3CNN模型实现 16

151534.3.4RNN模型实现 17

230554.3.5RCNN模型实现 17

100384.4实验结果及分析对比 18

18354结论 22

32474参考文献 23

PAGE

PAGEI

PAGE

PAGE31

PAGE

PAGEII

PAGE

PAGE32

第1章绪论

1.1课题背景及意义

在当今时代,互联网技术蓬勃发展,网络已经渗透到了人们的各种各样的生活和娱乐活动之中,据2021年发布的《中国互联网络发展状况统计报告》[1]中显示,截至到2020年12月份,我国网民的规模达到了9.89亿,互联网普及率达70.4%。这些不断攀升的数字代表着越来越多的人通过网络获取信息,信息的增长速度越来越快,各种信息不论真假,不断涌入人们的脑海,使人们难以辨别信息的真假,误导网络中的其他用户,有可能造成不可预期的后果。

新闻是社会大众获取最新信息的途径之一,新闻的生命是真实性。而虚假新闻是含有虚假成分的新闻,它具有不客观性和虚假性。虚假新闻的传播影响了人们的正常生活,损伤当事人的声誉和形象。不仅如此,还对真正的好新闻,真新闻的价值有所损害,使真正的新闻的传播度下降,削弱了新闻的公信力。通过各种各样的媒体平台,虚假新闻的传播速度越来越快。

由于虚假新闻的数量多,迷惑性强,人工检测虚假新闻是要投入的人力成本非常庞大,效率和

您可能关注的文档

文档评论(0)

02127123006 + 关注
实名认证
内容提供者

关注原创力文档

1亿VIP精品文档

相关文档