- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本科毕业设计 (论文)
GRADUATION DESIGN(THESIS)
基于深度神经网络的新闻文
题目:
本分类研究
学生姓名: 姓名
指导教师:
学院: 计算机院
专业班级: 计算机科学与技术 1801
本科生院制
2022 年 6 月
基于深度神经网络的新闻文本分类研究
基于深度神经网络的新闻文本分类研究
摘要
随着互联网新技术的快速蓬勃发展,新闻网站和网络媒体平台成为新闻传
播事业极其重要的组成部分,网络新闻已是人们最主要的讯息来源之一。为了满
足大量网络新闻读者用户的需求,保证内容平台发布个性化推荐新闻的高效率有,
效地管理和利用网络新闻数据成为了当今新闻平台的迫切需要。在此基础上,本
文对网络新闻文本分类开展了算法的研究和系统的实现, 目标是建立一个分类
精度高的网络新闻文本分类模型。本文所做的工作主要包括以下几个部分:
(1)文本分类算法的所得结果很大程度上受到文本特征的表示方式的影
响。word2vec 词向量可用于表示文本,能够基于分布式表示将词语映射成为 n
维空间中稠密的实数向量,再通过计算矢量之间的余弦距离,即可测量词之间的
意义相关性。本文采用词向量来代替深度学习网络模型输入层较为常见的 one-
hot 向量。
(2 )基于python 语言,使用 pytorch 深度学习框架,在完成对词的特征表
示后,分别构建 RNN 和 CNN 神经网络模型,并进行文本分类任务。在 CNN
中使用不同尺寸的卷积核来提取文本含义的深层特征。实验结果表明,本模型
的精度、召回率、F1 值分别达到 96.4%、95.9%、96.2% 。本文所应用的CNN、
RNN 模型可以通过特定的分层结构从文本的浅层意义特征中提取深层特征,可
以构建起高效的新闻文本分类模型。
关键词:新闻文本分类;深度学习 长短期记忆(LSTM )网络 卷积神经网
络
基于深度神经网络的新闻文本分类研究
Research on news text classification based on deep
neural network
ABSTRACT
In order to meet the needs of a large number of online news readers and users, to
ensure the high efficiency of the content platform to publish personalized recommended
news, and to effectively manage and utilize online news data, it has become an urgent
need for todays news platforms. On this basis, this paper researches and implements
the algorithm of network news text classification, and the goal is to establish a network
news text classification model with high classification accuracy. The work done in this
paper mainly includes the fo
您可能关注的文档
- 基于单片机的中药仓库系统设计.pdf
- 基于单片机控制的音乐盒.pdf
- 基于电商平台的供应链金融融资模式及其风险防范——以京东为例.pdf
- 基于历史文化保护视角下的公园改造设计——以武汉中山公园为例--字.pdf
- 基于描述统计分析对大学生成绩影响因素的研究.pdf
- 基于深度学习的行人属性辨识研究.pdf
- 基于施工监理技术保障体系应用的分析研究_原文对照报告.pdf
- 基于太阳能电池板的智能跟踪系统设计.pdf
- 基于体验经济下的酒店产品开发研究.pdf
- 基于图像的条形码识别方法的研究.pdf
- 绿电2022年系列报告之一:业绩利空释放,改革推动业绩反转和确定成长.docx
- 化学化工行业数字化转型ERP项目企业信息化规划实施方案.pdf
- 【研报】三部门绿电交易政策解读:溢价等额冲抵补贴,绿电交易规模有望提升---国海证券.docx
- 中国债券市场的未来.pdf
- 绿电制绿氢:实现“双碳”目标的有力武器-华创证券.docx
- 【深度分析】浅析绿证、配额制和碳交易市场对电力行业影响-长城证券.docx
- 绿电:景气度+集中度+盈利性均提升,资源获取和运营管理是核心壁垒.docx
- 节电产业与绿电应用年度报告(2022年版)摘要版--节能协会.docx
- 2024年中国人工智能系列白皮书-智能系统工程.pdf
- 如何进行行业研究 ——以幼教产业为例.pdf
最近下载
- (苏教版)数学一年级上册寒假作业应用题“天天练”习题卡,含30份题组,附参考答案.doc
- 电子书 -筚路维艰 中国社会主义路径的五次选择.docx
- 2024-2025学年八年级物理上册第五章《物体的运动》单元测试卷(含答案)(苏科版2024新教材).pdf VIP
- “字”有妙法 “识”之有味——2024秋新教材部编版一年级语文上册第六单元 识字 教材解读.docx
- 观看《榜样9》心得体会.docx
- 津津有味•读经典Level2 《一千零一夜》译文和正文答案.docx
- 一年级加法口诀表(100以内所有加法口诀).pdf VIP
- 2025贵州铜仁市德江县人民政府征兵办公室招聘专职人员3人笔试备考试题及答案解析.docx VIP
- 2025年在全县一季度经济高质量发展暨经济“开门红”分析调度会议上的讲话.pdf VIP
- 反渗透膜污染物鉴别试验方法.pdf VIP
文档评论(0)