- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 2
基于深度学习的汽车行业评论文本的情感分析
目录
TOC \o 1-3 \h \z \u 基于深度学习的汽车行业评论文本的情感分析 1
1、研究背景与现状 2
1.1研究背景 2
1.2 研究现状 2
2、关键技术 4
2.1爬虫 4
2.2卷积神经网络 4
3、核心实验 5
3.1数据获取 5
3.2文本分词 6
3.3数据集可视化分析 7
3.4汽车评论属性情感分析 8
3.5总结 12
参考文献 13
文献翻译 15
摘要
近年来,随着我国经济水平的不断提高,居民对汽车的消费能力越来越大,我国汽车的保有量也不断地快速增多,因此汽车消费者在互联网各种汽车论坛上留下的评价文本也越来越多,而大量的这些评论文本为我们进行文本的情感分析提供了丰厚的素材。无论对于商家还是买家来说,如何快速的收集、分析这些庞杂的数据显然是个亟待解决的问题。本文正是基于解决此问题的基础上创建了一个汽车行业评论文本情感分析程序;程序实现主要有三个模块,爬虫爬取信息,分词器对信息分词处理,CNN模型进行情感分析。
关键词:情感分析、CNN、爬虫、分词器
Abstract
In recent years, with the continuous improvement of Chinas economic level, the residents consumption ability of cars is getting bigger and bigger, and the ownership of cars in China is also increasing rapidly, so the evaluation texts left by car consumers on various car forums on the Internet are also increasing, and a large number of these comment texts provide us with rich materials for sentiment analysis of texts. How to collect and analyze these data quickly is obviously an urgent problem for both merchants and buyers. This paper is based on solving this problem by creating a text sentiment analysis program for auto industry reviews; the program is implemented in three main modules: crawlers to crawl information, a word splitter to split the information into words, and a CNN model for sentiment analysis.
Keywords: sentiment analysis, CNN, crawler, word splitter
1、研究背景与现状
1.1研究背景
随着互联网不断深入到人们的生活之中,各式各样的网站论坛数不胜数,人们也热衷于在互联网上分享自己的观点,对自己购买过的商品留下评价、对某个热门事件留下自己的看法。同时,近年来,随着我国经济水平的不断提高,居民对汽车的消费能力越来越大,我国汽车的保有量也不断地快速增多,因此汽车消费者在互联网各种汽车论坛上留下的评价文本也越来越多,而大量的这些评论文本为我们进行文本的情感分析提供了丰厚的素材。
同时,汽车行业蓬勃发展,不管是传统汽车的三大件技术还是新能源汽车的电池技术,还有车辆内饰、外观,甚至是人机交互、辅助驾驶等车辆智能技术都在不断地推陈出新中,为此,汽车企业们改变过去一种车型几年一次换代的策略,变成了如今一年一次甚至一年两次的换代升级,以避免车型过时而被消费者们所抛弃。但是,盲目地堆叠车辆的软硬件配置一定会带来车辆成本的上升,而失去原有的目标价位消费群体。所以,汽车企业需要了解所售车型的目标消费群体和他们的用车需求,而如何去探知该群体的需求,我们可以对汽车购买者留下的汽车评价文本进行多标签的情感分析,比如说从空间、动力、操控、油耗、性价比等方面去了解车辆的优点和缺点,进而能够目标明确的对车辆进行合理的升级换代。
文本数据的情感分析一直是自然语言处理领域研究的热门,最近对汽车文本的情感分析也有很多,但同时从动力、空间、操控、外
您可能关注的文档
- 智媒背景下社交客户端的交互设计应用.doc
- 糖尿病因统计分析.docx
- 汽车领域知识图谱的构建.docx
- 2025届河南省周口市扶沟高级中学高考化学全真模拟密押卷含解析.doc
- 陕西省延安中学2025届高考考前模拟化学试题含解析.doc
- 2025届林芝市重点中学高考化学四模试卷含解析.doc
- 云南省云天化中学2025届高考历史考前最后一卷预测卷含解析.doc
- 2025届江西省新余市渝水区第一中学高三下学期联考生物试题含解析.doc
- 江西省信丰中学2025届高考化学倒计时模拟卷含解析.doc
- 贵州省黔东南州天柱二中2025届高三下第一次测试化学试题含解析.doc
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)