基于文本数据的汽车造型需求分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于文本数据的汽车造型需求分析

摘要:近年来互联网的快速发展,汽车业已在网络上建立起了自己的“生态圈”,社交媒体逐渐成熟,传统的人工挖掘汽车评论的方式显得效率低下。本文运用网络信息搜集技术对用户评论的文本数据进行搜集,并基于此对消费者汽车造型需求展开分析,有效地弥补传统方法的缺陷,获得评价的潜在价值和情绪信息,提炼出汽车需求的关键要素,并据此提供给企业相关建议,同时也让消费者对车主使用满意程度有所了解,为新消费者购买汽车提供依据。

关键词:汽车用户需求造型车企

随着国家经济的发展,人民的生活品质和水平的提高和购买力的增强,汽车的销量飞增。国家统计局数据显示,汽车制造业生产较2021年同比增长5.5%[1],虽然汽车行业发展迅速,但考虑长远发展仍需推动国内汽车行业深层次发展,本文介绍的文本数据法依托消费者的评价进行分析,促进更高效的产品生产,帮助企业占据市场有利地位。

数字化用户画像是指借助大数据来提取用户的相应特征、需求、偏好等内容并建模分析。[2]随着社交媒体如微博、论坛等逐渐成熟,能够最直观反映用户体验的各种评价不断更新,传统的人工挖掘方式也变得更加困难、效率低下,并且用户评论中含有大量零碎且多样的情感词汇,难以分析。,本文对国内学者季曹婷等人提出的融合多特征TFIDF文本分析的汽车造型需求提取方法和余本功等人提出的在解决问答社区关键词提取问题的想法进行融合,提出了新的方法[3],具体流程见图1。

虽然现如今国内对于该方面的研究较少,但不难看出将大数据用户画像与汽车造型相融合能够使汽车行业在未来更加繁荣。

2研究方法

此次研究采用了内容分析法[4]。主要通过对特定文本中单词和词组的频率计数进行,将定性的文本数据转化为定量的频数。这种方法真实、客观、全面地反映文本内容的本来意义,具有一定的深度。内容分析法经过选择、分类、统计等三个阶段,以爬取搜集的网络评论文本为分析内容,对数据进行预处理,评论进行分句,删减无关、重复评论,得到筛选清理的评论。再对其进行词语提取,将描述性词语及情感词提取出来,经过统计、排序后,绘制得到高频词汇表,依据高频词汇表解读、判断和挖掘信息中所蕴含的本质内容。

3数据来源及处理

本文所使用的数据皆为由数据爬取的方法在懂车帝上搜集得到。消费者可以通过问答、车友圈、社区反馈、用户点评等多种方式在懂车帝上对所购汽车的使用体验进行反馈分享。懂车帝累计用户超过2.4亿,提供全国各地真实车主口碑评价,使得可收集的数据质量好、有普遍性、有代表性,利于分析出准确的结果。

根据汽车流通协会提供的数据显示,近年来轩逸、朗逸、卡罗拉、哈弗H6、ModelY等五个品牌的汽车一直在全国汽车销量前几名之列。确定要分析的汽车品牌后,选择这五个品牌最近几年推出的新款汽车,确保分析结果的时效性,从而保证提供给企业的建议真实有效。故最终确定分析轩逸2022年款、朗逸2019年款、朗逸2022年款、卡罗拉2021年款、哈弗H62021年款、ModelY2022年款六种车型。

本次该项目共搜集了1205条评论,其中轩逸2022年款占243条,朗逸2019年款占90条,朗逸2022年款占69条,卡罗拉2021年款占248条,哈弗H62021年款占405条,ModelY2022年款占150条。根据所得评论,首先进行数据预处理,对评论进行分句,删除无用评论、重复评论;再筛选排序得到评论中的高频词,制作高频词表格,根据高频词对六种车型做认知形象分析、情感形象分析及整体感知形象分析,进一步分析解读每款车型各自的优缺点,综合分析后提出对车企的建议及展望。

4汽车造型文本数据分析

以轩逸2022年款、朗逸2019年款、朗逸2022年款、卡罗拉2021年款、哈弗H62021年款、Model六种车型为例。

4.1六款车型造型认知形象分析

4.1.1外观方面

使用ROST-CM6软件对获取的六款车型造型点评文本进行词频分析,过滤无意义词汇后,获取有效词频排名前30的词汇(表2)。表格分析得出多数车主对该六款车型的好评程度较高。但是对于高频词第一位“车漆薄”的评价,车企应高度重视,可以考虑适当加厚车漆,使汽车具有更好的防锈、防腐蚀能力。

高频词汇表中,大气、满意、好看等高频词体现了车主对该汽车的外观是充分肯定。对于一般、中规中矩等中肯评价,丑、不好看等个别差评,车企要认真对待,针对其反馈做出改进,发挥外观好看的优势,吸引更多顾客。车身、前脸、轮毂等高频词体现了车主对汽车外观的评价,车企可以通过其反馈了解自身优势,扬长,也要在现有基础上补短,不同的车主对车的感受不一样,审美无法达到完全统一。所以车企需要紧跟时代潮流,潮流也是消费者审美基本统一的部分。

4.1.2内饰方面

ROST-CM6软件对获取的六款车型造型点评文本进行词频分析,

文档评论(0)

ZC强 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档