基于大数据技术的高端零食竞品分析.docx

基于大数据技术的高端零食竞品分析.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于大数据技术的高端零食竞品分析

?

?

仲崇丽王岩昌张西

摘要:随着高端零食行业的渐趋成熟,陆续出现了诸如BCW、SZSS、LPPZ等这样的品牌,而这些品牌也占据了高端零食行业的大部分市场占有率。那么,作为竞争对手,SZSS和其他两个品牌相比,究竟有何优势,又有何弊端呢?该文利用数据获取技术从某电商网站抓取了上千条商品信息,试图分析一下该品牌与竞争对手之间的差别,为其生产及商业营销提供参考建议。

关键词:竞品分析;高端零食;大数据技术

:TP311????:A

:1009-3044(2021)10-0043-03

1引言

所谓高端零食,就是当前零食商品行业对各类零食进行高端生产处理。例如,坚果、猪肉脯、牛肉干等价格相对较贵的食品。相关品牌也有很多,例如,SZSS、LPPZ、BCW等。高端零食备受消费者的喜爱,在发达城市基本上遍布每个家庭,市场销售额在五年之间也是飞速上升。面对高端零食行业的发展是社会进步的结果,也是经济社会的直接肯定。

如图1所示,从2014年到2019年其高端零食的销售交易额一直呈上升趨势,这也预示了在未来市场发展过程中高端零食行业会有自己的一席之地。那么,面对激烈的竞争,SZSS品牌如果想占据自己的一席之地不被替代,需要从生产策略和营销策略入手进行优化。本文我们从某电商平台获取了上千条数据,试图分析一下该品牌与竞争对手之间的差异化,为其日后的生产计划及商业营销策略提供参考建议。

2数据的获取及整理

2.1数据的获取

本文利用八爪鱼软件进行数据获取,数据采集时间为2020年6月,数据来源自某知名电商网站上的商品详情页信息,获取的主要字段为价格及商品的各项参数等。主要的采集过程如图2所示:

在此流程中,需要重点注意的有如下几点:

(1)“打开网页”这一步骤,需要进行高级设置,将网页“下拉加载到底部”。因为默认情况下,网页较长,一次性不会加载完毕。

(2)“点击翻页”和“点击元素”这两个步骤,需要进行“AJAX点击”设置,加载时间设置为2秒。如果按默认设置进行的话,等待时间会非常漫长。

(3)“提取数据”这一步骤,需要进行“正则表达式”的设置。因为默认情况下,八爪鱼是按照文字位置来爬取数据,由于每个商家添加的商品参数各有不同,且商品参数在网页上显示的位置也各有不同,所以,需要限制八爪鱼软件按照文字内容来进行获取,即正则表达式的应用,可以避免数据内容窜列的现象。

2.2数据的清洗及整理

所谓数据清洗就是将脏数据清洗掉,提高数据质量,即:检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,去除空白数据域和知识背景下的白噪声。直白地说,数据清洗的结果就是对各种数据进行合适的处理后,得到标准的、干净的、连续的数据,提供给数据统计、数据挖掘等使用。在整个数据分析的流程中,数据清洗及整理这个步骤会占据数据分析师们一多半的时间。那么,在对数据进行清洗及整理的时候,我们需要遵循“四性”原则,即:完整性、唯一性、合法性、一致性。所谓完整性,就是指某列数据有无缺失值。通常,拿到一个新数据后,我们第一眼查看的就是这众多的单元格是否填充完整。对于那些缺失太多而又无法填充的,只能将这个字段整个删除,转而从其他字段寻找影响分析结果的因素。所谓唯一性,是指不能有完全相同的两条记录,即如果某两行记录内容完全一致,我们即可认为其中一条为重复项,需要进行删除重复项的操作。所谓合法性,是指某个字段的取值范围是否在合理的区间内。所谓一致性,是指同一个字段的字段值类型和量纲相同。

数据清洗最重要的任务就是删除重复项、处理缺失值、分离组合列、处理非法数据。数据清洗完成后,我们相当于得到了一个干净整齐的数据集,就像是洗干净摘好了的青菜一样。那么接下来,就是将清洗好的数据做相应的处理,以方便后续的数据分析工作。常规的数据整理方法有:特殊字符处理、统一单位、数据离散化、自定义分组、数据类型的转换。

对于本文所获取的数据,我们进行了如下几方面的处理:

(1)商品标题:利用自定义分组功能提取出“品牌”;

(2)价格:将原始的文本型转换为数值型;

(3)评价量:将以“万”为单位的数据,均统一为“个”;

(4)商品毛重:将以“kg”为单位的数据,均统一为“g”,并且将数据进行离散化,分成四个区间段;

(5)包装:利用自定义分组功能,将该属性合并为“袋装、罐装、盒装、散装、整箱装、组合装、其他”7个类别;

(6)口味:利用自定义分组功能,将该属性合并为“混合味、辣味、烧烤味、五香味、原味、其他”6个类别。

整理后的数据详情如表1所示。

3竞品分析

3.1价格对比分析

如图3所示,三个品牌零食价格均值差别不大,基本都处于50元以下,100元以上商品普遍较少,大于250元的商品更为罕见。相比之下,LPPZ的低价商品数量更多一些。由

文档评论(0)

胡珍 + 关注
实名认证
内容提供者

90后

1亿VIP精品文档

相关文档