24年钉钉杯大数据挑战赛金奖作品A2024070128366.pdfVIP

  • 1
  • 0
  • 约4.15万字
  • 约 41页
  • 2026-07-03 发布于甘肃
  • 举报

24年钉钉杯大数据挑战赛金奖作品A2024070128366.pdf

2024年第三届“钉钉杯”大学生

大数据挑战赛论文

基于多维指标聚类与回归分析的烟草销售特征模型研究

摘要

随着烟草行业的发展,卷烟销售特征分析和精准营销策略的制定成为烟草专卖制度

中的重要研究课题。本文针对烟草产业链中的销售问题,基于数据分析和聚类分析思想,

通过确定月平均销量、月平均金额、月平均单价等六个关键指标,以揭示品牌市场定位

和销售特征为目标建立了聚类分析模型,并使用聚类分析(K-Means)算法和分层聚类

算法对模型进行求解。

在数据分析初期,针对脱敏处理后的烟草销售数据,尽管无异常值或噪声,但我们

发现,月份数据存在缺失。为此,我们采用插值填充方法补齐缺失值,确保数据的连续

性和完整性;随后,进行了数据标准化处理,以消除变量间的量纲差异,降低偏度,确

保数据更接近正态分布,从而提升建模分析的准确性。

针对问题一,对于问题一的第一问,我们首先对进行过数据预处理的某地区多种品

牌烟草的销售数据进行分析,找到了月平均销量、月平均金额、月平均单价、销售占比、

销量的峰度、销量的偏度六个指标,这些指标分别从市场份额、经济贡献、价格策略、

文档评论(0)

1亿VIP精品文档

相关文档