- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
python商品销售情况数据分析_⽤python分析⼩红书销售情况
⼀、分析 ⽬的
本⽂将通过对⼩红书销售表3万余条数据的分析,找 影响销售额的因素。
⼆、理解数据
先看下数据集字段基本信息
import pandas as pd
import numpy as np
#导⼊数据
rdDf=pd.read_csv (redbook.csv)
rdDf.info()gender\age\engaged_last_30存在缺失值,占⽐40%,缺失值过多不能直接删除
三、数据预处理
缺失值处理
#数值型缺失值处理
#⽤age的均值填充缺失值
rdDf [age]=rdDf [age].fillna(rdDf.age.mean())
#类别型缺失值处理
#⽤unknown填充性别及活动
rdDf [gender]=rdDf [gender].fillna(0)
rdDf [engaged_last_30]=rdDf [engaged_last_30].fillna(unknown)
四、数据分析与可视化
分析⽅法 :采⽤多维度拆解法,群组分析法,对⽐分析法
1、单⼀变量分析单笔销售额主要分布在 1000以内,在500以下更为集中,平均值消费⾦额是334。
有将近七成的⽤户是两年以上的⽼⽤户,说明⼩红书的app的留存情况较好。
只有近4%的⽤户30内参加了重要活动,说明这次活动转化效果并不好。
最后⼀次下单时间⾄今的天数差平均值是7天,⼤部分⽤户20内都有消费,说明⽤户消费频次⾼。
⽤户累计消费平均⾦额约为2379元,⼤部分⽤户累计消费⾦额都在5000以内。
绝⼤多数⽤户都是在⼩红书⾃营上购买的商品,说明⽤户忠诚度⾼,且⼩红书上可供选择的商品种类丰富。
2,多变量分析⼩红书男性⽤户占⽐略⾼于⼥性,且男性单次消费⾦额和累计消费⾦额都超过⼥性。
⼩红书⽤户的年龄⼤部分集中在24-30岁之间,18岁的⽤户单次消费⾦额较⾼,18-24岁的⽤户累计消费⾦额较⾼,说明18岁以下的⽤户
喜欢追求⾼价格产品,但是持续消费能⼒略差,18-24岁的⽤户累计消费⾦额⾼,说明⼀直在持续购买,这也符合⼩红书主打的⾯向年轻⼥
性的⼝号。
两年及其以上的⽼⽤户 ,平均消费⾦额⽐较⾼。
30天之内有参加活动的⽤户平均消费⾦额都⽐较⾼。
在⼩红书⾃营上购买商品的⽤户平均消费⾦额都⾼。
五、结论与建议
1,⽤户⼩红书⾃营平台上的平均消费额度较⾼,且⽤户喜欢在该平台购买,建议丰富⾃营平台上的商品种类,增加畅销商品数量,为⽤户
提供量⼤价优丰富的商品。
2,30之内参加活动的⽤户消费⾦额都挺⾼,说明策划活动确实可以提⾼收益,但是参加活动的⽤户太少,仅仅只有4%。建议策划内容丰
富有趣的活动,如平均转发抽奖等,加强活动运营,积极推⼴活动,⼒求吸引⼤量⽤户的参与。
3,⼩红书⽼⽤户两年以上忠诚度⾼,但是平均消费低,建议针对⽼⽤户提供专场优惠,提⾼⽼⽤户消费⾦额。
4,⼩红书学⽣⽤户消费能⼒强,但是持续度不够,建议针对这部分⼈群增⼤营销开展对应的打折活动。
5,男性消费⾦额多于⼥性,建议对男性对于细分标签,精准营销。
可视化代码如下
#单变量可视化
fig1 = plt.figure(facecolor=white,figsize=(16,10))
ax 1=plt.subplot(2,3,1)
plt.hist(rdDf 1[revenue],bins=80,normed=0, edgecolor=white)
plt.title(销售额分布)
ax2=plt.subplot(2,3,2)
plt.pie(rdDf [lifecycle].value_counts(),labels=[A,B,C],autopct=%.1f%%,startangle=0)
plt.axis(equal)
plt.title(⽤户⽣命周期占⽐)
ax3=plt.subplot(2,3,3)
plt.pie(rdDf [engaged_last_30].value_counts(),labels=[0.0,unknown,1.0],autopct=%.1f%%,startangle=0)
plt.axis(equal)
plt.title(近三⼗天内参加活动占⽐)
ax4=plt.subplot(2,3,4)
plt.hist(rdDf [days_since_last_order],bins=50,normed=0,e
您可能关注的文档
- python信用卡违约预测分析-Python数据分析及可视化实例之银行信用卡违约预测(24)....pdf
- python信用卡违约预测分析-Python机器学习实战:信用卡欺诈检测.pdf
- python共享单车数据分析-共享单车数据可视化分析(PythonSeaborn).pdf
- python关联分析如何可视化-Python共享单车数据可视化分析.pdf
- python写股票指标-用Python做股票指标RSI分析.pdf
- python函数可视化心得-最近关于数据可视化方面交流的心得感悟.pdf
- Python分析csv文件及可视化绘图.pdf
- python分析两组数据的差异-3步搞懂Python数据分析关键点.pdf
- python分析两组数据的差异-十分钟搞懂“Python数据分析”.pdf
- python分析数据的变化趋势及前景-Python数据分析三板斧.pdf
最近下载
- 低压配电柜、配电箱《技术标准》.docx VIP
- 2021年厦门大学嘉庚学院软件工程专业《计算机组成原理》科目期末试卷B(有答案).pdf VIP
- 降低骨科患者的便秘发生率品管圈qcc.ppt VIP
- 5000字计算机毕业论文3篇-计算机毕业论文6000字.docx
- 《收益法评估房地产的案例报告》1800字.docx VIP
- 山东省青岛市胶州市2023-2024学年八年级上学期期末考试数学试卷(含解析).docx VIP
- NB╱T 10395-2020 水电工程劳动安全与工业卫生后评价规程.pdf VIP
- 2025年地理生物会考复习资料八年级下册 .pdf VIP
- 门窗工程施工组织设计方案与方案.docx VIP
- 19世纪欧洲服装.pptx VIP
文档评论(0)