《大数据技术应用基础》课件——6.8综合案例.pptxVIP

《大数据技术应用基础》课件——6.8综合案例.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

.05综合案例

5.1综合案例1讯诺商贸有限公司为了扩大销售,让公司获得更多的收益,现从产品的受欢迎程度及城市的销售额情况进行分析比较,从而得出结论,对公司的战略方向进行调整。实验要求1.导入pandas包;2.读取销售数据4.xlsx为变量df;3.列子集筛选,筛选要用的列【城市、产品名称、销售额、销售数量】;4.字段分割,产品名称包含的信息较多,逗号前是英文和中文名称,逗号后是一些补充信息,我们试用split把它分隔开,因为分割出来时两个字段。【产品名称】列拆分成【产品】、【标记】列;5.分析哪些产品比较畅销?首先将数据按照产品进行分组,然后对分组后的销售数量进行求和;对分组后的销售数量排序;最后取出销售数量排行前6;6.分析哪些个城市销售比较高?首先将数据按照城市进行分组,然后对分组后的销售额进行求和;对分组后的销售额排序;最后取出销售额排行前6。

5.1综合案例11.importpandasaspd2.df=pd.read_excel(excel/SD财务数据分析案例集/销售数据4.xlsx)#读取数据源df

5.1综合案例13.df=df[[城市,产品名称,销售额,销售数量]]df

5.1综合案例14.df[[产品,标记]]=df[产品名称].str.split(,).apply(pd.Series,1)df

5.1综合案例15.product_total=df.groupby([产品])[销售数量].sum().reset_index()#根据产品分组,销售数量求和,再索引重置product_total=product_total.sort_values(by=销售数量,ascending=False)#销售数量按降序排序product_total=product_total.head(6)#显示前6行数据head()product_total

5.1综合案例16.city_sale_total=df.groupby([城市])[销售额].sum().reset_index()#根据城市分组,销售额求和,再索引重置city_sale_total=city_sale_total.sort_values(by=销售额,ascending=False)#根据销售额降序排序city_sale_total=city_sale_total.head(6)#显示前6行city_sale_total

5.2综合案例2伊曼商贸有限公司为了统计各规模专卖店每月的销售成本额,对‘专卖店新店计划表’和各规模专卖店成本模型这两张表进行处理、匹配,并生成柱状图,从而更好的进行成本预算。实验要求1.导入包2.从成本数据.xlsx里读取‘专卖店新店计划表’数据源为变量df3.从成本数据.xlsx里读取各规模专卖店成本模型数据源,需要将第1行店规模及第二行店址评级作为header,做为变量df1;要求新增一行【月销售成本】数据即各列数据相加。4.添加月销售成本行,要求【月销售成本】数据即各列数据相加。5.去除其他费用行,保留月销售成本行6.整理表单,去除多余的列

5.2综合案例21.importnumpyasnpimportpandasaspdfromdatetimeimportdatetime2.df=pd.read_excel(excel/SD财务数据分析案例集/成本数据.xlsx,sheet_name=专卖店新店计划表)#读取df.dropna(axis=1,how=all,inplace=True)#删除全是空值的列#提取开业时间中的月份df[月]=pd.to_datetime(df[开业时间]).dt.monthdf

5.2综合案例23.df1=pd.read_excel(excel/SD财务数据分析案例集/成本数据.xlsx,header=[0,1],sheet_name=各规模专卖店成本模型)#读取df1.dropna(axis=1,how=all,inplace=True)#删除全是空值的列df1

5.2综合案例24.total=df1.sum(numeric_only=True)#df1整表求和,numeric_only=True仅仅计算数字型的columnstotal[(店规模,店址评级)]=月销售成本df1=df1.append(total,ignore_index=True)#在df1末尾添加‘月销售成本’,ignore_index避免出现相同的indexdf1

5.2综合案例25.#筛选出除月销售成本的所有行del_index=df1[df1[(店规

文档评论(0)

青柠职教 + 关注
实名认证
服务提供商

从业10年,专注职业教育专业建设,实训室建设等。

1亿VIP精品文档

相关文档