Python与机器学习(第2版)(微课版) 课件 2-08-应用拓展:用餐数据复杂分析.pptx

Python与机器学习(第2版)(微课版) 课件 2-08-应用拓展:用餐数据复杂分析.pptx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

项目背景|项目概述|学习目标|任务实施步骤拓展实训用餐数据复杂分析【数据挖掘应用】课程负责人:陈清华01101111011010111101010000101101010100111101

熟练使用Pandas从本地文件读取数据;熟练使用Pandas对数据进行多维度数据分析;熟练使用Matplotlib工具包展现数据分析结果。技能学习目标

项目总体要求原始数据1、分组分析:groupby()2、分布分析:cut()3、交叉分析:pivot_table()、crosstab()4、结构分析:pivot_table()、div()5、相关分析:corr()数据分析方法

一、分组分析xb=df.groupby([sex])[total_bill].mean()xb.plot(kind=bar)importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()基于性别的账单平均金额分组对比分析

二、结构分析re=df.groupby(day)[tip].count()re=re.div(re.sum())re.plot(kind=pie)importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()基于星期几的小费占比分析

三、分布分析importseabornassnsimportmatplotlib.pyplotaspltweek_groups=pd.cut(df[day2],bins=[0,5,7])print(df.groupby(week_groups)[total_bill].count())sns.distplot(df[day2],bins=[0,5,7])importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()工作日与非工作日的账单金额分布分析

四、交叉分析pd.pivot_table(df,index=[day,sex],values=[tip])importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()基于周几和性别的小费交叉分析透视表:pivot_table()

五、相关分析使用散点图查看小费和总账单金额间的相关性fig,ax=plt.subplots()ax.scatter(df[total_bill],df[tip])

五、相关分析使用corr()查看小费和总账单金额间的相关度df[tip].corr(df[total_bill])使用corr()查看小费和周几的相关度df[tip].corr(df[day2])

1.常见的数据分析方法2.Pandas数据分析实现3.常用图表及其用途:Matplotlib可视化还在等什么?马上动手实施用餐数据复杂分析项目吧~小结

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档