- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目背景|项目概述|学习目标|任务实施步骤拓展实训用餐数据复杂分析【数据挖掘应用】课程负责人:陈清华01101111011010111101010000101101010100111101
熟练使用Pandas从本地文件读取数据;熟练使用Pandas对数据进行多维度数据分析;熟练使用Matplotlib工具包展现数据分析结果。技能学习目标
项目总体要求原始数据1、分组分析:groupby()2、分布分析:cut()3、交叉分析:pivot_table()、crosstab()4、结构分析:pivot_table()、div()5、相关分析:corr()数据分析方法
一、分组分析xb=df.groupby([sex])[total_bill].mean()xb.plot(kind=bar)importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()基于性别的账单平均金额分组对比分析
二、结构分析re=df.groupby(day)[tip].count()re=re.div(re.sum())re.plot(kind=pie)importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()基于星期几的小费占比分析
三、分布分析importseabornassnsimportmatplotlib.pyplotaspltweek_groups=pd.cut(df[day2],bins=[0,5,7])print(df.groupby(week_groups)[total_bill].count())sns.distplot(df[day2],bins=[0,5,7])importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()工作日与非工作日的账单金额分布分析
四、交叉分析pd.pivot_table(df,index=[day,sex],values=[tip])importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_csv(tips.csv,index_col=0)df=df.fillna(0)df.head()基于周几和性别的小费交叉分析透视表:pivot_table()
五、相关分析使用散点图查看小费和总账单金额间的相关性fig,ax=plt.subplots()ax.scatter(df[total_bill],df[tip])
五、相关分析使用corr()查看小费和总账单金额间的相关度df[tip].corr(df[total_bill])使用corr()查看小费和周几的相关度df[tip].corr(df[day2])
1.常见的数据分析方法2.Pandas数据分析实现3.常用图表及其用途:Matplotlib可视化还在等什么?马上动手实施用餐数据复杂分析项目吧~小结
您可能关注的文档
- Python与机器学习(第2版)(微课版) 课件 01-04-缺失值处理任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 01-05-异常值处理任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 01-06-拓展实训:电影数据加工与处理.pptx
- Python与机器学习(第2版)(微课版) 课件 1-02-数据集成任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-01-碳排放数据异常分析项目概述.pptx
- Python与机器学习(第2版)(微课版) 课件 2-03-分布分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-03-分组分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-04-交叉分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-06-相关分析任务实施.pptx
文档评论(0)