- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
45 项目实战:世界杯系列
45.1 第一篇:2018世界杯:用Python分析热门夺冠球队
2018 年,火热的世界杯即将拉开序幕。在比赛开始之前,我们不妨用Python 来对参赛队伍的实力情况进行分析,
并大胆的预测下本届世界杯的夺冠热门球队。
通过数据分析,可以发现很多有趣的结果,比如:
• 找出哪些队伍是首次进入世界杯的黑马队伍
• 找出2018 年32 强中之前已经进入过世界杯,但在世界杯上没有赢得过一场比赛的队伍
当然,我们本次的主要任务是要通过数据分析来预测2018 年世界杯的夺冠热门队伍。
本次分析的数据来源于 Kaggl ,包含从1872 年到今年的数据,包括世界杯比赛、世界杯预选赛、亚洲杯、欧洲
杯、国家之间的友谊赛等比赛,一共大约40000 场比赛的情况。
本次的环境为
• window 7 系统
• python 3.6
• Jupyter Notebook
• pandas version 0.22.0
先来看看数据的情况:
1 import pandas as pd
2 import matplotlib.pyplot as plt
3
4 %matplotlib inlin
5 plt.styl .us (ggplot)
6
7 df = pd.read_csv(results.csv)
8 df.head()
该数据集包含的数据列的信息如下:
• 日期
• 主队名称
• 客队名称
• 主队进球数(不含点球)
• 客队进球数(不含点球)
• 比赛的类型
427
Chapter45. 项目实战:世界杯系列 Python数据之道
• 比赛所在城市
• 比赛所在国家
• 是否中立
结果如下:
45.1.1 获取所有世界杯比赛的数据(不含预选赛)
1 df_FIFA_all = df[df[tournament].str.contains(FIFA, regex=Tru )]
2 df_FIFA = df_FIFA_all[df_FIFA_all[tournament]==FIFA World Cup]
3 df_FIFA.head()
结果如下:
数据做一个初步整理
1 df_FIFA.loc[:,dat ] = pd.to_datetim (df_FIFA.loc[:,dat ])
2 df_FIFA[year] = df_FIFA[dat ].dt.year
3 df_FIFA[diff_scor ] = df_FIFA[home_scor ]-df_FIFA[away_scor ]
4 df_FIFA[win_team ] =
5 df_FIFA[diff_scor ] = pd.to_numeric(df_FIFA[diff_scor ])
创建一个新的列数据,包含获胜队伍的信息
1 # Th first method to get th winners
2
3 df_FIFA.loc[df_FIFA[diff_scor ] 0, win_team ] = df_FIFA.loc[df_FIFA[
diff_scor ] 0, home_team]
4 df_FIFA.loc[df_FIFA[diff_scor ] 0, win_team ] = df_FIFA.loc[df_FIFA[
diff_scor ] 0, away_team]
5 df_FIFA.loc[df_FIFA[diff_scor ]== 0, win_team ] = Draw
6
7 df_FIFA.head()
8
Chapter45. 项目实战:世界杯系列 Python数据之道
9 # Th second method to get th winners
10
11 def find_win_team(df):
12
您可能关注的文档
- Python项目开发实战_制作世界人口地图-JSON格式_练手编程案例实例课程教程.pdf
- Python项目开发实战_Pygame开发2D游戏-外星人_练手完整编程案例实例课程教程.pdf
- Python项目开发实战_生成随机漫步数据_练手编程案例解析实例详解课程教程.pdf
- Python项目开发实战_使用matplotlib绘制简单的折线图_练手编程案例实例课程教程.pdf
- Python项目开发实战_使用Pygal模拟掷骰子_练手编程案例解析实例详解课程教程.pdf
- Python项目开发实战_数据分析UFO长啥样_编程案例解析实例详解课程教程.pdf
- Python项目开发实战_动态演示全球疫情变化趋势_编程案例解析实例详解课程教程.pdf
- Python项目开发实战_读取巴菲特最近的持仓数据_编程案例解析实例详解课程教程.pdf
- Python项目开发实战_分析福布斯全球上市企业_编程案例解析实例详解课程教程.pdf
最近下载
- 2025年医疗器械经营质量管理制度、工作程序文件目录.pdf VIP
- 浅谈小学数学核心素养之运算能力.pdf VIP
- 2023年我国蚕桑产业发展态势与未来发展建议.docx VIP
- 电力变压器声纹检测技术导则.docx VIP
- 调度员考核管理细则梳理.docx VIP
- 《建设工程施工合同》GF2024—0201.docx VIP
- 会计师事务所的执业质量控制制度.pdf VIP
- 2021《森林消防队伍基础设施、装备及制度建设标准》.pdf VIP
- 《水利水电工程单元工程施工质量验收评定标准-地基处理与基础工程》(SL 633-2012).pdf VIP
- (高清版)-B-T 2423.18-2021 环境试验 第2部分:试验方法 试验Kb:盐雾,交变(氯化钠溶液).pdf VIP
文档评论(0)