- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
专题7数据统计与可视化的程序实现
知识点利用Pandas模块进行数据统计
1.小明收集了某超市部分商品2022年上半年每天的价格数据并保存在″data.xlsx″文件中,如图所示。
要分析某商品一个月内的价格稳定情况,需要将本月每天(除第一天外)价格波动的绝对值加起来(价格波动=当天价格-前一天价格),其值越小,价格越稳定。
为统计该超市6月份各商品价格稳定情况,编写如下Python程序。请回答下列问题:
(1)获取6月份各商品的价格,划线处填入的代码为________(多选,填字母)。
A.df[df[″日期″]
B.df[″日期″
C.df[df.日期
D.df[df[″日期″]]importpandasaspd
df=pd.read_excel(″data.xlsx″)
df=______________________
df=df.reset_index(drop=True)#重新设置索引,从0开始递增
(2)绘制6月份价格稳定情况线形图,部分Python程序如下,请在划线处填入合适代码。
importmatplotlib.pyplotasplt
cols=df.columns[1:]#存储各商品名称
n=①________
m=len(cols)
diff=[0]*m
foriinrange(m):
s=0
forjinrange(1,n):
day_diff=abs(df[cols[i]][j]-df[cols[i]][j-1])#计算每天价格波动
s+=day_diff
②________
x,y=cols,diff
plt.③________
plt.show()
2.小明收集了梅西2005年至2023年国家队比赛数据,保存在“梅西国家队详细比赛数据.xlsx”文件中,部分数据如图a所示,现利用Pandas模块处理数据。
为统计分析梅西2019~2023年各项赛事的平均进球情况,编写Python程序。请回答下列问题:
(1)读取“梅西国家队详细比赛数据.xlsx”数据,筛选出2019年以来的各项比赛数据。函数代码如下,划线处应填入的代码为________(单选,填字母)。
A.df[df[″年份″]=2019]B.df[″年份″]=2019
C.df[″年份″=2019] D.df[df[″年份″]]=2019
importpandasaspd
importmatplotlib.pyplotasplt
df=pd.read_excel(″梅西国家队详细比赛数据.xlsx″)#读取表格数据
df1=________
(2)统计各项赛事的平均进球数量。由于原始数据“赛事”列中部分赛事未显示年份(如图a所示),无法进行跨年度统计,因此需要在赛事名前添加年份信息。例如:“国际友谊赛”根据年份修改为“2019国际友谊赛”,“2022世界杯预选赛”则不修改。具体过程代码如下,请补充完整。
foriindf1.index:
ss=df1.at[i,″赛事″]#根据行标签、列标签选取单个值,如“国际友谊赛”
______________
ifnot(nf.isdigit()):#isdigit()判断是否为数字,是则返回True
df1.at[i,″赛事″]=str(df1.at[i,″年份″])+df1.at[i,″赛事″]
g=df1.groupby(″赛事″,as_index=False).mean()#以“赛事”为关键字,分组求平均
(3)为统计2019年以来,梅西进球平均数排名前三的赛事,考虑可能存在并列情况,具体过程代码如下,请补充完整。
g=g.sort_values(″进球″,ascending=False)#以“进球”为关键字,降序排序
g1=g.head(3)#取前三项记录
m=g1[″进球″].min()#求最小值
bls=0
bl=len(g1[g1[″进球″]==m])#求序列长度
foriing.index:
ifg.at[i,″进球″]==m:#根据行标签、列标签选取单个值
________
g2=g.head(3+bls-bl)
(4)以下是2019~2023年梅西国家队比赛平均进球数排名前三赛事统计图,则划线处的代码应为
plt.title(″2019~2023梅西国家队比赛平均进球数排名前三赛事统计图″)
x=g2[″赛事″]
y=________
plt.bar(x,y)
plt.show()
3.小明收集了2022年全国各省份人均消费支出相关数据,部分数据如图a所示,为了统计分析处理各城市消费
您可能关注的文档
- 第3章设计与制作三维创意作品3.2三维创意作品赏析-高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.3规划设计三维动画 -高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.4构建三维动画模型 -高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.5设计三维动画模型的外观 -高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.6三维动画实现和作品发布-高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.1数据处理的一般过程 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.2数据采集与整理 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.3数据分析与可视化 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.4数据分析报告与应用 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据管理3.1数据库与数据管理 -高中教学同步《信息技术数据管理与分析》(教案)(人教-中图版2019).docx
- 2025届信息技术一轮复习练习:专题8 人工智能和信息安全与保护(含答案).docx
- 2025届信息技术一轮复习练习:专题9 计算机网络系统(含答案).docx
- 2025届信息技术一轮复习练习:专题10 信息系统搭建(含答案).docx
- 2025届信息技术一轮复习练习:专题11 数组(含答案).docx
- 2025届信息技术一轮复习练习:专题12 链表(含答案).docx
- 2025届信息技术一轮复习练习:专题13 队列(含答案).docx
- 2025届信息技术一轮复习练习:专题14 栈(含答案).docx
- 2025届信息技术一轮复习练习:专题15 树(含答案).docx
- 2025届信息技术一轮复习练习:专题16 算法思想(含答案).docx
- 2025届信息技术一轮复习练习:专题17 排序算法(含答案).docx
最近下载
- (一模)2026届大湾区普通高中毕业年级联合模拟考试(一)数学试卷(含答案).pdf
- 延世韩国语单词第一册.pdf VIP
- 张佩兰溶栓讲稿课件.ppt
- 实验室生物安全程序文件.docx VIP
- 子公司治理制度.docx VIP
- 北师大版小学数学二年级上册第七单元《分一分与除法》大单元教学方案.docx VIP
- 2025出生医学证明管理培训.pptx VIP
- 2025年甘肃省定西市安定区称钩驿镇选聘村干部笔试备考题库及答案解析.docx VIP
- 2025广东惠州市龙门县平陵街道招聘村“两委”干部储备人选16人考试参考题库及答案解析.docx VIP
- GB50345-2012 屋面工程技术规范.pdf VIP
原创力文档


文档评论(0)