高考信息技术专题7 数据统计与可视化的程序实现.pptx

高考信息技术专题7 数据统计与可视化的程序实现.pptx

  1. 1、本文档共170页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第三单元数据处理与安全;知识点;;;1.Pandas模块主要用于数据处理和______,Matplotlib是一个绘图库,_________子库提供的函数可以快速绘图和设置图表的坐标。;2.Pandas提供______和__________两种数据结构,两者的区别见下表所示。;创建;3.Pandas基本属性值

(1)index属性

行索引,默认值是从____开始递增的整数,也可以在创建对象时通过增加一列字符串类型的index属性。

(2)values属性

存放Series对象的一个数组,存放___________对象的二维数据。

(3)columns属性

只针对DataFrame对象,存放各列的____标题。;4.Pandas数据的检索

Pandas可以通过两种方法来检索数据,一是通过三大______(Serise对象只有两大属性)来检索,如df.columns、df.index(一维数据列表),df.values(二维数据列表)。二是通过______记法,Pandas用字典来记录每列的数据,Series对象字典中每个键的值只有一个,键为index属性,值为values属性。DataFrame对象字典中每个键的值有多个,是个列表,键为columns属性,值为每列的数据。;5.Pandas常用函数;sort_values();6.利用Matplotlib模块绘图

(1)Matplotlib是一个绘图库。使用其中的_______子库所提供的函数可以快速绘图和设置图表的坐标轴及刻度、图例等。

(2)导入matplotlib:

importmatplotlib.pyplotasplt。

(3)Matplotlib模块的常用函数;绘制

图形;Series对象只有index和values两列组成,在Series数据集df中,索引为x的值表示为df[x]或df.at[x]。DataFrame对象由1个索引列(index)和多个数据列组成,在DataFrame数据集df中,可以用df[″姓名″]命令来创建″姓名″列,该列索引为x的值表示为df[″姓名″][x](字典法),df.姓名[x](属性法),df.at[x,″姓名″](行列法)。数据筛选的目的是为了找到符合处理条件的数据,往往是数据处理的第1步。通过表达式df[df[″姓名″]==xx]来找出符合条件的所有记录,该数据集是原数据集的子集,字段数量相同,但记录的条数小于原数据集。数据分组(groupby)的目的是以某个列中相同字段值的记录组合在一起,成为分组依据,统计各个分组的数量(count())、和(sum())、平均值(mean())和最值(max()min())等等。数据排序(sort_values)按某列进行升降排序排列,可以显示近排序后的数据,但不会改变原数据的索引值。;【例1】??红收集了部分城市2021年全年每天PM2.5、PM10、CO浓度数据,每天的数据分别保存在以8位日期字符串命名的CSV文件中,部分文件如图a所示,每个文件记录了一天24小时的监测数据,示例如图b所示。;(1)定义pmday函数,功能为:读取某天的CSV文件,返回城市A当天PM2.5的日平均浓度。函数代码如下,划线处应填入的代码为________(单选,填字母)。

A.df[类型]==PM2.5‘ B.df[类型==PM2.5]

C.df[df[类型]]==PM2.5‘ D.df[df[类型]==PM2.5]

importpandasaspd

defpmday(dayfile):

df=pd.read_csv(dayfile)#读取文件dayfile中的数据

df=________

returndf[城市A].mean()#返回城市A

当天PM2.5的日平均浓度;(2)统计城市A各月份PM2.5的月平均浓度并绘制线型图,部分Python程序如下,请在划线处填写合适的代码。

importmatplotlib.pyplotasplt

deftstr(t):

ift10:

retrun0+str(t)

else:

retrunstr(t)

pm=[0]*12

mdays=[31,28,31,30,31,30,31,31,30,31,30,31];#2021年每月天数

forminrange(12):

sm=0

mstr=tstr(m+1)

fordinrange(①________):

dstr=tstr(d+1)

dayfile=2021+mstr+dstr+.csv

sd=pmday(dayfile)

②________

pm[m]=sm/mdays[m]

x=[1,2,3,4,5,6,7,8,9,10,11,12]

y=③_______

您可能关注的文档

文档评论(0)

k12学习资料 + 关注
实名认证
内容提供者

教师资格证持证人

k12学习资料

领域认证该用户于2023年06月02日上传了教师资格证

1亿VIP精品文档

相关文档