- 1、本文档共170页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第三单元数据处理与安全;知识点;;;1.Pandas模块主要用于数据处理和______,Matplotlib是一个绘图库,_________子库提供的函数可以快速绘图和设置图表的坐标。;2.Pandas提供______和__________两种数据结构,两者的区别见下表所示。;创建;3.Pandas基本属性值
(1)index属性
行索引,默认值是从____开始递增的整数,也可以在创建对象时通过增加一列字符串类型的index属性。
(2)values属性
存放Series对象的一个数组,存放___________对象的二维数据。
(3)columns属性
只针对DataFrame对象,存放各列的____标题。;4.Pandas数据的检索
Pandas可以通过两种方法来检索数据,一是通过三大______(Serise对象只有两大属性)来检索,如df.columns、df.index(一维数据列表),df.values(二维数据列表)。二是通过______记法,Pandas用字典来记录每列的数据,Series对象字典中每个键的值只有一个,键为index属性,值为values属性。DataFrame对象字典中每个键的值有多个,是个列表,键为columns属性,值为每列的数据。;5.Pandas常用函数;sort_values();6.利用Matplotlib模块绘图
(1)Matplotlib是一个绘图库。使用其中的_______子库所提供的函数可以快速绘图和设置图表的坐标轴及刻度、图例等。
(2)导入matplotlib:
importmatplotlib.pyplotasplt。
(3)Matplotlib模块的常用函数;绘制
图形;Series对象只有index和values两列组成,在Series数据集df中,索引为x的值表示为df[x]或df.at[x]。DataFrame对象由1个索引列(index)和多个数据列组成,在DataFrame数据集df中,可以用df[″姓名″]命令来创建″姓名″列,该列索引为x的值表示为df[″姓名″][x](字典法),df.姓名[x](属性法),df.at[x,″姓名″](行列法)。数据筛选的目的是为了找到符合处理条件的数据,往往是数据处理的第1步。通过表达式df[df[″姓名″]==xx]来找出符合条件的所有记录,该数据集是原数据集的子集,字段数量相同,但记录的条数小于原数据集。数据分组(groupby)的目的是以某个列中相同字段值的记录组合在一起,成为分组依据,统计各个分组的数量(count())、和(sum())、平均值(mean())和最值(max()min())等等。数据排序(sort_values)按某列进行升降排序排列,可以显示近排序后的数据,但不会改变原数据的索引值。;【例1】??红收集了部分城市2021年全年每天PM2.5、PM10、CO浓度数据,每天的数据分别保存在以8位日期字符串命名的CSV文件中,部分文件如图a所示,每个文件记录了一天24小时的监测数据,示例如图b所示。;(1)定义pmday函数,功能为:读取某天的CSV文件,返回城市A当天PM2.5的日平均浓度。函数代码如下,划线处应填入的代码为________(单选,填字母)。
A.df[类型]==PM2.5‘ B.df[类型==PM2.5]
C.df[df[类型]]==PM2.5‘ D.df[df[类型]==PM2.5]
importpandasaspd
defpmday(dayfile):
df=pd.read_csv(dayfile)#读取文件dayfile中的数据
df=________
returndf[城市A].mean()#返回城市A
当天PM2.5的日平均浓度;(2)统计城市A各月份PM2.5的月平均浓度并绘制线型图,部分Python程序如下,请在划线处填写合适的代码。
importmatplotlib.pyplotasplt
deftstr(t):
ift10:
retrun0+str(t)
else:
retrunstr(t)
pm=[0]*12
mdays=[31,28,31,30,31,30,31,31,30,31,30,31];#2021年每月天数
forminrange(12):
sm=0
mstr=tstr(m+1)
fordinrange(①________):
dstr=tstr(d+1)
dayfile=2021+mstr+dstr+.csv
sd=pmday(dayfile)
②________
pm[m]=sm/mdays[m]
x=[1,2,3,4,5,6,7,8,9,10,11,12]
y=③_______
您可能关注的文档
- 第3课 中古时期的欧洲 课件--统编版(2019)高中历史必修中外历史纲要下册.pptx
- 第4课 中古时期的亚洲 课件--高一统编版2019必修中外历史纲要下册.pptx
- 第5课 南亚、东亚与美洲的文化(课件) 高二历史课件(选择性必修3:文化交流与传播).pptx
- 第6课 古代人类的迁徙和区域文化的形成(课件)高二历史课件(选择性必修3:文化交流与传播).pptx
- 第6课 古代人类的迁徙和区域文化的形成(课件)高二历史(选择性必修3:文化交流与传播).pptx
- 第7课 全球联系的初步建立与世界格局的演变 课件--高一下学期统编版(2019)必修中外历史纲要下.pptx
- 第7课 全球联系的初步建立与世界格局的演变(课件)高一历史课件(中外历史纲要下).pptx
- 第7课近代殖民活动和人口的跨地域转移(课件)高二历史课件(选择性必修3:文化交流与传播).pptx
- 第8课 现代社会的移民和多元文化(课件) 高二历史课件(选择性必修3:文化交流与传播).pptx
- 第12课 资本主义世界殖民体系的形成(课件)高一中外历史纲要下册(统编版).pptx
最近下载
- 2023-2024学年六年级数学小升初思维拓展培优讲义(通用版)(尖子生培优讲义)差倍问题(知识精讲+拓展培优).docx VIP
- 初中生物教学中探究性学习的有效性教学研究课题报告.docx
- 基于地理信息的变电站选址问题研究.docx VIP
- (唐)李峤《风》教学课件.pptx
- 23S516混凝土排水管道基础及接口图集.pdf VIP
- 2023-2024学年六年级数学小升初思维拓展培优讲义(通用版)(尖子生培优讲义)用假设法解鸡兔同笼(知识精讲+拓展培优).docx VIP
- 施工电梯基础回顶专项方案.doc
- 系统集成合同【荐】.doc VIP
- 2023-2024学年六年级数学小升初思维拓展培优讲义(通用版)(尖子生培优讲义)年龄问题(知识精讲+拓展培优).docx VIP
- 绿化工程消防措施方案.docx VIP
文档评论(0)