2025届信息技术一轮复习讲义:专题7 数据统计与可视化的程序实现.docxVIP

2025届信息技术一轮复习讲义:专题7 数据统计与可视化的程序实现.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

专题7数据统计与可视化的程序实现

学业要求

知识点

学业水平等级

1.能根据实际要求,对表格数据进行简单整理、计算和可视化呈现

1

2.能采用合适的方法分析数据和可视化呈现数据,并能从中提取有用信息,形成结论

2

3.会使用Python进行简单的数据处理,并能从中提取有用信息形成结论

2

知识点利用Pandas模块进行数据统计

【知识梳理】

1.Pandas模块主要用于数据处理和________,Matplotlib是一个绘图库,________子库提供的函数可以快速绘图和设置图表的坐标。

2.Pandas提供________和________两种数据结构,两者的区别见下表所示。

数据结构

Series

DataFrame

维度

一维

________维

组成

包含一个数组的数据和一个与数据关联的索引,索引值默认是从________起递增的整数

由1个索引列(index)和若干个数据列组成,每个数据列可以是不同的________

创建

列表、字典等可以用来创建Series数据结构;与列表不同的是:Series的索引可以指定,类型可以为________

通常用一个________的列表或字典来创建;或直接读取二维数据文件创建

联系

①DataFrame可以看作是共享同一个________的Series的集合

②DataFrame对象和Series对象均可以通过________或________来检索,还可以用at函数赋值和修改

3.Pandas基本属性值

(1)index属性

行索引,默认值是从________开始递增的整数,也可以在创建对象时通过增加一列字符串类型的index属性。

(2)values属性

存放Series对象的一个数组,存放________对象的二维数据。

(3)columns属性

只针对DataFrame对象,存放各列的________标题。

4.Pandas数据的检索

Pandas可以通过两种方法来检索数据,一是通过三大________(Serise对象只有两大属性)来检索,如df.columns、df.index(一维数据列表),df.values(二维数据列表)。二是通过________记法,Pandas用字典来记录每列的数据,Series对象字典中每个键的值只有一个,键为index属性,值为values属性。DataFrame对象字典中每个键的值有多个,是个列表,键为columns属性,值为每列的数据。

5.Pandas常用函数

函数

说明

count()

返回非空(NaN)数据项的________

sum()、mean()

求和、________,通过axis=0/1确定行列

max()、min()

返回最大、最小值

head()、tail()

返回DataFrame的前n个、后n个数据记录

groupby()

对各列或各行中的数据进行________,然后可对其中每一组数据进行不同的操作

sort_values()

________,通过axis=0/1确定行列,axis默认值为0,________排序。ascending=True/False确定升/降序,ascending默认值为True,________排序。排序结果返回一个新DataFrame对象

drop()

________,通过axis=0/1确定行列,并返回另一个DataFrame对象来存放改变后的数据

6.利用Matplotlib模块绘图

(1)Matplotlib是一个绘图库。使用其中的________子库所提供的函数可以快速绘图和设置图表的坐标轴及刻度、图例等。

(2)导入matplotlib:

importmatplotlib.pyplotasplt。

(3)Matplotlib模块的常用函数

分类

函数

说明

创建

对象

figure()

创建一个新的图表对象,并设置为当前绘图对象

注:不创建figure对象,直接调用plot等绘图函数进行绘图,matplotlib会自动创建一个figure对象

绘制

图形

________

绘制线形图

bar()

绘制垂直柱形图

barh()

绘制水平柱形图

scatter()

绘制散点图

修饰

美化

________

设置图表的标题

xlim()ylim()

设置X、Y轴的取值范围

xlabel()ylabel()

设置X、Y轴的标签

legend()

显示图例

显示

show()

显示创建的所有绘图对象

【经典案例】

Series对象只有index和values两列组成,在Series数据集df中,索引为x的值表示为df[x]或df.at[x]。DataFrame对象由1个索引列(index)和多个数据列组成,在DataFrame数据集df中,可以用df[″姓名″

您可能关注的文档

文档评论(0)

中小学教学资料 + 关注
实名认证
服务提供商

提供小学、初中、高中信息科技教案、试卷、课件等优质教学资源

1亿VIP精品文档

相关文档