- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
专题7数据统计与可视化的程序实现
学业要求
知识点
学业水平等级
1.能根据实际要求,对表格数据进行简单整理、计算和可视化呈现
1
2.能采用合适的方法分析数据和可视化呈现数据,并能从中提取有用信息,形成结论
2
3.会使用Python进行简单的数据处理,并能从中提取有用信息形成结论
2
知识点利用Pandas模块进行数据统计
【知识梳理】
1.Pandas模块主要用于数据处理和________,Matplotlib是一个绘图库,________子库提供的函数可以快速绘图和设置图表的坐标。
2.Pandas提供________和________两种数据结构,两者的区别见下表所示。
数据结构
Series
DataFrame
维度
一维
________维
组成
包含一个数组的数据和一个与数据关联的索引,索引值默认是从________起递增的整数
由1个索引列(index)和若干个数据列组成,每个数据列可以是不同的________
创建
列表、字典等可以用来创建Series数据结构;与列表不同的是:Series的索引可以指定,类型可以为________
通常用一个________的列表或字典来创建;或直接读取二维数据文件创建
联系
①DataFrame可以看作是共享同一个________的Series的集合
②DataFrame对象和Series对象均可以通过________或________来检索,还可以用at函数赋值和修改
3.Pandas基本属性值
(1)index属性
行索引,默认值是从________开始递增的整数,也可以在创建对象时通过增加一列字符串类型的index属性。
(2)values属性
存放Series对象的一个数组,存放________对象的二维数据。
(3)columns属性
只针对DataFrame对象,存放各列的________标题。
4.Pandas数据的检索
Pandas可以通过两种方法来检索数据,一是通过三大________(Serise对象只有两大属性)来检索,如df.columns、df.index(一维数据列表),df.values(二维数据列表)。二是通过________记法,Pandas用字典来记录每列的数据,Series对象字典中每个键的值只有一个,键为index属性,值为values属性。DataFrame对象字典中每个键的值有多个,是个列表,键为columns属性,值为每列的数据。
5.Pandas常用函数
函数
说明
count()
返回非空(NaN)数据项的________
sum()、mean()
求和、________,通过axis=0/1确定行列
max()、min()
返回最大、最小值
head()、tail()
返回DataFrame的前n个、后n个数据记录
groupby()
对各列或各行中的数据进行________,然后可对其中每一组数据进行不同的操作
sort_values()
________,通过axis=0/1确定行列,axis默认值为0,________排序。ascending=True/False确定升/降序,ascending默认值为True,________排序。排序结果返回一个新DataFrame对象
drop()
________,通过axis=0/1确定行列,并返回另一个DataFrame对象来存放改变后的数据
6.利用Matplotlib模块绘图
(1)Matplotlib是一个绘图库。使用其中的________子库所提供的函数可以快速绘图和设置图表的坐标轴及刻度、图例等。
(2)导入matplotlib:
importmatplotlib.pyplotasplt。
(3)Matplotlib模块的常用函数
分类
函数
说明
创建
对象
figure()
创建一个新的图表对象,并设置为当前绘图对象
注:不创建figure对象,直接调用plot等绘图函数进行绘图,matplotlib会自动创建一个figure对象
绘制
图形
________
绘制线形图
bar()
绘制垂直柱形图
barh()
绘制水平柱形图
scatter()
绘制散点图
修饰
美化
________
设置图表的标题
xlim()ylim()
设置X、Y轴的取值范围
xlabel()ylabel()
设置X、Y轴的标签
legend()
显示图例
显示
show()
显示创建的所有绘图对象
【经典案例】
Series对象只有index和values两列组成,在Series数据集df中,索引为x的值表示为df[x]或df.at[x]。DataFrame对象由1个索引列(index)和多个数据列组成,在DataFrame数据集df中,可以用df[″姓名″
您可能关注的文档
- 第3章设计与制作三维创意作品3.2三维创意作品赏析-高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.3规划设计三维动画 -高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.4构建三维动画模型 -高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.5设计三维动画模型的外观 -高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章设计与制作三维创意作品3.6三维动画实现和作品发布-高中教学同步《信息技术人工-三维设计与创意》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.1数据处理的一般过程 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.2数据采集与整理 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.3数据分析与可视化 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据处理与应用3.4数据分析报告与应用 高中教学同步《信息技术-数据与计算》(教案)(人教-中图版2019).docx
- 第3章数据管理3.1数据库与数据管理 -高中教学同步《信息技术数据管理与分析》(教案)(人教-中图版2019).docx
- 2025届信息技术一轮复习讲义:专题8 人工智能和信息安全与保护.docx
- 2025届信息技术一轮复习讲义:专题9 计算机网络系统.docx
- 2025届信息技术一轮复习讲义:专题10 信息系统搭建.docx
- 2025届信息技术一轮复习讲义:专题11 数组.docx
- 2025届信息技术一轮复习讲义:专题12 链表.docx
- 2025届信息技术一轮复习讲义:专题13 队列.docx
- 2025届信息技术一轮复习讲义:专题14 栈.docx
- 2025届信息技术一轮复习讲义:专题17 排序算法.docx
- 2025届信息技术一轮复习讲义:专题18 查找算法.docx
- 2025届信息技术一轮复习讲义:专题19 基于数据结构的算法实现.docx
原创力文档


文档评论(0)