复杂数据的处理与分析数据集的有序化操作下08课件讲解.pptxVIP

下载本文档

0
0
约2.44千字
约 15页
2026-01-14 发布于陕西
举报
版权申诉

复杂数据的处理与分析数据集的有序化操作下08课件讲解.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

复杂数据的处理与分析-数据集的有序化操作（下）

任务描述任务描述：通过Pandas对于获取到的数据集进行排序计算操作。主要内容：1.什么是Pandas？2.Pandas的优势3.Pandas的数据结构4.Pandas数据处理的方法

Values返回Series对象内所有值，并以NumPy数组类型返回。(3)Dtype返回Series对象内的数据类型。默认dtype是object，当含有NumPy数据时，则为相应的NumPy类型。(5)Name返回Series对象的名称。(2)Index返回Series对象内的索引，带标签，并且这个索引对象是一个pandas.Index类型。(4)Size返回Series对象内的元素数量。Series常见的属性与方法Pandas提供了一些常用的属性和方法。其中一些属性包括：

(1)head()和tail()返回Series对象的头部/尾部n个行数据，默认为5行，可以指定n的值。(3)unique()和nunique()unique()方法用于返回Series对象唯一值组成的NumPy数组，按值出现的顺序排序。nunique()方法用于返回Series对象的唯一值数量，不包含NaN。sort_values()方法将Series按照值进行排序，sort_index()方法以行索引标签的字典序进行排序。(2)describe()提供了Series对象中数值的统计描述信息，包括总数、均值、标准差、最小值、最大值和四分位数等。(4)value_counts()返回Series对象中每个唯一值出现的频率或计数项。Series常见的属性与方法此外，Series也具有许多常用的方法，例如：(5)sort_values()和sort_index()

DataFrame常见的属性与方法DataFrame的常用属性：(2)index返回DataFrame对象中的行索引标签，它是一个pandas.Index类型的数据结构。(1)values返回DataFrame对象中的所有值，并以NumPy数组类型返回。(3)columns返回DataFrame对象中的列名称，也是一个pandas.Index类型的数据结构。(4)dtypes返回DataFrame对象中每列的数据类型

返回DataFrame对象中所有包含数字类型的列的基本统计指标DataFrame常见的属性与方法删除行或列数据，可以通过n确定要删除哪些行/列，默认axis=0表示删除行，若要删除列则传入axis=1。返回DataFrame对象的前n行和后n行数据，默认为5行。提供了DataFrame对象的基本信息，包括每列的数据类型、NaN值的数量等。按指定列或行对数据进行排序，by参数表示需要排序的列名或者一组列名，ascending参数指定排序是升序还是降序排列。head(n)和tail(n)describe()drop(n,axis=)info()sort_values(by,axis=0,ascending=True)DataFrame还有许多常用的方法，包括：

数据排序的重要性2、其次，数据排序可以帮助筛选出关键信息并去除噪声。、数据排序在数据处理和分析中扮演着重要的角色。1、首先，数据排序可以帮助观察数据的分布情况。通过按照数据的大小或其他指标对数据进行排序，可以更清晰地了解数据的分布特征4、数据排序可以帮助于更好地展示分析结果。3、数据排序可以提高分析的计算效率。

Pandas读取和写出数据的方法Pandas是一个基于Python的数据分析库，被广泛应用于数据处理、数据可视化、机器学习等领域。它提供了许多功能强大的工具和函数，方便对各种数据进行读取、处理和分析。Pandas读取和写出的方法如图所示：

数据集的有序化操作关键步骤讲解下载并导入Pandas获取数据数据排序数据导出

下载并导入Pandas1、Pandas是一个开源的数据处理Python库，是Python生态系统中最受欢迎和广泛使用的数据分析库之一。首次使用Pandas需要进入终端通过pip进行下载。具体代码如下：pipinstallpandas-i/simple等待下载完成，如图所示：下载成功之后，便可以引入Pandas。

获取数据2、可以通过read_csv读取随书附件的爬虫数据进行测试。importpandasaspdimportnumpyasnp#创建一个30行7列的随机数数组，分别代表地区1到地区30的周一到周天的气温data=np.random.randint(low=-10,high=40,size=(30,7))#创建行名列表，代表地区1到地区30indexs=[地区+