- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Python数据分析基础与应用模块4Pandas数据结构应用与数据读写操作
4.5Pandas基本操作
4.5.1Pandas数据显示格式设置在使用Pandas进行数据分析的过程中,经常需要输出数据分析的结果,如果数据体量较大就会存在输出数据不全(部分内容省略)或者换行错误等问题。Pandas为了解决上述问题,允许用户对数据显示格式进行设置。Pandas显示全部数据的代码如下:#显示所有的列pd.set_option(display.max_columns,None)#显示所有的行pd.set_option(display.max_rows,None)#设置value的显示长度为100,默认为50pd.set_option(max_colwidth,100)
4.5.2Pandas字符串操作Pandas提供了一系列的字符串函数,方便对字符串进行操作。
4.5.3Pandas遍历操作对于Series而言,可以把它当做一维数组进行遍历操作;而DataFrame这种二维数据表结构,则类似于遍历Python字典。1.使用for循环进行遍历在Pandas中同样也可以使用for循环进行遍历,通过for遍历后,Series可直接获取相应的value,而DataFrame则会获取列索引。
4.5.3Pandas遍历操作2.使用内置迭代方法进行遍历可以使用下列函数遍历DataFrame的每一行:?iteritems()函数:以键值对(key,value)的形式进行遍历;?iterrows()函数:以(row_index,row)的形式遍历行;?itertuples()函数:以命名元组的方式遍历行。(1)使用iteritems()函数以键值对(key,value)的形式进行遍历iteritems()函数以键值对的形式遍历DataFrame对象,以列索引为键,以对应列的元素为值。
4.5.3Pandas遍历操作2.使用内置迭代方法进行遍历(2)使用iterrows()函数以(row_index,row)的形式遍历行iterrows()函数按行遍历,返回一个迭代器,以行索引标签(row_index)为键,以每一行数据为值。(3)使用itertuples()函数以命名元组的方式遍历行itertuples()函数同样将返回一个迭代器,该函数会把DataFrame的每一行生成一个元组。
4.5.4Pandas排序操作Pands提供了两种排序方法,分别是按索引标签排序和按数值排序。1.使用sort_index()函数按索引标签进行排序默认情况下,使用sort_index()函数按照行索引顺序对行索引进行排序。也可以自定义轴参数(axis)和排序顺序,从而实现根据列标签对所有列排序,或者根据指定某列或某几列对行进行排序。sort_index()函数的语法格式如下:sort_index(axis=0,level=None,ascending=True,inplace=False,kind=quicksort,na_position=last,by=None)
4.5.4Pandas排序操作其主要函数参数说明如下:?axis:通过给axis轴参数传递1,可以对列索引进行排序。默认情况下,axis=0表示按行索引排序。?level:指定根据哪一层索引进行排序,默认值为None,即按最外(上)层索引进行排序。该值可以是数值、索引名,或者是由二者构成的列表。如果参数level有设置值,则按照给定的level顺序排列。?ascending:通过将布尔值传递给ascending参数,可以控制排序方式(行号顺序),该参数取值True时按照升序排列,取值False时则按照降序排列,默认值为True,即默认为升序排列。?inplace:默认值为False,表示创建一个新的dataframe,对新的dataframe进行排序操作,不改变原数据。如果其值设置为True,表示直接在源数据集上进行排序操作。
4.5.4Pandas排序操作其主要函数参数说明如下:?kind:用于指定排序算法,一般有三种排序算法:quicksort、mergesort、heapsort,默认值为quicksort(快速排序)),其中Mergesort归并排序是最稳定的算法。?na_position:规定缺失值的排列方式,其取值为{first,last},默认值为last,即缺失值排在最后面。?by:按照某一列或几列数据进行排序。
4.5.4Pandas排序操作2.使用sort_values()函数按数值进行排序sort_values()函数用于实现按值排序,既可以根据列数据排序,也可根据行数据排序。该函数必须指定
您可能关注的文档
- Python数据分析基础与应用(微课版) 教案 模块7 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块9 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块8 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块5 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块6 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块4 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块1 认知数据分析与构建程序运行环境电子教案.docx
- Python数据分析基础与应用(微课版) 教案 模块1 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块3 数据分析应用NumPy.docx
- Python数据分析基础与应用(微课版) 教案 模块7 数据分析可视化展示.docx
- Python数据分析基础与应用(微课版)课件 4.6 Pandas数据筛选.pptx
- Python数据分析基础与应用(微课版)课件 4.7 Pandas创建与操作多层索引.pptx
- Python数据分析基础与应用(微课版)课件 4.8 Pandas读写文件中的数据.pptx
- Python数据分析基础与应用(微课版)课件 5.1 Pandas数据清理.pptx
- Python数据分析基础与应用(微课版)课件 5.2 Pandas数据合并.pptx
- Python数据分析基础与应用(微课版)课件 5.3 Pandas数据抽取.pptx
- Python数据分析基础与应用(微课版)课件 5.4 Pandas数据重塑.pptx
- Python数据分析基础与应用(微课版)课件 6.3 Pandas数据聚合与分组运算.pptx
- Python数据分析基础与应用(微课版)课件 7.2 应用Pyplot子模块的函数绘制图形.pptx
- Python数据分析基础与应用(微课版)课件 7.3 使用Pandas的plot方法绘制图形.pptx
文档评论(0)