- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * ?s?f?ksiz * 密苏里州(英语:Missouri) * * k?n?k?t??ne???n * * ?ɡ?n?r * * * 科罗拉多州(英语:Colorado) * * * * seed( ) 用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed( )值,则每次生成的随即数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。 * [.p?rmj?te??(?)n] * 重塑和轴向旋转 如果不是所有的级別值都能在各分组中找到的话,则unstack操作可能会引入缺失数据: stack默认会滤除缺失数据,因此该运算是可逆的: * s1 = Series([0, 1, 2, 3], index=[a,b,c,d]) s2 = Series([4, 5, 6],index=[c,d,e]) data2 = pd.concat([s1, s2], keys=[one,two]) data2.unstack() data2.unstack().stack() data2.unstack().stack(dropna=False) 重塑和轴向旋转 在对DataFrame进行unstack操作时,作为旋转轴的级別将会成为结果中的最低级別: * df = DataFrame({left: result, right: result + 5}, columns=pd.Index([left,right], name=side)) df df.unstack(state) df.unstack(state).stack(side) 重塑和轴向旋转 * 将“长格式”旋转为“宽格式” 时间序列数据通常是以所谓的“长格式” (long)或“堆叠格式” (stacked)存储在数据库和CSV中的: 1data[:10] 数据转换 到目前为止介绍的都是数据的重排。另一类重要操作则是过滤、清理以及其他的转换工作。 移除重复数据 DataFrame中常常会出现重复行。下面就是一个例子: DataFrame的duplicated方法返回一个布尔型Series,表示各行是否是重复行: * data = DataFrame({k1: [one] * 3 + [two] * 4, k2: [1, 1, 2, 3, 3, 4, 4]}) data data.duplicated() 数据转换 还有一个与此相关的drop_duplicates方法,它用于返回一个移除了重复行的Data_ Frame: 这两个方法默认会判断全部列,也可以指定部分列进行重复项判断。假设还有一列值,且只希望根据k1列过滤重复项: * data.drop_duplicates() data[v1] = range(7) data.drop_duplicates([k1]) 数据转换 * duplicated和drop_duplicates默认保留的是第一个出现的值组合。传入take_ last = True 则保留最后一个: data.drop_duplicates([k1,k2], take_last=True) 数据转换 利用函数或映射进行数据转换 在对数据集进行转换时,可能希望根据数组、Series或DataFrame列中的值来实现该转换工作。 * data = DataFrame({food: [bacon, pulled pork, bacon, Pastrami, corned beef, Bacon, pastrami,honey ham,nova lox], ounces: [4, 3, 12, 6, 7.5, 8, 3, 5, 6]}) data 数据转换 假设想要添加一列表示该肉类食物来源的动物类型。 Series的map方法可以接受一个函数或含有映射关系的字典型对象,但是这里有一个小问题,即有些肉类的首字母大写了,而另一些则没有。因此,还需要将各个值转换为小写: * meat_to_animal = {bacon:pig,pulled pork: pig,
原创力文档


文档评论(0)