8.Python科学计算与数据处置.ppt

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8.Python科学计算与数据处置

frame.reindex? * 科罗拉多州(Colorado) * * 科罗拉多州(英语:Colorado) * 科罗拉多州(英语:Colorado) * obj.xs? * frame. * ??s?nd?? * 排名(Series.rank(method='average', ascending=True))的作用与排序的不同之处在于,他会把对象的 values 替换成名次(从 1 到 n)。这时唯一的问题在于如何处理平级项,方法里的?method?参数就是起这个作用的,他有四个值可选:average, min, max, first。 * * df.mean? * ?vɑljum all_data['AAPL'].shape all_data['AAPL'].columns price.shape volume.shape * returns.shape price.tail() * Fillna:用指定值或插值方法(如ffill或bfill)填充缺失数据。 data.apply(pd.value_counts) 用pd.value_counts方法对data操作。 * θre? df.dropna? df.dropna(thresh=2) * inplace 修改调用者对象而不产生副本。 Series 和 DataFrame 对象的方法中,凡是会对数组作出修改并返回一个新数组的,往往都有一个?replace=False?的可选参数。如果手动设定为 True,那么原数组就可以被替换。? * from pandas import MultiIndex * swɑp * ?p?n?l * Adj. Close一每日、每週、每月的已調整收市價,這些數值已對股份的分拆和股息派送作出了調整。 * 处理缺失数据 fillna函数的参数 * 参数 说明 value 用于填充缺失值的标量值或字典对象 method 插值方式。如果函数调用时未指定其他参数 的话,默认为“ffill” axis 待填充的轴,默认axis=0 inplace 修改调用者对象而不产生副本 limit (对于前向和后向填充)可以连续填充的最 大数量 层次化索引 层次化索引(hierarchical indexing)是pandas的一项重要功能,它能在一个轴上拥 有多个(两个以上)索引级别。抽象点说,它使能以低维度形式处理高维度数据。 先来看一个简单的例子:创建一个Series,并用一个由列表或数组组成的列表作为索引。 * >>>data = Series(np.random.randn(10), index=[['a','a','a','b','b','b','c','c','d','d'], [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]]) >>>data 层次化索引 这就是带有Multilndex索引的Series的格式化输出形式。索引之间的“间隔”表示“直 接使用上面的标签”: 对于一个层次化索引的对象,选取数据子集的操作很简单: * >>> data.index MultiIndex(levels=[[u'a', u'b', u'c', u'd'], [1, 2, 3]], labels=[[0, 0, 0, 1, 1, 1, 2, 2, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 1, 2]]) >>> data['b'] 1 -0.934701 2 0.094732 3 0.659636 dtype: float64 >>>data['b':'c'] b 1 -0.934701 2 0.094732 3 0.659636 c 1 -1.268955 2 1.925957 dtype: float64 层次化索引 有时甚至还可以在“内层”中进行选取: * >>> data >>> data[:, 2] a -1.664588 b 0.094732 c 1.925957 d -0.985724 dtype: float64 >>> data.ix[['b', 'd']]

文档评论(0)

泰山之颠 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档