8.Python科学计算与数据处置.ppt

下载文档 降价啦

6
0
约3.36万字
约 115页
2018-12-27 发布于江苏
举报
版权申诉
保障服务

8.Python科学计算与数据处置.ppt

1、本文档共115页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

8.Python科学计算与数据处置

frame.reindex? * 科罗拉多州（Colorado） * * 科罗拉多州（英语：Colorado） * 科罗拉多州（英语：Colorado） * obj.xs? * frame. * ??s?nd?? * 排名（Series.rank(method='average', ascending=True)）的作用与排序的不同之处在于，他会把对象的 values 替换成名次（从 1 到 n）。这时唯一的问题在于如何处理平级项，方法里的?method?参数就是起这个作用的，他有四个值可选：average, min, max, first。 * * df.mean? * ?vɑljum all_data['AAPL'].shape all_data['AAPL'].columns price.shape volume.shape * returns.shape price.tail() * Fillna：用指定值或插值方法（如ffill或bfill)填充缺失数据。 data.apply(pd.value_counts) 用pd.value_counts方法对data操作。 * θre? df.dropna？ df.dropna(thresh=2) * inplace 修改调用者对象而不产生副本。 Series 和 DataFrame 对象的方法中，凡是会对数组作出修改并返回一个新数组的，往往都有一个?replace=False?的可选参数。如果手动设定为 True，那么原数组就可以被替换。? * from pandas import MultiIndex * swɑp * ?p?n?l * Adj. Close一每日、每週、每月的已調整收市價，這些數值已對股份的分拆和股息派送作出了調整。 * 处理缺失数据 fillna函数的参数 * 参数说明 value 用于填充缺失值的标量值或字典对象 method 插值方式。如果函数调用时未指定其他参数的话，默认为“ffill” axis 待填充的轴，默认axis=0 inplace 修改调用者对象而不产生副本 limit (对于前向和后向填充)可以连续填充的最大数量层次化索引层次化索引（hierarchical indexing)是pandas的一项重要功能，它能在一个轴上拥有多个（两个以上）索引级别。抽象点说，它使能以低维度形式处理高维度数据。先来看一个简单的例子：创建一个Series，并用一个由列表或数组组成的列表作为索引。 * >>>data = Series(np.random.randn(10), index=[['a','a','a','b','b','b','c','c','d','d'], [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]]) >>>data 层次化索引这就是带有Multilndex索引的Series的格式化输出形式。索引之间的“间隔”表示“直接使用上面的标签”：对于一个层次化索引的对象，选取数据子集的操作很简单： * >>> data.index MultiIndex(levels=[[u'a', u'b', u'c', u'd'], [1, 2, 3]], labels=[[0, 0, 0, 1, 1, 1, 2, 2, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 1, 2]]) >>> data['b'] 1 -0.934701 2 0.094732 3 0.659636 dtype: float64 >>>data['b':'c'] b 1 -0.934701 2 0.094732 3 0.659636 c 1 -1.268955 2 1.925957 dtype: float64 层次化索引有时甚至还可以在“内层”中进行选取： * >>> data >>> data[:, 2] a -1.664588 b 0.094732 c 1.925957 d -0.985724 dtype: float64 >>> data.ix[['b', 'd']]