- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NumPy-快速处理数据
2 NumPy-快速处理数据¶
标准安装的 Python 中用列表(list)保存一组值,可以用来当作数组使用,不过由
于列表的元素可以是任何对象,因此列表中所保存的是对象的指针。这样为了保
存一个简单的[1,2,3],需要有3 个指针和三个整数对象。对于数值运算来说这种
结构显然比较浪费内存和CPU 计算时间。
此外Python 还提供了一个array 模块,array 对象和列表不同,它直接保存数值,
和C 语言的一维数组比较类似。但是由于它不支持多维,也没有各种运算函数,
因此也不适合做数值运算。
NumPy 的诞生弥补了这些不足,NumPy 提供了两种基本的对象:ndarray
(N-dimensional array object )和 ufunc (universal function object)。ndarray(下
文统一称之为数组)是存储单一数据类型的多维数组,而 ufunc 则是能够对数组
进行处理的函数。
2.1 ndarray 对象¶
函数库的导入
本书的示例程序假设用以下推荐的方式导入NumPy 函数库:
import numpy as np
2.1.1 创建¶
首先需要创建数组才能对其进行其它操作。
我们可以通过给array 函数传递Python 的序列对象创建数组,如果传递的是多
层嵌套的序列,将创建多维数组(下例中的变量c):
a = np.array ([1, 2, 3, 4])
b = np.array ((5, 6, 7, 8))
c = np.array ([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]])
b
array([5, 6, 7, 8])
c
array([[1, 2, 3, 4],
[4, 5, 6, 7],
[7, 8, 9, 10]])
c.dtype
dtype(int32)
数组的大小可以通过其shape 属性获得:
a.shape
(4,)
c.shape
(3, 4)
数组a 的shape 只有一个元素,因此它是一维数组。而数组c 的shape 有两个
元素,因此它是二维数组,其中第0 轴的长度为3,第1 轴的长度为4 。还可以
通过修改数组的 shape 属性,在保持数组元素个数不变的情况下,改变数组每
个轴的长度。下面的例子将数组c 的shape 改为(4,3),注意从(3,4)改为(4,3)并
不是对数组进行转置,而只是改变每个轴的大小,数组元素在内存中的位置并没
有改变:
c.shape = 4,3
c
array([[ 1, 2, 3],
[ 4, 4, 5],
[ 6, 7, 7],
[ 8, 9, 10]])
当某个轴的元素为-1 时,将根据数组元素的个数自动计算此轴的长度,因此下
面的程序将数组c 的shape 改为了(2,6):
c.shape = 2,-1
c
array([[ 1, 2, 3, 4, 4, 5],
[ 6, 7, 7, 8, 9, 10]])
使用数组的reshape 方法,可以创建一个改变了尺寸的新数组,原数组的shape
保持不变:
d = a.reshape ((2,2))
d
array([[1, 2],
[3, 4]])
a
array([1, 2, 3, 4])
数组 a 和 d 其实共享数据存储内存区域,因此修改其中任意一个数组的元素都
会同时修改另外一个数组的内容:
a[1] = 100 # 将数组a 的第一个元素改为100
d # 注意数组d 中的2 也被改变了
array([[ 1, 100],
[ 3, 4]])
数组的元素类型可以通过dtype 属性获得。上面例子中的参数序列的元素都是整
数,因此所创建的数组的元素类型也是整数,并且是32bit 的长整型。可以通过
dtype 参数在创建时指定元素类型:
np.array ([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]], dtype=np.float)
array([[ 1., 2., 3., 4.],
[ 4., 5., 6., 7.],
[ 7., 8., 9., 10.]])
np.ar
文档评论(0)