Pythonstr、list、numpy分片操作

现在的位置: 首页 > 操作系统 > 正文

RSS

上篇下篇

Pythonstr、list、numpy分片操作

2020年02月07日 ⁄ 操作系统 ⁄ 共 5357字 ⁄ 字号小中大 ⁄ 评论关闭

在Python里，像字符串(str)、列表(list)、元组(tupple)和这类序列类型都支持切片操作

对对象切片，s是一个字符串，可以通过类似数组索引的方式获取字符串中的字符，同时也可以用s[a:b:c]的形式对s在a和b之间，以c为间隔取值，c的值还可以为负，负值则意味着反向取值

>>> s = 'bicycle'>>> s[0]'b'>>> s[1]'i'>>> s[::3]'bye'>>> s[::-1]'elcycib'>>> s[::-2]'eccb'

给切片赋值

首先，生成一个长度为16，从0到15的列表

>>> l = list(range(16))>>> l[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

用[20,30]将取代索引[2，5)的值

>>> l[2:5] = [20, 30] >>> l[0, 1, 20, 30, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

索引[5,8)将被删除

>>> del l[5:8]>>> l[0, 1, 20, 30, 5, 9, 10, 11, 12, 13, 14, 15]

从数组第9个索引开始，以两个单位为间隔，将[11,22]赋值给左边的分片对象，如果赋值数组中元素的个数和分片对象中元素的个数不同，则会报错

>>> l[9::2] [13, 15]>>> l[9::2] = [11, 22] >>> l[0, 1, 20, 30, 5, 9, 10, 11, 12, 11, 14, 22]>>> l[6::2][10, 12, 14]>>> l[6::2] = [66, 77, 88] # 同理，l[6::2]必须为[n1,n2,n3]的数组，如果不是则将其赋值为[66, 77, 88]则会报错>>> l[0, 1, 20, 30, 5, 9, 66, 11, 77, 11, 88, 22]

列表l[2:5]的结果是[20, 30, 5]，而我们的赋值是[30, 33]，所以30会代替20,33会代替30，而5则会被去除。如果左边数组元素的个数少于赋值数组中元素的个数，则原数组分片之后的元素会排在新元素之后

>>> l[2:5][20, 30, 5]>>> l[2:5] = [30, 33] >>> l[0, 1, 30, 33, 9, 66, 11, 77, 11, 88, 22]>>> l[2:5][30, 33, 9]>>> l[2:5] = [-10, -20, -30, -40, -50] >>> l[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]

拷贝一个分片对象，并修改其中的值，并不会修改原列表对象中的值

>>> l1 = l[2:5]>>> l1[-10, -20, -30]>>> l1 = [10, 20, 30]>>> l1[10, 20, 30]>>> l[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]

如果将一个数字赋值给左边的分片对象，则会报错

>>> l[2:5] = 10 Traceback (most recent call last): File "<stdin>", line 1, in <module>TypeError: can only assign an iterable

numpy基本的索引和切片

>>> import numpy as np>>> arr = np.arange(10)>>> arrarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])>>> arr[5]5>>> arr[5:8]array([5, 6, 7])>>> arr[5:8] = 12 # 这里不会像之前会报错>>> arrarray([ 0, 1, 2, 3, 4, 12, 12, 12, 8, 9])

如上所示，当你将一个标量赋值给一个切片对象时（如arr[5:8] = 12），该值会自动传播到整个选区。跟之前列表的分片的区别在于，numpy数组分片是原始数组的视图，数据没有被复制，视图上任何的修改都会直接反映到源数据上，如果不希望修改到源数据，则用arr[5:8].copy()：

>>> arr_slice = arr[5:8]>>> arr_slicearray([12, 12, 12])>>> arr_slice[1] = 99>>> arr_slicearray([12, 99, 12])>>> arrarray([ 0, 1, 2, 3, 4, 12, 99, 12, 8, 9])>>> arr_slice[:] = 66>>> arrarray([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])>>> arr_slice_copy = arr[5:8].copy()>>> arr_slice_copyarray([66, 66, 66])>>> arr_slice_copy[:] = 88>>> arr_slice_copyarray([88, 88, 88])>>> arrarray([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])

在一个二维数组中，各索引位置上的元素不再是标量而是一维数组：

>>> arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])>>> arr2d[2]array([7, 8, 9])>>> arr2d[0][2]3>>> arr2d[0, 2]3

按照行或者列来进行分片

>>> arr2darray([[1, 2, 3], [4, 5, 6], [7, 8, 9]])>>> arr2d[:2] # 取前两行，即第0行和第1行array([[1, 2, 3], [4, 5, 6]])>>> arr2d[:2, 1:] # 取前两行的第零列之后所有元素array([[2, 3], [5, 6]])>>> arr2d[:, 1:2] # 取所有行的第一列元素（列索引从0开始）array([[2], [5], [8]])>>> arr2d[1, :2] # 取第一行的前两列的元素元素array([4, 5])>>> arr2d[2, :1] # 取第二行的第零列元素array([7])>>> arr2d[:, :1] # 取所有行的第零列元素array([[1], [4], [7]])>>> arr2d[:, 1:] = 0 # 同样，分片表达式的赋值操作也会扩散到源数据>>> arr2darray([[1, 0, 0], [4, 0, 0], [7, 0, 0]])

布尔型索引

假设我们有一个用于存储数据的数组以及一个存储姓名的数组（含有重复项）。

>>> import numpy as np>>> from numpy.random import randint>>> names = np.array(['Bob', 'Joe', 'Bob', 'Will', 'Will', 'Joe', 'Joe', 'Bob'])>>> data = randint(6, size=(8, 4))>>> dataarray([[2, 1, 2, 2], [3, 3, 4, 2], [0, 5, 3, 5], [2, 1, 5, 2], [1, 3, 0, 3], [0, 0, 0, 1], [0, 0, 0, 5], [4, 2, 5, 1]])

假设每个名字都对应data数组中的一行，而我们想要选出对应于名字“Bob”的所有行。我们可以这样操作

>>> names == 'Bob'array([ True, False, True, False, False, False, False, True], dtype=bool)>>> data[names == 'Bob']array([[2, 1, 2, 2], [0, 5, 3, 5], [4, 2, 5, 1]])

布尔型数组的长度必须跟被索引的数组长度一致，此外，还可以将布尔型数组跟分片、整数（或整数序列）混合使用

>>> data[names == 'Bob', 2:]array([[2, 2], [3, 5], [5, 1]])>>> data[names == 'Bob', 3]array([2, 5, 1])>>> data[names == 'Bob', 3:]array([[2], [5], [1]])

如果需要选取多个名字组合需要组合多个布尔条件，使用&（和）、|（或）之类的布尔算术运算符即可：

>>> mask = (names == 'Bob') | (names == 'Will')>>> maskarray([ True, False, True, True, True, False, False, True], dtype=bool)>>> data[mask]array([[2, 1, 2, 2], [0, 5, 3, 5], [2, 1, 5, 2], [1, 3, 0, 3], [4, 2, 5, 1]])

注意：Python关键字and和or在布尔型数据中无效

通过布尔型数组设置值是一种经常用到的手段，为了将data中所有的偶数设置为3，我们只需：

>>> dataarray([[2, 1, 2, 2], [3, 3, 4, 2], [0, 5, 3, 5], [2, 1, 5, 2], [1, 3, 0, 3], [0, 0, 0, 1], [0, 0, 0, 5], [4, 2, 5, 1]])>>> data[data % 2 == 0] = 3>>> dataarray([[3, 1, 3, 3], [3, 3, 3, 3], [3, 5, 3, 5], [3, 1, 5, 3], [1, 3, 3, 3], [3, 3, 3, 1], [3, 3, 3, 5], [3, 3, 5, 1]])

花式索引

花式索引是numpy术语，它指的是利用整数数组进行索引。假设我们有一个8×4数组：

>>> arr = np.empty((8, 4))>>> for i in range(8):... arr[i] = i...>>> arrarray([[ 0., 0., 0., 0.], [ 1., 1., 1., 1.], [ 2., 2., 2., 2.], [ 3., 3., 3., 3.], [ 4., 4., 4., 4.], [ 5., 5., 5., 5.], [ 6., 6., 6., 6.], [ 7., 7., 7., 7.]])>>> arr[[3, 5, 0, 6]]array([[ 3., 3., 3., 3.], [ 5., 5., 5., 5.], [ 0., 0., 0., 0.], [ 6., 6., 6., 6.]])>>> arr[[3, -3, -1]]array([[ 3., 3., 3., 3.], [ 5., 5., 5., 5.], [ 7., 7., 7., 7.]])

arr[[3, 5, 0, 6]]会索引源数组的第三行、第五行、第零行、第六行，然后组成新的视图返回，而arr[[3, -3, -1]]则会索引第三行、倒数第三行和倒数第一行

我们生成了一个8×4数组，然后传入两个索引数组[1, 5, 7, 2]、 [0, 3, 1, 2]，然后我们得到一个一维的数组

>>> arr = np.arange(32).reshape((8, 4))>>> arrarray([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11], [12, 13, 14, 15], [16, 17, 18, 19], [20, 21, 22, 23], [24, 25, 26, 27], [28, 29, 30, 31]])>>> arr[[1, 5, 7, 2], [0, 3, 1, 2]]array([ 4, 23, 29, 10])

下面我们分析一下上面的代码究竟发生了什么，第一个索引数组[1, 5, 7, 2]，我们获取第一行、第五行、第七行和第二行，然后我们将根据第二个索引数组 [0, 3, 1, 2]，获取第一行的第零列、第五行的三列……以此类推，最后，我们获得了一个一维的数��

当然，在有些情况下，我们希望按照不同的顺序获取源数组不同的行，并且还要在获取后，改动原来的列顺序，于是我们可以这样做：

>>> arr[[1, 5, 7, 2]]array([[ 4, 5, 6, 7], [20, 21, 22, 23], [28, 29, 30, 31], [ 8, 9, 10, 11]])>>> arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]array([[ 6, 5, 7, 4], [22, 21, 23, 20], [30, 29, 31, 28], [10, 9, 11, 8]])>>> arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]array([[ 6, 5, 7, 4], [22, 21, 23, 20], [30, 29, 31, 28], [10, 9, 11, 8]])

如上，我们既可以用arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]这样的方式获取获取不同的行，再改变其中的列顺序，同时也可以用np.ix_函数达到一样的目的，不过需要注意的一点是，花式索引跟分片不一样，它总是将数据复制到新的数组中：

>>> arr1 = arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]>>> arr1array([[ 6, 5, 7, 4], [22, 21, 23, 20], [30, 29, 31, 28], [10, 9, 11, 8]])>>> arr1[1] = 66>>> arr1array([[ 6, 5, 7, 4], [66, 66, 66, 66], [30, 29, 31, 28], [10, 9, 11, 8]])>>> arrarray([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11], [12, 13, 14, 15], [16, 17, 18, 19], [20, 21, 22, 23], [24, 25, 26, 27], [28, 29, 30, 31]])

以上就上有关Pythonstr、list、numpy分片操作的相关介绍，要了解更多Python str,Python list,Python numpy,Python str、list、numpy分片操作,编程,Linux编程,Linux Shell,Android,Android教程,JAVA,C语言,Python,HTML5内容请登录学步园。

【上篇】Python中__str__和__repr__的区别
【下篇】.NET/.NETCore中更清晰的堆栈跟踪

作者: admin

该日志由 admin 于4年前发表在操作系统分类下，最后更新于 2020年02月07日.

转载请注明: Pythonstr、list、numpy分片操作 | 学步园 +复制链接

关键字: list, numpy分片操作, Pythonstr

抱歉!评论已关闭.

学步园

Pythonstr、list、numpy分片操作

作者: admin

书签

最新文章New

本站推荐

返回首页