使用 2 个索引列表对 2D Numpy 数组进行索引
- 2025-01-17 09:23:00
- admin 原创
- 91
问题描述:
我遇到了一个奇怪的情况。
我有一个二维 Numpy 数组 x:
x = np.random.random_integers(0,5,(20,8))
我有 2 个索引器 - 一个用于行索引,另一个用于列索引。为了索引 X,我必须执行以下操作:
row_indices = [4,2,18,16,7,19,4]
col_indices = [1,2]
x_rows = x[row_indices,:]
x_indexed = x_rows[:,column_indices]
而不仅仅是:
x_new = x[row_indices,column_indices]
(失败原因:错误,无法使用(2,)广播(20,))
我希望能够使用广播在一行中完成索引,因为这样可以使代码保持干净和可读...另外,我不太了解 python 的内部结构,但据我了解,在一行中完成它应该更快(而且我将使用相当大的数组)。
测试用例:
x = np.random.random_integers(0,5,(20,8))
row_indices = [4,2,18,16,7,19,4]
col_indices = [1,2]
x_rows = x[row_indices,:]
x_indexed = x_rows[:,col_indices]
x_doesnt_work = x[row_indices,col_indices]
解决方案 1:
np.ix_
使用索引或布尔数组/掩码进行选择或分配
1. 使用indexing-arrays
A. 选择
我们可以使用np.ix_
来获取一个索引数组元组,这些元组可以相互广播,从而产生更高维度的索引组合。因此,当该元组用于索引输入数组时,将为我们提供相同的更高维度数组。因此,要根据两个1D
索引数组进行选择,它将是 -
x_indexed = x[np.ix_(row_indices,col_indices)]
B. 转让
我们可以使用相同的符号将标量或可广播数组分配到这些索引位置。因此,以下分配方式有效 -
x[np.ix_(row_indices,col_indices)] = # scalar or broadcastable array
2. 使用masks
我们还可以使用布尔数组/掩码np.ix_
,类似于索引数组的使用方式。这可以再次用于从输入数组中选择一个块,也可以用于将数据赋值到其中。
A. 选择
因此,使用row_mask
和col_mask
布尔数组分别作为行和列选择的掩码,我们可以使用以下内容进行选择 -
x[np.ix_(row_mask,col_mask)]
B. 转让
以下是作业:
x[np.ix_(row_mask,col_mask)] = # scalar or broadcastable array
样本运行
1.np.ix_
使用indexing-arrays
输入数组和索引数组 -
In [221]: x
Out[221]:
array([[17, 39, 88, 14, 73, 58, 17, 78],
[88, 92, 46, 67, 44, 81, 17, 67],
[31, 70, 47, 90, 52, 15, 24, 22],
[19, 59, 98, 19, 52, 95, 88, 65],
[85, 76, 56, 72, 43, 79, 53, 37],
[74, 46, 95, 27, 81, 97, 93, 69],
[49, 46, 12, 83, 15, 63, 20, 79]])
In [222]: row_indices
Out[222]: [4, 2, 5, 4, 1]
In [223]: col_indices
Out[223]: [1, 2]
索引数组的元组,带有np.ix_
-
In [224]: np.ix_(row_indices,col_indices) # Broadcasting of indices
Out[224]:
(array([[4],
[2],
[5],
[4],
[1]]), array([[1, 2]]))
做出选择 -
In [225]: x[np.ix_(row_indices,col_indices)]
Out[225]:
array([[76, 56],
[70, 47],
[46, 95],
[76, 56],
[92, 46]])
正如OP 所建议的,这实际上与使用 的二维数组版本执行老式row_indices
广播相同,其中将其元素/索引发送到axis=0
,从而在 处创建一个单例维度axis=1
,从而允许使用 进行广播col_indices
。因此,我们可以有一个替代解决方案,如下所示 -
In [227]: x[np.asarray(row_indices)[:,None],col_indices]
Out[227]:
array([[76, 56],
[70, 47],
[46, 95],
[76, 56],
[92, 46]])
正如前面所讨论的,对于作业,我们只需这样做。
行、列索引数组 -
In [36]: row_indices = [1, 4]
In [37]: col_indices = [1, 3]
使用标量进行分配 -
In [38]: x[np.ix_(row_indices,col_indices)] = -1
In [39]: x
Out[39]:
array([[17, 39, 88, 14, 73, 58, 17, 78],
[88, -1, 46, -1, 44, 81, 17, 67],
[31, 70, 47, 90, 52, 15, 24, 22],
[19, 59, 98, 19, 52, 95, 88, 65],
[85, -1, 56, -1, 43, 79, 53, 37],
[74, 46, 95, 27, 81, 97, 93, 69],
[49, 46, 12, 83, 15, 63, 20, 79]])
使用二维块(可广播数组)进行分配 -
In [40]: rand_arr = -np.arange(4).reshape(2,2)
In [41]: x[np.ix_(row_indices,col_indices)] = rand_arr
In [42]: x
Out[42]:
array([[17, 39, 88, 14, 73, 58, 17, 78],
[88, 0, 46, -1, 44, 81, 17, 67],
[31, 70, 47, 90, 52, 15, 24, 22],
[19, 59, 98, 19, 52, 95, 88, 65],
[85, -2, 56, -3, 43, 79, 53, 37],
[74, 46, 95, 27, 81, 97, 93, 69],
[49, 46, 12, 83, 15, 63, 20, 79]])
2.np.ix_
使用masks
输入数组 -
In [19]: x
Out[19]:
array([[17, 39, 88, 14, 73, 58, 17, 78],
[88, 92, 46, 67, 44, 81, 17, 67],
[31, 70, 47, 90, 52, 15, 24, 22],
[19, 59, 98, 19, 52, 95, 88, 65],
[85, 76, 56, 72, 43, 79, 53, 37],
[74, 46, 95, 27, 81, 97, 93, 69],
[49, 46, 12, 83, 15, 63, 20, 79]])
输入行、列掩码 -
In [20]: row_mask = np.array([0,1,1,0,0,1,0],dtype=bool)
In [21]: col_mask = np.array([1,0,1,0,1,1,0,0],dtype=bool)
做出选择 -
In [22]: x[np.ix_(row_mask,col_mask)]
Out[22]:
array([[88, 46, 44, 81],
[31, 47, 52, 15],
[74, 95, 81, 97]])
使用标量进行分配 -
In [23]: x[np.ix_(row_mask,col_mask)] = -1
In [24]: x
Out[24]:
array([[17, 39, 88, 14, 73, 58, 17, 78],
[-1, 92, -1, 67, -1, -1, 17, 67],
[-1, 70, -1, 90, -1, -1, 24, 22],
[19, 59, 98, 19, 52, 95, 88, 65],
[85, 76, 56, 72, 43, 79, 53, 37],
[-1, 46, -1, 27, -1, -1, 93, 69],
[49, 46, 12, 83, 15, 63, 20, 79]])
使用二维块(可广播数组)进行分配 -
In [25]: rand_arr = -np.arange(12).reshape(3,4)
In [26]: x[np.ix_(row_mask,col_mask)] = rand_arr
In [27]: x
Out[27]:
array([[ 17, 39, 88, 14, 73, 58, 17, 78],
[ 0, 92, -1, 67, -2, -3, 17, 67],
[ -4, 70, -5, 90, -6, -7, 24, 22],
[ 19, 59, 98, 19, 52, 95, 88, 65],
[ 85, 76, 56, 72, 43, 79, 53, 37],
[ -8, 46, -9, 27, -10, -11, 93, 69],
[ 49, 46, 12, 83, 15, 63, 20, 79]])
解决方案 2:
那么:
x[row_indices][:,col_indices]
例如,
x = np.random.random_integers(0,5,(5,5))
## array([[4, 3, 2, 5, 0],
## [0, 3, 1, 4, 2],
## [4, 2, 0, 0, 3],
## [4, 5, 5, 5, 0],
## [1, 1, 5, 0, 2]])
row_indices = [4,2]
col_indices = [1,2]
x[row_indices][:,col_indices]
## array([[1, 5],
## [2, 0]])
解决方案 3:
import numpy as np
x = np.random.random_integers(0,5,(4,4))
x
array([[5, 3, 3, 2],
[4, 3, 0, 0],
[1, 4, 5, 3],
[0, 4, 3, 4]])
# This indexes the elements 1,1 and 2,2 and 3,3
indexes = (np.array([1,2,3]),np.array([1,2,3]))
x[indexes]
# returns array([3, 5, 4])
请注意,numpy 的规则因您使用的索引类型而异。因此,索引多个元素应由 of 组成tuple
(np.ndarray
请参阅索引手册)。
因此您只需将您的转换list
为np.ndarray
,它就应该按预期工作。
解决方案 4:
我认为您正在尝试执行以下(等效)操作之一:
x_does_work = x[row_indices,:][:,col_indices]
x_does_work = x[:,col_indices][row_indices,:]
这实际上将创建一个x
仅包含选定行的子集,然后从中选择列,在第二种情况下反之亦然。第一种情况可以被认为是
x_does_work = (x[row_indices,:])[:,col_indices]
解决方案 5:
如果你用 np.newaxis 编写它,你的第一次尝试就会成功
x_new = x[row_indices[:, np.newaxis],column_indices]