使用 2 个索引列表对 2D Numpy 数组进行索引

2025-01-17 09:23:00
admin
原创
91
摘要:问题描述:我遇到了一个奇怪的情况。 我有一个二维 Numpy 数组 x:x = np.random.random_integers(0,5,(20,8)) 我有 2 个索引器 - 一个用于行索引,另一个用于列索引。为了索引 X,我必须执行以下操作:row_indices = [4,2,18,16,7,19,4...

问题描述:

我遇到了一个奇怪的情况。

我有一个二维 Numpy 数组 x:

x = np.random.random_integers(0,5,(20,8))

我有 2 个索引器 - 一个用于行索引,另一个用于列索引。为了索引 X,我必须执行以下操作:

row_indices = [4,2,18,16,7,19,4]
col_indices = [1,2]
x_rows = x[row_indices,:]
x_indexed = x_rows[:,column_indices]

而不仅仅是:

x_new = x[row_indices,column_indices]

(失败原因:错误,无法使用(2,)广播(20,))


我希望能够使用广播在一行中完成索引,因为这样可以使代码保持干净和可读...另外,我不太了解 python 的内部结构,但据我了解,在一行中完成它应该更快(而且我将使用相当大的数组)。


测试用例:

x = np.random.random_integers(0,5,(20,8))

row_indices = [4,2,18,16,7,19,4]
col_indices = [1,2]
x_rows = x[row_indices,:]
x_indexed = x_rows[:,col_indices]

x_doesnt_work = x[row_indices,col_indices]

解决方案 1:

np.ix_使用索引或布尔数组/掩码进行选择或分配

1. 使用indexing-arrays

A. 选择

我们可以使用np.ix_来获取一个索引数组元组,这些元组可以相互广播,从而产生更高维度的索引组合。因此,当该元组用于索引输入数组时,将为我们提供相同的更高维度数组。因此,要根据两个1D索引数组进行选择,它将是 -

x_indexed = x[np.ix_(row_indices,col_indices)]

B. 转让

我们可以使用相同的符号将标量或可广播数组分配到这些索引位置。因此,以下分配方式有效 -

x[np.ix_(row_indices,col_indices)] = # scalar or broadcastable array

2. 使用masks

我们还可以使用布尔数组/掩码np.ix_,类似于索引数组的使用方式。这可以再次用于从输入数组中选择一个块,也可以用于将数据赋值到其中。

A. 选择

因此,使用row_maskcol_mask布尔数组分别作为行和列选择的掩码,我们可以使用以下内容进行选择 -

x[np.ix_(row_mask,col_mask)]

B. 转让

以下是作业:

x[np.ix_(row_mask,col_mask)] = # scalar or broadcastable array

样本运行

1.np.ix_使用indexing-arrays

输入数组和索引数组 -

In [221]: x
Out[221]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88, 92, 46, 67, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, 76, 56, 72, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

In [222]: row_indices
Out[222]: [4, 2, 5, 4, 1]

In [223]: col_indices
Out[223]: [1, 2]

索引数组的元组,带有np.ix_-

In [224]: np.ix_(row_indices,col_indices) # Broadcasting of indices
Out[224]: 
(array([[4],
        [2],
        [5],
        [4],
        [1]]), array([[1, 2]]))

做出选择 -

In [225]: x[np.ix_(row_indices,col_indices)]
Out[225]: 
array([[76, 56],
       [70, 47],
       [46, 95],
       [76, 56],
       [92, 46]])

正如OP 所建议的,这实际上与使用 的二维数组版本执行老式row_indices广播相同,其中将其元素/索引发送axis=0,从而在 处创建一个单例维度axis=1,从而允许使用 进行广播col_indices。因此,我们可以有一个替代解决方案,如下所示 -

In [227]: x[np.asarray(row_indices)[:,None],col_indices]
Out[227]: 
array([[76, 56],
       [70, 47],
       [46, 95],
       [76, 56],
       [92, 46]])

正如前面所讨论的,对于作业,我们只需这样做。

行、列索引数组 -

In [36]: row_indices = [1, 4]

In [37]: col_indices = [1, 3]

使用标量进行分配 -

In [38]: x[np.ix_(row_indices,col_indices)] = -1

In [39]: x
Out[39]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88, -1, 46, -1, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, -1, 56, -1, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

使用二维块(可广播数组)进行分配 -

In [40]: rand_arr = -np.arange(4).reshape(2,2)

In [41]: x[np.ix_(row_indices,col_indices)] = rand_arr

In [42]: x
Out[42]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88,  0, 46, -1, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, -2, 56, -3, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

2.np.ix_使用masks

输入数组 -

In [19]: x
Out[19]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88, 92, 46, 67, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, 76, 56, 72, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

输入行、列掩码 -

In [20]: row_mask = np.array([0,1,1,0,0,1,0],dtype=bool)

In [21]: col_mask = np.array([1,0,1,0,1,1,0,0],dtype=bool)

做出选择 -

In [22]: x[np.ix_(row_mask,col_mask)]
Out[22]: 
array([[88, 46, 44, 81],
       [31, 47, 52, 15],
       [74, 95, 81, 97]])

使用标量进行分配 -

In [23]: x[np.ix_(row_mask,col_mask)] = -1

In [24]: x
Out[24]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [-1, 92, -1, 67, -1, -1, 17, 67],
       [-1, 70, -1, 90, -1, -1, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, 76, 56, 72, 43, 79, 53, 37],
       [-1, 46, -1, 27, -1, -1, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

使用二维块(可广播数组)进行分配 -

In [25]: rand_arr = -np.arange(12).reshape(3,4)

In [26]: x[np.ix_(row_mask,col_mask)] = rand_arr

In [27]: x
Out[27]: 
array([[ 17,  39,  88,  14,  73,  58,  17,  78],
       [  0,  92,  -1,  67,  -2,  -3,  17,  67],
       [ -4,  70,  -5,  90,  -6,  -7,  24,  22],
       [ 19,  59,  98,  19,  52,  95,  88,  65],
       [ 85,  76,  56,  72,  43,  79,  53,  37],
       [ -8,  46,  -9,  27, -10, -11,  93,  69],
       [ 49,  46,  12,  83,  15,  63,  20,  79]])

解决方案 2:

那么:

x[row_indices][:,col_indices]

例如,

x = np.random.random_integers(0,5,(5,5))
## array([[4, 3, 2, 5, 0],
##        [0, 3, 1, 4, 2],
##        [4, 2, 0, 0, 3],
##        [4, 5, 5, 5, 0],
##        [1, 1, 5, 0, 2]])

row_indices = [4,2]
col_indices = [1,2]
x[row_indices][:,col_indices]
## array([[1, 5],
##        [2, 0]])

解决方案 3:

import numpy as np
x = np.random.random_integers(0,5,(4,4))
x
array([[5, 3, 3, 2],
       [4, 3, 0, 0],
       [1, 4, 5, 3],
       [0, 4, 3, 4]])

# This indexes the elements 1,1 and 2,2 and 3,3
indexes = (np.array([1,2,3]),np.array([1,2,3]))
x[indexes]
# returns array([3, 5, 4])

请注意,numpy 的规则因您使用的索引类型而异。因此,索引多个元素应由 of 组成tuplenp.ndarray请参阅索引手册)。

因此您只需将您的转换listnp.ndarray,它就应该按预期工作。

解决方案 4:

我认为您正在尝试执行以下(等效)操作之一:

x_does_work = x[row_indices,:][:,col_indices]
x_does_work = x[:,col_indices][row_indices,:]

这实际上将创建一个x仅包含选定行的子集,然后从中选择列,在第二种情况下反之亦然。第一种情况可以被认为是

x_does_work = (x[row_indices,:])[:,col_indices]

解决方案 5:

如果你用 np.newaxis 编写它,你的第一次尝试就会成功

x_new = x[row_indices[:, np.newaxis],column_indices]
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1565  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1354  
  信创国产芯片作为信息技术创新的核心领域,对于推动国家自主可控生态建设具有至关重要的意义。在全球科技竞争日益激烈的背景下,实现信息技术的自主可控,摆脱对国外技术的依赖,已成为保障国家信息安全和产业可持续发展的关键。国产芯片作为信创产业的基石,其发展水平直接影响着整个信创生态的构建与完善。通过不断提升国产芯片的技术实力、产...
国产信创系统   21  
  信创生态建设旨在实现信息技术领域的自主创新和安全可控,涵盖了从硬件到软件的全产业链。随着数字化转型的加速,信创生态建设的重要性日益凸显,它不仅关乎国家的信息安全,更是推动产业升级和经济高质量发展的关键力量。然而,在推进信创生态建设的过程中,面临着诸多复杂且严峻的挑战,需要深入剖析并寻找切实可行的解决方案。技术创新难题技...
信创操作系统   27  
  信创产业作为国家信息技术创新发展的重要领域,对于保障国家信息安全、推动产业升级具有关键意义。而国产芯片作为信创产业的核心基石,其研发进展备受关注。在信创国产芯片的研发征程中,面临着诸多复杂且艰巨的难点,这些难点犹如一道道关卡,阻碍着国产芯片的快速发展。然而,科研人员和相关企业并未退缩,积极探索并提出了一系列切实可行的解...
国产化替代产品目录   28  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用