逐个元素比较两个 NumPy 数组是否相等

2025-01-16 08:38:00
admin
原创
91
摘要:问题描述:比较两个 NumPy 数组是否相等的最简单方法是什么(其中相等定义为:A = B 当且仅当对于所有索引 i A[i] == B[i]:)?只需使用==即可得到一个布尔数组: >>> numpy.array([1,1,1]) == numpy.array([1,1,1]) arra...

问题描述:

比较两个 NumPy 数组是否相等的最简单方法是什么(其中相等定义为:A = B 当且仅当对于所有索引 i A[i] == B[i]:)?

只需使用==即可得到一个布尔数组:

 >>> numpy.array([1,1,1]) == numpy.array([1,1,1])

array([ True,  True,  True], dtype=bool)

我是否必须根据and这个数组的元素来确定数组是否相等,或者是否有更简单的比较方法?


解决方案 1:

(A==B).all()

测试数组(A==B)的所有值是否为真。

注意:也许你还想测试 A 和 B 形状,例如A.shape == B.shape

特殊情况和替代方案(来自 dbaupp 的回答和 yoavram 的评论)

需要注意的是:

  • 这种解决方案在特定情况下可能会出现奇怪的行为:如果 或AB空,而另一个包含单个元素,则返回True。由于某种原因,比较A==B返回一个空数组,而all运算符返回True

  • 另一个风险是,如果AB不具有相同的形状并且不可广播,那么这种方法将引发错误。

总之,如果您对形状有疑问AB只是想安全:请使用以下专门功能之一:

np.array_equal(A,B)  # test if same shape, same elements values
np.array_equiv(A,B)  # test if broadcastable shape, same elements values
np.allclose(A,B,...) # test if same shape, elements have close enough values

解决方案 2:

解决方案(A==B).all()非常简洁,但有一些内置函数可用于完成此任务。即array_equalallclosearray_equiv

(虽然一些快速测试timeit似乎表明该(A==B).all()方法是最快的,但这有点奇怪,因为它必须分配一个全新的数组。)

解决方案 3:

如果您想检查两个数组是否具有相同的shapeAND ,elements您应该使用np.array_equal它,因为这是文档中推荐的方法。

性能方面,不要指望任何平等检查都会胜过另一个,因为没有太多优化空间comparing two elements。只是为了这个目的,我还是做了一些测试。

import numpy as np
import timeit

A = np.zeros((300, 300, 3))
B = np.zeros((300, 300, 3))
C = np.ones((300, 300, 3))

timeit.timeit(stmt='(A==B).all()', setup='from __main__ import A, B', number=10**5)
timeit.timeit(stmt='np.array_equal(A, B)', setup='from __main__ import A, B, np', number=10**5)
timeit.timeit(stmt='np.array_equiv(A, B)', setup='from __main__ import A, B, np', number=10**5)
> 51.5094
> 52.555
> 52.761

所以基本上相等,不需要谈论速度。

(A==B).all()行为与以下代码片段非常相似:

x = [1,2,3]
y = [1,2,3]
print all([x[i]==y[i] for i in range(len(x))])
> True

解决方案 4:

让我们使用下面的一段代码来测量性能。

import numpy as np
import time

exec_time0 = []
exec_time1 = []
exec_time2 = []

sizeOfArray = 5000
numOfIterations = 200

for i in xrange(numOfIterations):

    A = np.random.randint(0,255,(sizeOfArray,sizeOfArray))
    B = np.random.randint(0,255,(sizeOfArray,sizeOfArray))

    a = time.clock() 
    res = (A==B).all()
    b = time.clock()
    exec_time0.append( b - a )

    a = time.clock() 
    res = np.array_equal(A,B)
    b = time.clock()
    exec_time1.append( b - a )

    a = time.clock() 
    res = np.array_equiv(A,B)
    b = time.clock()
    exec_time2.append( b - a )

print 'Method: (A==B).all(),       ', np.mean(exec_time0)
print 'Method: np.array_equal(A,B),', np.mean(exec_time1)
print 'Method: np.array_equiv(A,B),', np.mean(exec_time2)

输出

Method: (A==B).all(),        0.03031857
Method: np.array_equal(A,B), 0.030025185
Method: np.array_equiv(A,B), 0.030141515

根据上述结果,numpy 方法似乎比==运算符和all()方法的组合更快,并且通过比较 numpy 方法,最快的方法似乎是numpy.array_equal方法。

解决方案 5:

通常两个数组会有一些小的数字错误,

您可以使用numpy.allclose(A,B),而不是(A==B).all()。这将返回布尔值 True/False

解决方案 6:

现在使用np.array_equal。来自文档:

np.array_equal([1, 2], [1, 2])
True
np.array_equal(np.array([1, 2]), np.array([1, 2]))
True
np.array_equal([1, 2], [1, 2, 3])
False
np.array_equal([1, 2], [1, 4])
False

解决方案 7:

除了其他答案之外,您现在还可以使用断言:

numpy.testing.assert_array_equal(x, y)

您也有类似的功能,例如numpy.testing.assert_almost_equal()

https://numpy.org/doc/stable/reference/ generated/numpy.testing.assert_array_equal.html

解决方案 8:

只是为了完整性。我将添加用于比较两个数组的 pandas 方法:

import pandas as pd
import numpy as np
a = np.arange(0.0, 10.2, 0.12)
b = np.arange(0.0, 10.2, 0.12)
ap = pd.DataFrame(a)
bp = pd.DataFrame(b)

ap.equals(bp)
True

仅供参考:如果您正在寻找如何在 R 中比较向量、数组或数据框,您可以使用:

identical(iris1, iris2)
#[1] TRUE
all.equal(array1, array2)
#> [1] TRUE 

解决方案 9:

A=np.array([1,2,3,4])
B=np.array([1,2,3,4])

sum(A!=B)==0

这个想法是不相等元素的总数应该为零。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1565  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1354  
  信创国产芯片作为信息技术创新的核心领域,对于推动国家自主可控生态建设具有至关重要的意义。在全球科技竞争日益激烈的背景下,实现信息技术的自主可控,摆脱对国外技术的依赖,已成为保障国家信息安全和产业可持续发展的关键。国产芯片作为信创产业的基石,其发展水平直接影响着整个信创生态的构建与完善。通过不断提升国产芯片的技术实力、产...
国产信创系统   21  
  信创生态建设旨在实现信息技术领域的自主创新和安全可控,涵盖了从硬件到软件的全产业链。随着数字化转型的加速,信创生态建设的重要性日益凸显,它不仅关乎国家的信息安全,更是推动产业升级和经济高质量发展的关键力量。然而,在推进信创生态建设的过程中,面临着诸多复杂且严峻的挑战,需要深入剖析并寻找切实可行的解决方案。技术创新难题技...
信创操作系统   27  
  信创产业作为国家信息技术创新发展的重要领域,对于保障国家信息安全、推动产业升级具有关键意义。而国产芯片作为信创产业的核心基石,其研发进展备受关注。在信创国产芯片的研发征程中,面临着诸多复杂且艰巨的难点,这些难点犹如一道道关卡,阻碍着国产芯片的快速发展。然而,科研人员和相关企业并未退缩,积极探索并提出了一系列切实可行的解...
国产化替代产品目录   28  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用