逐个元素比较两个 NumPy 数组是否相等

2025-01-16 08:38:00
admin
原创
93
摘要:问题描述:比较两个 NumPy 数组是否相等的最简单方法是什么(其中相等定义为:A = B 当且仅当对于所有索引 i A[i] == B[i]:)?只需使用==即可得到一个布尔数组: >>> numpy.array([1,1,1]) == numpy.array([1,1,1]) arra...

问题描述:

比较两个 NumPy 数组是否相等的最简单方法是什么(其中相等定义为:A = B 当且仅当对于所有索引 i A[i] == B[i]:)?

只需使用==即可得到一个布尔数组:

 >>> numpy.array([1,1,1]) == numpy.array([1,1,1])

array([ True,  True,  True], dtype=bool)

我是否必须根据and这个数组的元素来确定数组是否相等,或者是否有更简单的比较方法?


解决方案 1:

(A==B).all()

测试数组(A==B)的所有值是否为真。

注意:也许你还想测试 A 和 B 形状,例如A.shape == B.shape

特殊情况和替代方案(来自 dbaupp 的回答和 yoavram 的评论)

需要注意的是:

  • 这种解决方案在特定情况下可能会出现奇怪的行为:如果 或AB空,而另一个包含单个元素,则返回True。由于某种原因,比较A==B返回一个空数组,而all运算符返回True

  • 另一个风险是,如果AB不具有相同的形状并且不可广播,那么这种方法将引发错误。

总之,如果您对形状有疑问AB只是想安全:请使用以下专门功能之一:

np.array_equal(A,B)  # test if same shape, same elements values
np.array_equiv(A,B)  # test if broadcastable shape, same elements values
np.allclose(A,B,...) # test if same shape, elements have close enough values

解决方案 2:

解决方案(A==B).all()非常简洁,但有一些内置函数可用于完成此任务。即array_equalallclosearray_equiv

(虽然一些快速测试timeit似乎表明该(A==B).all()方法是最快的,但这有点奇怪,因为它必须分配一个全新的数组。)

解决方案 3:

如果您想检查两个数组是否具有相同的shapeAND ,elements您应该使用np.array_equal它,因为这是文档中推荐的方法。

性能方面,不要指望任何平等检查都会胜过另一个,因为没有太多优化空间comparing two elements。只是为了这个目的,我还是做了一些测试。

import numpy as np
import timeit

A = np.zeros((300, 300, 3))
B = np.zeros((300, 300, 3))
C = np.ones((300, 300, 3))

timeit.timeit(stmt='(A==B).all()', setup='from __main__ import A, B', number=10**5)
timeit.timeit(stmt='np.array_equal(A, B)', setup='from __main__ import A, B, np', number=10**5)
timeit.timeit(stmt='np.array_equiv(A, B)', setup='from __main__ import A, B, np', number=10**5)
> 51.5094
> 52.555
> 52.761

所以基本上相等,不需要谈论速度。

(A==B).all()行为与以下代码片段非常相似:

x = [1,2,3]
y = [1,2,3]
print all([x[i]==y[i] for i in range(len(x))])
> True

解决方案 4:

让我们使用下面的一段代码来测量性能。

import numpy as np
import time

exec_time0 = []
exec_time1 = []
exec_time2 = []

sizeOfArray = 5000
numOfIterations = 200

for i in xrange(numOfIterations):

    A = np.random.randint(0,255,(sizeOfArray,sizeOfArray))
    B = np.random.randint(0,255,(sizeOfArray,sizeOfArray))

    a = time.clock() 
    res = (A==B).all()
    b = time.clock()
    exec_time0.append( b - a )

    a = time.clock() 
    res = np.array_equal(A,B)
    b = time.clock()
    exec_time1.append( b - a )

    a = time.clock() 
    res = np.array_equiv(A,B)
    b = time.clock()
    exec_time2.append( b - a )

print 'Method: (A==B).all(),       ', np.mean(exec_time0)
print 'Method: np.array_equal(A,B),', np.mean(exec_time1)
print 'Method: np.array_equiv(A,B),', np.mean(exec_time2)

输出

Method: (A==B).all(),        0.03031857
Method: np.array_equal(A,B), 0.030025185
Method: np.array_equiv(A,B), 0.030141515

根据上述结果,numpy 方法似乎比==运算符和all()方法的组合更快,并且通过比较 numpy 方法,最快的方法似乎是numpy.array_equal方法。

解决方案 5:

通常两个数组会有一些小的数字错误,

您可以使用numpy.allclose(A,B),而不是(A==B).all()。这将返回布尔值 True/False

解决方案 6:

现在使用np.array_equal。来自文档:

np.array_equal([1, 2], [1, 2])
True
np.array_equal(np.array([1, 2]), np.array([1, 2]))
True
np.array_equal([1, 2], [1, 2, 3])
False
np.array_equal([1, 2], [1, 4])
False

解决方案 7:

除了其他答案之外,您现在还可以使用断言:

numpy.testing.assert_array_equal(x, y)

您也有类似的功能,例如numpy.testing.assert_almost_equal()

https://numpy.org/doc/stable/reference/ generated/numpy.testing.assert_array_equal.html

解决方案 8:

只是为了完整性。我将添加用于比较两个数组的 pandas 方法:

import pandas as pd
import numpy as np
a = np.arange(0.0, 10.2, 0.12)
b = np.arange(0.0, 10.2, 0.12)
ap = pd.DataFrame(a)
bp = pd.DataFrame(b)

ap.equals(bp)
True

仅供参考:如果您正在寻找如何在 R 中比较向量、数组或数据框,您可以使用:

identical(iris1, iris2)
#[1] TRUE
all.equal(array1, array2)
#> [1] TRUE 

解决方案 9:

A=np.array([1,2,3,4])
B=np.array([1,2,3,4])

sum(A!=B)==0

这个想法是不相等元素的总数应该为零。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1579  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1355  
  信创产品在政府采购中的占比分析随着信息技术的飞速发展以及国家对信息安全重视程度的不断提高,信创产业应运而生并迅速崛起。信创,即信息技术应用创新,旨在实现信息技术领域的自主可控,减少对国外技术的依赖,保障国家信息安全。政府采购作为推动信创产业发展的重要力量,其对信创产品的采购占比情况备受关注。这不仅关系到信创产业的发展前...
信创和国产化的区别   8  
  信创,即信息技术应用创新产业,旨在实现信息技术领域的自主可控,摆脱对国外技术的依赖。近年来,国货国用信创发展势头迅猛,在诸多领域取得了显著成果。这一发展趋势对科技创新产生了深远的推动作用,不仅提升了我国在信息技术领域的自主创新能力,还为经济社会的数字化转型提供了坚实支撑。信创推动核心技术突破信创产业的发展促使企业和科研...
信创工作   9  
  信创技术,即信息技术应用创新产业,旨在实现信息技术领域的自主可控与安全可靠。近年来,信创技术发展迅猛,对中小企业产生了深远的影响,带来了诸多不可忽视的价值。在数字化转型的浪潮中,中小企业面临着激烈的市场竞争和复杂多变的环境,信创技术的出现为它们提供了新的发展机遇和支撑。信创技术对中小企业的影响技术架构变革信创技术促使中...
信创国产化   8  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用