如何在 OpenCV 中模板匹配简单的二维形状？-IT科技

摘要：问题描述：我想检测一个简单的 2D 棋盘上的所有棋子。问题是，我的代码只检测黑色方格上的棋子。我需要检测所有白色棋子。这是我的设置：棋盘（full_board.png）：典当 ( wp.png):预期输出（检测所有棋子）：实际输出（并非所有棋子都被检测到）：代码：import cv2 import numpy...

问题描述：

我想检测一个简单的 2D 棋盘上的所有棋子。问题是，我的代码只检测黑色方格上的棋子。我需要检测所有白色棋子。这是我的设置：

棋盘（full_board.png）：
在此处输入图片描述

典当 ( wp.png):
在此处输入图片描述

预期输出（检测所有棋子）：
在此处输入图片描述

实际输出（并非所有棋子都被检测到）：
在此处输入图片描述

代码：

import cv2
import numpy as np
import imutils

def main():
    img = cv2.imread('full_board.png', 0)   
    # Piece templates:
    img_rgb = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
    img_gray = cv2.cvtColor(img_rgb,cv2.COLOR_BGR2GRAY)

    pawn_white_template = cv2.imread('wp.png', 0)

    cv2.imshow("Template", pawn_white_template)
    cv2.waitKey(0)

    w_pawn_white, h_pawn_white = pawn_white_template.shape[::-1]

    res_pawn_white = cv2.matchTemplate(img_gray,pawn_white_template,cv2.TM_CCOEFF_NORMED)

    threshhold = 0.6
    loc = np.where(res_pawn_white >= threshhold)

    for pt in zip(*loc[::-1]):
        cv2.rectangle(img_rgb,pt,(pt[0]+w_pawn_white, pt[1]+h_pawn_white),(0,255,255),1)

    cv2.imshow('detected',img_rgb)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

改变阈值对我没有帮助。我不确定为什么它只检测黑色方形棋子。有什么想法可以检测所有棋子吗？

解决方案 1：

如果删除 alpha 通道，您将看到模板的背景是深绿色。因此它只会匹配深色背景方块。您正在使用 alpha 读取模板，但 alpha 通道不会用于模板匹配。您需要提取模板的 alpha 通道作为蒙版并使用 matchTemplate 中的蒙版选项吗？这应该可以解决问题。

您似乎还将输入转换为灰度，但尝试与彩色模板进行匹配。请注意，您可以在彩色图像上进行模板匹配。

这是没有 alpha 的模板：

在此处输入图片描述

以下是模板中的 alpha 通道：

在此处输入图片描述

请参阅https://docs.opencv.org/4.1.1/df/dfb/group__imgproc__object.html#ga586ebfb0a7fb604b35a23d85391329be

mask —— 搜索模板的掩码。它必须与 templ 具有相同的数据类型和大小。默认情况下不设置。目前，仅支持 TM_SQDIFF 和 TM_CCORR_NORMED 方法。

对于彩色图像，分子中的模板求和以及分母中的每个求和都是在所有通道上进行的，并且每个通道使用单独的平均值。也就是说，该函数可以采用颜色模板和彩色图像。结果仍然是单通道图像，这更容易分析。

这是 Python/OpenCV 中带有彩色图像和蒙版模板匹配的示例。

输入：

在此处输入图片描述

模板：

在此处输入图片描述

import cv2
import numpy as np

# read chessboard image
img = cv2.imread('chessboard.png')

# read pawn image template
template = cv2.imread('pawn.png', cv2.IMREAD_UNCHANGED)
hh, ww = template.shape[:2]

# extract pawn base image and alpha channel and make alpha 3 channels
pawn = template[:,:,0:3]
alpha = template[:,:,3]
alpha = cv2.merge([alpha,alpha,alpha])

# do masked template matching and save correlation image
correlation = cv2.matchTemplate(img, pawn, cv2.TM_CCORR_NORMED, mask=alpha)

# set threshold and get all matches
threshhold = 0.89
loc = np.where(correlation >= threshhold)

# draw matches 
result = img.copy()
for pt in zip(*loc[::-1]):
    cv2.rectangle(result, pt, (pt[0]+ww, pt[1]+hh), (0,0,255), 1)
    print(pt)

# save results
cv2.imwrite('chessboard_pawn.png', pawn)
cv2.imwrite('chessboard_alpha.png', alpha)
cv2.imwrite('chessboard_matches.jpg', result)  

cv2.imshow('pawn',pawn)
cv2.imshow('alpha',alpha)
cv2.imshow('result',result)
cv2.waitKey(0)
cv2.destroyAllWindows()

无 alpha 通道的模板：

在此处输入图片描述

提取 alpha 通道作为掩码：

在此处输入图片描述

输入的结果匹配位置：

在此处输入图片描述

但请注意，每个位置实际上都是几个附近的匹配项。因此，实际上有一个匹配项太多了。

(83, 1052)
(252, 1052)
(253, 1052)
(254, 1052)
(423, 1052)
(592, 1052)
(593, 1052)
(594, 1052)
(763, 1052)
(932, 1052)
(933, 1052)
(934, 1052)
(1103, 1052)
(1272, 1052)
(1273, 1052)
(1274, 1052)
(82, 1053)
(83, 1053)
(84, 1053)
(252, 1053)
(253, 1053)
(254, 1053)
(422, 1053)
(423, 1053)
(424, 1053)
(592, 1053)
(593, 1053)
(594, 1053)
(762, 1053)
(763, 1053)
(764, 1053)
(932, 1053)
(933, 1053)
(934, 1053)
(1102, 1053)
(1103, 1053)
(1104, 1053)
(1272, 1053)
(1273, 1053)
(1274, 1053)
(82, 1054)
(83, 1054)
(84, 1054)
(252, 1054)
(253, 1054)
(254, 1054)
(422, 1054)
(423, 1054)
(424, 1054)
(592, 1054)
(593, 1054)
(594, 1054)
(762, 1054)
(763, 1054)
(764, 1054)
(932, 1054)
(933, 1054)
(934, 1054)
(1102, 1054)
(1103, 1054)
(1104, 1054)
(1272, 1054)
(1273, 1054)
(1274, 1054)
(82, 1055)
(83, 1055)
(84, 1055)
(252, 1055)
(253, 1055)
(254, 1055)
(422, 1055)
(423, 1055)
(424, 1055)
(592, 1055)
(593, 1055)
(594, 1055)
(762, 1055)
(763, 1055)
(764, 1055)
(932, 1055)
(933, 1055)
(934, 1055)
(1102, 1055)
(1103, 1055)
(1104, 1055)
(1272, 1055)
(1273, 1055)
(1274, 1055)

处理多重匹配的正确方法是循环屏蔽相关图像中的每个匹配区域，以便避免高于阈值的附近非峰值匹配。

这是实现此目的的一种方法。

import cv2
import numpy as np
import math

# read chessboard image
img = cv2.imread('chessboard.png')

# read pawn image template
template = cv2.imread('pawn.png', cv2.IMREAD_UNCHANGED)
hh, ww = template.shape[:2]

# extract pawn base image and alpha channel and make alpha 3 channels
pawn = template[:,:,0:3]
alpha = template[:,:,3]
alpha = cv2.merge([alpha,alpha,alpha])


# set threshold
threshold = 0.89

# do masked template matching and save correlation image
corr_img = cv2.matchTemplate(img, pawn, cv2.TM_CCORR_NORMED, mask=alpha)

# search for max score
result = img.copy()
max_val = 1
rad = int(math.sqrt(hh*hh+ww*ww)/4)
while max_val > threshold:

    # find max value of correlation image
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(corr_img)
    print(max_val, max_loc)

    if max_val > threshold:
        # draw match on copy of input
        cv2.rectangle(result, max_loc, (max_loc[0]+ww, max_loc[1]+hh), (0,0,255), 2)

        # write black circle at max_loc in corr_img
        cv2.circle(corr_img, (max_loc), radius=rad, color=0, thickness=cv2.FILLED)

    else:
        break

# save results
cv2.imwrite('chessboard_pawn.png', pawn)
cv2.imwrite('chessboard_alpha.png', alpha)
cv2.imwrite('chessboard_correlation.png', (255*corr_img).clip(0,255).astype(np.uint8))
cv2.imwrite('chessboard_matches2.jpg', result)

cv2.imshow('pawn',pawn)
cv2.imshow('alpha',alpha)
cv2.imshow('result',result)
cv2.waitKey(0)
cv2.destroyAllWindows()

匹配结果：

在此处输入图片描述

以下是实际比赛情况及比分：

0.8956151008605957 (253, 1053)
0.8956151008605957 (593, 1053)
0.8956151008605957 (933, 1053)
0.8956151008605957 (1273, 1053)
0.89393150806427 (83, 1054)
0.89393150806427 (423, 1054)
0.89393150806427 (763, 1054)
0.89393150806427 (1103, 1054)
0.886812150478363 (1128, 1232)

带有圆形遮罩区域的相关图像：

在此处输入图片描述

问题描述：

解决方案 1：

云端的项目管理软件