机器也能看见你啦——opencv来啦

2026-05-06 06:05:00 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文系统介绍了OpenCV计算机视觉库的核心功能与应用场景，详细解析了图像读取、显示、保存等基础操作及图像加法、混合、缩放、旋转等处理函数的使用方法与参数说明。文档提供了可操作的技术实践指导，包括各函数的适用场景和参数配置建议，帮助开发者快速掌握OpenCV在图像处理、目标检测等领域的实际应用。 综合评分： 78 文章分类： 技术标准,安全工具,其他

图像显示

cv2.imshow(winname, mat)

在一个弹出窗口中显示加载或处理后的图像。该函数通常与 cv2.waitKey() 配合使用，否则窗口会一闪而过。它主要用于代码调试阶段，帮助开发者直观地查看图像处理的中间结果或最终效果。

| 参数名 | 说明 | | — | — | | winname | 显示窗口的名称（字符串）。 | | mat | 要显示的图像数据（NumPy 数组）。 |

按键等待

cv2.waitKey(delay)

用于绑定键盘事件并控制图像窗口的显示时长。如果 delay 设为 0，程序会无限期等待用户按下任意键；如果设为正整数（如 1000），则窗口会显示 1000 毫秒。它常紧接在 cv2.imshow() 之后，防止窗口瞬间关闭。

| 参数名 | 说明 | | — | — | | delay | 等待时间（单位：毫秒）。0 表示无限等待。 |

关闭窗口

cv2.destroyAllWindows()

销毁（关闭）所有由 OpenCV 创建的显示窗口，并释放相关的窗口资源。通常放在脚本的最后，或者在用户按下特定退出键后执行，用于清理运行环境。

| 参数名 | 说明 | | — | — | | 无 | 该函数不需要传入参数。 |

图像保存

retval = cv2.imwrite(filename, img[, params])

将处理后的图像数据保存到本地磁盘。函数会根据文件名的后缀（如 .jpg 或 .png）自动选择编码格式。常用于保存算法处理后的结果图、截图或转换格式后的图片。

| 参数名 | 说明 | | — | — | | filename | 保存的文件路径及名称（需包含后缀）。 | | img | 要保存的图像数据。 | | params | 特定格式的编码参数（可选），如压缩质量。 |

retval

: 布尔类型，保存成功返回 True。
params

: 针对特定格式的参数。
cv2.IMWRITE_JPEG_QUALITY

: JPEG 质量 (0-100)，默认 95。
cv2.IMWRITE_WEBP_QUALITY

: WEBP 质量 (0-100)，默认 95。
cv2.IMWRITE_PNG_COMPRESSION

: PNG 压缩级别 (0-9)，默认 3。

图像加法 (像素求和)

result = cv2.add(img1, img2)

将两张图像的对应像素值进行相加。与 NumPy 的加法不同，OpenCV 的 add 是饱和运算，即当结果超过 255 时会取 255（白色），而不是取模溢出。常用于图像亮度增强或简单的图像融合。

| 参数名 | 说明 | | — | — | | img1 | 第一张输入图像（需与 img2 大小、类型一致）。 | | img2 | 第二张输入图像。 |

两张图片大小必须一致。
这是饱和运算（超过 255 取 255），不同于 NumPy 的模运算。

图像混合 (加权加法)

dst = cv2.addWeighted(img1, alpha, img2, beta, gamma)

按照指定的权重（透明度）将两张图像进行融合。公式为 dst = img1 * alpha + img2 * beta + gamma。常用于制作水印、图像过渡特效，或者将两张不同曝光的照片合成一张高动态范围（HDR）图像。

| 参数名 | 说明 | | — | — | | img1 | 第一张输入图像。 | | alpha | 第一张图像的权重（透明度）。 | | img2 | 第二张输入图像。 | | beta | 第二张图像的权重。 | | gamma | 加到总和上的标量值（通常设为 0，用于调节亮度）。 |

调整大小\缩放

img_resized = cv2.resize(img, dsize, fx, fy, interpolation)

改变图像的尺寸（放大或缩小）。在深度学习中，常用于将输入图片统一缩放到模型要求的固定尺寸（如 224×224）；在日常处理中，可用于生成缩略图或放大查看细节。

| 参数名 | 说明 | | — | — | | img | 原始输入图像。 | | dsize | 输出图像的尺寸元组 (宽, 高)。 | | fx , fy | 沿 x 轴和 y 轴缩放的比例因子（若 dsize 为 0 则生效）。 | | interpolation | 插值方法，如 cv2.INTER_LINEAR（默认）、cv2.INTER_AREA（缩小推荐）。 |

常见插值方法

:
cv2.INTER_LINEAR

: 双线性插值（默认）。
cv2.INTER_NEAREST

: 最近邻插值。
cv2.INTER_AREA

: 像素区域重采样（适合图像缩小）。
cv2.INTER_CUBIC

: 双三次插值。
cv2.INTER_LANCZOS4

: Lanczos 插值（8×8 邻域）。

图像平移

img_shift = cv2.warpAffine(img, M, dsize, flags, borderMode, borderValue)

将图像在平面内沿水平或垂直方向移动指定的距离。常用于数据增强（增加训练数据的多样性）或图像校正（如将画面中的物体移动到中心位置）。

图像旋转

img_rot = cv2.warpAffine(img, M, dsize, flags, borderMode, borderValue)

根据给定的变换矩阵对图像进行旋转。通常与 cv2.getRotationMatrix2D 配合使用，用于图像矫正（如文档扫描后的摆正）或数据增强。

获取旋转矩阵

M = cv2.getRotationMatrix2D(center, angle, scale)

这是一个辅助函数，用于生成图像旋转所需的 2×3 变换矩阵。它根据指定的中心点、角度和缩放比例计算出矩阵，供 cv2.warpAffine 使用。

颜色空间转换

img_cvt = cv2.cvtColor(img, code, dstCn)

将图像从一种颜色空间转换到另一种。最常见的用途是将彩色图像转为灰度图（用于边缘检测等算法），或者转为 HSV 空间（用于基于颜色的物体追踪和分割）。

| 参数名 | 说明 | | — | — | | img | 输入图像。 | | code | 颜色转换代码，如 cv2.COLOR_BGR2GRAY。 | | dstCn | 目标图像的通道数（默认从 code 自动推导）。 |

code

: 转换标志。
cv2.COLOR_BGR2GRAY

: BGR 转灰度。
cv2.COLOR_BGR2HSV

: BGR 转 HSV。
cv2.COLOR_BGR2RGB

: BGR 转 RGB。

图像二值化 (全局阈值)

retval, dst = cv2.threshold(src, thresh, maxval,&nbsp;type)

将灰度图像转换为只有黑白两色的二值图像。如果像素值大于阈值则设为最大值（白），否则设为 0（黑）。常用于 OCR 文字识别前的预处理，或提取物体的轮廓。

| 参数名 | 说明 | | — | — | | src | 输入图像（通常为灰度图）。 | | thresh | 阈值。 | | maxval | 超过阈值时赋予的最大值（通常为 255）。 | | type | 阈值类型（如 cv2.THRESH_BINARY）。 |

retval

: 实际使用的阈值（在 Otsu 算法中有效）。
type

:
cv2.THRESH_BINARY

: 二值化。
cv2.THRESH_BINARY_INV

: 反二值化。
cv2.THRESH_TRUNC

: 截断。
cv2.THRESH_TOZERO

: 低于阈值置零。
cv2.THRESH_TOZERO_INV

: 高于阈值置零。

自适应阈值

dst = cv2.adaptiveThreshold(src, maxValue, adaptiveMethod, thresholdType, blockSize, C)

针对光照不均匀的图像进行二值化。它不是使用全局阈值，而是计算每个像素邻域的局部阈值。常用于处理阴影严重或光照变化大的文档扫描图。

adaptiveMethod

:
cv2.ADAPTIVE_THRESH_MEAN_C

: 邻域均值。
cv2.ADAPTIVE_THRESH_GAUSSIAN_C

: 邻域高斯加权和。

图像腐蚀

dst = cv2.erode(src, kernel, anchor, iterations, borderType, borderValue)

形态学操作之一，用卷积核扫描图像，只有当核内所有像素都为前景（白色）时，中心像素才保留。作用是“腐蚀”掉物体的边缘，常用于去除图像中的小白点噪声，或分离粘连的物体。

作用: 使边界向内部侵蚀，消除噪点。

图像膨胀

dst = cv2.dilate(src, kernel, anchor, iterations, borderType, borderValue)

与腐蚀相反，只要卷积核覆盖的区域内有一个像素为前景，中心像素就设为前景。作用是扩大物体的白色区域，常用于填补物体内部的小黑洞，或连接断裂的线条。

作用: 使边界向外部扩张。

开运算

dst = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)

先腐蚀后膨胀的操作。它能有效去除图像外部的小噪点（小白点），同时基本保持原物体的大小和形状不变。常用于二值图像的去噪预处理。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | cv2.MORPH_OPEN | 形态学操作类型标志。 | | kernel | 卷积核。 |

先腐蚀，后膨胀。用于去除噪点。

闭运算

dst = cv2.morphologyEx(src, cv2.MORPH_CLOSE, kernel)

先膨胀后腐蚀的操作。它能填充物体内部的小黑洞或前景物体上的小孔，也可以连接邻近的断裂处。常用于修复有缺损的文字或图案。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | cv2.MORPH_CLOSE | 形态学操作类型标志。 | | kernel | 卷积核。 |

先膨胀，后腐蚀。用于填充空洞。

梯度运算

dst = cv2.morphologyEx(src, cv2.MORPH_GRADIENT, kernel)

膨胀图与腐蚀图之差。该操作会保留物体的边缘轮廓，去除内部填充，结果看起来像物体的轮廓素描。常用于提取物体的边缘信息。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | cv2.MORPH_GRADIENT | 形态学操作类型标志。 | | kernel | 卷积核。 |

膨胀图与腐蚀图之差，提取边缘。

顶帽运算

dst = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel)

原始图像与开运算结果之差。因为开运算会去除细小的亮斑，所以顶帽运算的结果就是这些被去除的亮斑。常用于分离比邻近点亮一些的斑块，或进行不均匀光照下的背景提取。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | cv2.MORPH_TOPHAT | 形态学操作类型标志。 | | kernel | 卷积核。 |

原图与开运算结果之差。

黑帽运算

dst = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel)

闭运算结果与原始图像之差。闭运算填充了暗洞，所以黑帽运算的结果就是这些被填充的暗洞。常用于提取图像中的小黑点或孔洞。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | cv2.MORPH_BLACKHAT | 形态学操作类型标志。 | | kernel | 卷积核。 |

闭运算结果与原图之差。

均值滤波

dst = cv2.blur(src, ksize)

用卷积核覆盖区域内所有像素的平均值来代替中心像素值。这是一种最简单的平滑技术，计算速度快，但会使图像变得模糊，常用于快速去除噪声。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | ksize | 卷积核的大小，例如 (5, 5)。 |

作用: 简单的平滑处理，去除噪声。

方框滤波

dst = cv2.boxFilter(src, ddepth, ksize, anchor, normalize, borderType)

与均值滤波类似，但可以指定输出图像的深度，并选择是否进行归一化。如果不归一化，像素值可能会溢出变得很亮。常用于需要自定义滤波权重的场景。

高斯滤波

dst = cv2.GaussianBlur(src, ksize, sigmaX, sigmaY, borderType)

使用高斯核进行卷积操作，中心像素权重最高，周围像素权重随距离递减。能有效去除高斯噪声，同时较好地保留图像的边缘细节。

作用: 有效去除高斯噪声。

中值滤波

dst = cv2.medianBlur(src, ksize)

用卷积核覆盖区域内所有像素的中值来代替中心像素值。由于中值不受极端值（如噪点）影响，因此对去除椒盐噪声效果极佳。

| 参数名 | 说明 | | — | — | | src | 输入图像。 | | ksize | 卷积核大小 (必须是大于 1 的奇数)。 |

作用: 去除椒盐噪声效果极佳。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：书中自有代码来书中自有代码来书中自有代码来《机器也能看见你啦——opencv来啦》