机器人/组件/视频
视频组件分为两类。一方面,您有一个摄像机,某种形式的传输(有线或无线)和一个显示器。另一方面,您有计算机视觉。
有非常小的摄像头,有些甚至内置无线连接,它们价格便宜,几乎不需要任何外部组件。这些摄像头可以安装在机器人上,让用户通过机器人的“眼睛”观察。
如果机器人有一个机载计算机(单板计算机或笔记本电脑),则可以使用网络摄像头。这允许机器人通过网络甚至互联网进行控制。
计算机视觉是一个相对较新的领域。它试图为计算机提供眼睛,并使其能够“理解”它所看到的东西。第一步很容易。网络摄像头已经存在相当长的时间。然而,第二步,理解图像,才是困难的。
图像处理在机器人学中发挥着重要作用,计算机视觉被应用于机器人学。图像处理包含许多方面,包括:马赛克去除、图像配准、差分、识别和分割。
马赛克去除可能是图像处理中的第一步,因为它与计算机视觉有关,因为这个过程发生在图像最初捕获之后。通常,马赛克去除是一种算法,它在图像被彩色滤波阵列(CFA)处理后(例如拜耳滤波器)获取图像,并重建一个全彩色图像。左侧显示的图像是 CFA 的输出,右侧显示的图像是使用马赛克去除算法重建的图像。结果是整体细节和锐度下降,导致分辨率下降。
图像配准是将多个图像组合到单个坐标系中的过程。将图像组合到单个坐标系中,可以更轻松地处理在不同时间或从不同角度拍摄的图像中包含的数据。根据将图像组合到单个坐标系中的方式,图像配准主要有两种类型。第一种是基于强度的,它使用相关性度量来比较图像中的强度模式以将它们组合在一起。另一种方法是基于特征的,它使用图像中的点、线和轮廓来组合图像。图像配准也已用于数码摄影领域,其中使用了照片拼接过程。
图像差分用于获取两幅图像之间的变化,通过逐像素比较图像来实现。图像差分的典型应用是在交通摄像头中,需要确定图像中汽车的位置。通过拍摄一张图像并找到它与前一帧之间的差异,结果是一张类似于显示图像的图像,其中车辆的轮廓清晰地显示出来。这种方法的问题是,在汽车所在位置的图像之间存在间隙。为了解决这个问题,将当前图像与在没有汽车的情况下拍摄的库存图像之间的差异取值,可以得到一个更清晰的图像,描绘出汽车的位置。
在计算机视觉领域,图像识别过程很难实现。没有什么能够接近人类能够完成的,但机器人可以完成更简单的任务。在计算机视觉中可以完成的一些更简单的任务包括识别简单的几何形状、人脸和指纹。与图像识别相关的问题的不同方面包括:对象识别、识别和检测。图像识别的实现被称为几何散列。几何散列算法使用特定对象的模型图像(例如计算机鼠标)来查看它是否位于给定图像中。
图像分割过程用于简化图像处理的其他方面。这包括将图像分解成更小的片段,从而使对象检测和边缘检测更容易。可以使用 K 均值算法将图像分割成 K 个簇。基本算法如下所示。
// 基本 K 均值算法
1. 选择 K 个簇中心,可以是随机的,也可以基于某种启发式方法
2. 将图像中的每个像素分配给最小化像素与簇中心之间方差的簇
3. 通过对簇中的所有像素求平均值来重新计算簇中心
4. 重复步骤 2 和 3,直到达到收敛(例如,没有像素改变簇)