基于质心分水岭算法的静态手势分割算法模型分析

(整期优先)网络出版时间:2024-03-12
/ 2

基于质心分水岭算法的静态手势分割算法模型分析

梁洁雅,杨志坚,张浩,丁鹤荣,张苗苗

北方自动控制技术研究所          山西 太原        030000

摘 要:为了能够有效解决类肤色背景下图像中高效分割静态手势困难的问题,本文将利用质心分水岭算法的静态手势分割算法模型,通过实验发现,该模型对于静态手势的识别率已经达到97.63%。

关键词:质心分水岭算法静态手势分割模型

近几年,由于计算机技术的发展与普及,使得人机互动的方式越来越丰富,越来越广泛地渗透到人们的学习、工作与生活之中。在这些研究当中,手势作为一种最古老、最普遍、最通用的一种日常沟通方式,因此,以手势为基础的人机交互研究受到极大的重视,尤其是在一些不能通用的语言环境下。手势交互分为两大类,静态手势是描述特定时刻手势的形式,而动态手势则是一系列动作在时间顺序上所代表的意义。传统的手势辨识必须依赖特定的硬件装置,利用多种不同的传感器获得使用者的关节部位,从而完成手势的辨识。这种方法在更精确的情况下,会导致手势识别的成本增大,并且会让使用者的操作体验变得很差,从而制约了其应用范围。目前,以机器视觉技术为基础的手势识别技术以其硬件成本低、使用方便、易获得等优势,已逐渐成为研究的焦点,其研究内容涉及模式识别、图形学、计算机视觉以及人工智能等多个学科,具有广泛的应用价值。

1.质心分水岭算法的手势分割和识别

以 ICWA架构为基础的手势智能识别系统的步骤为手势定位、手势分割及手势辨识,研究流程如下(详见图1所示):(1)在单目视觉环境下获取影像信息,并对手势进行定位。(2)采用 ICWA算法从基于类肤色的背景中提取出肤色范围;(3)保持肤色范围,剔除多余的手臂区域;(4)基于深度学习网络的手势辨识。

图1 手势分割与识别流程图

2. 手势分割原理及步骤

2.1肤色分割

在人脸识别、手势识别等领域,肤色信息是一种常用的方法。在手势识别领域,通过选取适当的肤色空间(如:HSV、HSI、RGB、YUV、YCrCb),通过采集不同肤色图像的肤色信息,通过选择适当的阈值,即可完成不同肤色区域的自动分割。针对人脸肤色提取过程中对肤色变化非常敏感的问题,提出了一种基于 YCrCb的肤色提取方法。通过对该算法的研究和实际应用,证明YCrCb空间是一种较好的彩色图像分割方法。通过多次试验发现 YCrCb空间是最适用于黄种人肤色分割,并且黄种人肤色分割的阈值取为 Y>80,133< Cr<173,77< Cb<127。在对该算法进行改进的基础上,就能实现对肤色区和非肤色区的分割。

2.2手势区域提取

在传统 YCrCb空间的肤色分割算法无法精确地完成手势的精确分割,首先,由于图像中存在大量的粗糙点空洞点等,因此,采用形态学上的开运算和闭运算来实现对原始静态手势图的精确分割与提取,从而实现对图像数据噪声的消除,使图像中的手势类肤色区域边缘变得更加光滑,从而实现了对肤色与类肤色区域的准确分割。

2.3肤色与类肤色区域分割

分水岭算法是一种以计算机形态学为基础的图像分割方法,其可以有效地将物体的边缘连接起来,因此在数字图像处理中得到了越来越多地使用。经典的 WA算法以拓扑结构为基础,把一幅影像看作是一张地图,各像素(x,y)的坐标表示为地形图上的平面坐标,而这个像素的灰度值就是地形图上的高程。每个当地极小点被称作有水的盆地,会对邻近地区造成一定影响。然而,传统的 WA算法采用的是一种以灰度为基础的算法,所以在图像中存在大量局部极值时就会产生大量的初始分割点,造成“过分割”的现象,影响分割的效果。本文所提出的ICWA整体算法的具体流程如下:(1)利用高斯滤波法对已关闭运算的灰阶图像进行消噪处理。其中,高斯滤波器能有效地去除许多非有效的局部极小值,从而避免对图像进行过分划分。(2)对开闭运算后的灰度图像进行Hu矩计算,然后根据Hu矩特性求出质心坐标值。(3)用高斯滤波器对图像的形心和梯度进行滤波,求取其局部最小值(通过多次试验证明,此处选取小于22的梯度),然后逐步进行分段填补。通过 ICWA方法的比较试验表明,与常规 WA方法存在的过度分割问题不同,本文提出的方法能够较好地分割和提取出淡蓝色的手部区域,并且能够精确地将其他颜色相似的区域剔除。另外,ICWA图像分割和处理后的图像边缘也有许多毛刺,所以有必要对图像做一个中间滤波处理。

3.实验结果比较与分析

本文采用经典 SIFT方法对无类肤色背景的静止手势图像进行特征点匹配,以实现对不含肤色静止手势图像的精确定位;在该方法中,手势旋转、光照等因素的影响可能会引起特征点的抽取与匹配错误,进而影响到图像的识别精度,另外,本文还将传统的 WA与主动标记的分水岭算法 AMWA与 ICWA做了比较。实验表明,WA方法尽管可以有效地对肤色和类肤色区域进行有效地划分,但是过度划分导致手势的碎片化,从而降低随后的识别精度。修正后的 AMWA方法尽管没有过度划分,但肤色和类肤色区域相似的部分没有区别,因此对正确的分类精度也有很大的影响。然而,本文所提出的 ICWA方法由于融合了高斯滤波器,能够更精确地进行手部的分区,而且仅使用一个质心点就能避免以往静态手势的过度切割以及不能完整分割的缺点。通过对 ICWA图像进行预处理,得到48x48个像素的图像,并在 LeNet CNN上进行识别,取得了良好的识别结果。采用常规 SIFT对9个姿势的识别率仅为83.04%,而我们采用的神经网络+自适应神经网络模型在实际应用中具有更好的识别率,识别率为97.63%。利用 Marcel 标准手势数据集并对 ICWA与传统分水岭算法进行比较,详见图2所示,由试验可知,传统分水岭算法ICWA+ LeNet CNN的分类效果明显要比分水岭算法+ LeNet CNN方法的识别效果更加精确。

图2  传统分水岭算法 (WA) 与 ICWA 的平均识别率比较

结束语:

综上所述,本文通过实验发现基于质心分水岭算法的静态手势分割算法能够准确、有效地识别出图像中的静态手势,并对其进行分割和提取,希望通过本文的论述能够为静态手势的快速识别提供理论支持。

参考文献

[1]董旭德,许源平,舒红平,等.基于质心分水岭算法的静态手势分割算法模型[J].智能系统学报, 2019(12):109-110.

[2]陈小梅,倪国强,刘明奇.基于分水岭算法的红外图像分割方法[J].光电子.激光, 2019(05):203-204.

[3]唐金尤,范彦斌,姚锡凡.基于分水岭算法的彩色图像分割[J].佛山科学技术学院学报:自然科学版, 2019(11):154-155.