融合前景注意力的轻量级交通标志检测网络

(整期优先)网络出版时间:2023-04-24
/ 2

融合前景注意力的轻量级交通标志检测网络

孙磊

320821199001192915

摘要:交通标志识别是高级辅助驾驶系统的重要组成部分,也是近年计算机视觉识别领域的重点研究对象之一.由于交通标志种类较多、形状各异,且在自然场景下,交通标志在拍摄图像中的尺寸比例较小,且存在部分遮挡和光照影响等问题,故标志识别效果不佳.本文对融合前景注意力的轻量级交通标志检测网络进行分析,以供参考。

关键词:交通标志检测;激活函数;前景注意力

引言

随着全球汽车数量的逐渐增加,智能交通系统(In‐Telligent-Traffic-System,ITS)迎来了新的发展机遇。交通标志检测与识别技术作为在ITS中的一种关键技术应用,它可以辅助驾驶员准确、高效地识别道路交通标志,有效减轻驾驶疲劳,从而保障安全驾驶。因此,在真实路况下准确并及时地检测出交通标志,对无人驾驶、高级辅助驾驶系统具有重要的现实意义。而在驾驶过程中,获取的交通标志图像存在背景复杂、目标小和光照天气变化等问题,导致交通标志的误检或漏检。

1概述

随着人工智能技术快速发展,自动驾驶成为目前热门研究领域之一。交通标志的高效检测是交通道路安全的重要保障。通过对交通标志识别,交由车载智能系统对突发情况做出抉择,减少驾驶员发生意外的几率,保证驾驶员安全。由于交通标志检测存在物体成像尺度小和变化大等问题,在检测中会出现漏检,且交通标志在形状上存在相似性,容易导致误检。目前,交通标志的检测方法主要分为两种,包括传统检测算法和基于深度学习的检测算法。传统检测算法首先通过滑动窗口分割出感兴趣区域,然后采用特征提取的方法获得交通标志的特征信息,最后通过机器学习识别交通标志类别。通过对交通标志图像进行边缘检测,再根据图像的形状特征实现实时定位。由于滑动窗口产生的候选目标物冗余度较高,导致实时性和准确性都无法达到交通标志检测的要求。

2交通标志检测方法

2.1 YOLOv3网络

YOLOv3是单阶段检测算法YOLO系列的第3个版本,其检测精度和速度都有较好的表现,所以一直深受学术界和工业界的青睐。模型由主干特征提取网络、特征利用和预测头部组成。Darknet53网络作为主干特征提取网络,其本质就是一系列卷积的过程,不断进行下采样,把输入图片的高宽不断压缩,通道数不断扩张。其重要特点是使用多个跳跃连接的残差块Resblock_body来减少参数和降低训练的难度。在特征利用方面,模型使用特征金字塔(FeaturePyramidNetwork,FPN)结构。最后,将这3个增强的特征层传入预测头中,采取分治的思想进行分类和回归,对于大的目标在最高层(19,19,1024)检测,中等的目标在中间层(38,38,512)检测,小的目标在最低层(76,76,256)检测以获得最终的预测结果。

2.2改进的特征融合模块

原YOLOv4中的颈部模块用到的是PANet、SPP,通过自上而下、自下而上的特征路径,反复融合不同特征层来提取不同特征层的特征信息,SPP将不同尺寸的特征层进行固定池化,融合多层特征来增加感受野,但PANet只是将特征层通过上采样、下采样变换为相同尺度特征层进行融合的,没有充分进行不同特征层之间的融合。将ASFF自适应特征融合改进PANet,通过对不同特征层分配自适应的权重参数来融合多尺度特征图信息,可充分融合特征信息。

2.3轻量化的主干网路

原来YOLOv4的网络计算量较大,且网络层数较深,提取到的目标位置信息不够精准。本文中使用轻量级网络MobileNetv2代替主干特征提取网络DarkNet53,整体计算量减少了80%,更方便应用于移动端和智慧交通系统。2017年轻量级网络的出现,为深度框架提供了新的网络改进方向。MobileNetv1中最重要的网络结构是深度可分离卷积:将普通卷积分为两个分卷积:首先经过深度卷积(depthwiseconvolution),对每个输入通道使用单通道的轻量级滤波器;然后通过点卷积(pointwiseconvolution)来结合之前提取到的特征特性,即减少了计算量又保证特征的完整性。但深度可分离卷积对于输入的通道数不能随意改变,所以大多数特征提取是在低维空间里进行的。而MoblieNetv2在v1的基础上又加入了线性瓶颈的逆残差结构:去除PW中的激活函数防止破坏低维空间的线性特征,从而形成LinearBottleneck;其先升维再降维的操作来均衡提取高低维度的信息,让提取到的特征更加全面。

3实验分析

3.1消融实验

为了验证SiLU、GCSPDarknet、FAPM、ResPANet、GIoU和VariFocalLoss对模型性能的影响。本文将YOLOX算法作为基线,在CCTSDB上对各部分进行消融实验,,横坐标代表迭代次数,纵坐标代表损失值,经过100次迭代后,网络的损失值趋于稳定。将LeakyRelu替换成SiLU后,mAP提升0.13%,使用GCSPDarknet网络后,mAP提升0.22%,说明鬼影模块有效提升骨干网络的特征提取能力,在引入FAPM后,mAP提升0.29%,抑制背景噪声,在加入ResPANet后,mAP提升0.22%,有效学习底部特征信息,使用GIoU训练后,mAP提升0.06%,使用VariFocalLoss进行训练,mAP提升0.22%,且各类目标的精度都达到了最优。

3.2检测效果可视化

未加入FAPM时,网络在物体的热度呈现出弥散或缺失,说明背景噪声对于目标物的聚焦是有影响的,加入FAPM后,明显抑制了物体周围噪声的影响,网络聚焦于目标,证明FAPM的有效性。为对比本文算法在交通标志检测任务中的效果,这里我们测试了YOLOv3、YOLOv4、YOLOv5、YOLOX和YOLOT的实际检测效果。与YOLOv3、YOLOv4、YOLOv5和YOLOX相比,YOLOT解决了存在的漏检和误检问题,同时对小目标和遮蔽目标的检测也有不错的表现。

结束语

在基于卷积神经网络的交通标志方法中,处于最后一层的特征提取网络会因为感受野太大,丢失前面层的高分辨率和小目标,不利于目标识别,但它包含目标的位置信息准确,可以对目标进行精确的定位;而处于特征提取网络高层次的特征语义信息较多,但它包含目标位置信息较为模糊。因此为了更好地适应大小目标均有的实时交通标志检测任务,更好地将低、中、高层的语义信息结合起来,本文将尺度为19×19的有效特征层拼接3次卷积提出的空间金字塔池化SPP模块进行加强特征提取。提出的双向金字塔结构来进一步加强特征,即直接在P3、P4、P5引入一条自下到上的增强路径,每一层包含了低、中、高层丰富的特征信息和细粒度的信息,并且额外地增强路径也可以减少底层与顶层特征融合信息路径的计算量。

参考文献

[1]姚佳娜.基于深度卷积神经网络的道路交通标志检测与识别[D].浙江科技学院,2022.

[2]陈春辉,马社祥.基于新型算子采样优化的交通标志检测网络[J].计算机工程,2022,48(10):306-312

[3]张永亮,陆阳,朱芜强,卫星,魏臻.基于多尺度特征提取与特征融合的交通标志检测[J].计算机工程,2022,48(10):270-278+287.

[4]曾雷鸣,侯进,陈子锐,周浩然.基于弱语义分割的轻量化交通标志检测网络[J].计算机工程,2022,48(09):269-276+285.

[5]王林,张文卓.一种融合注意力机制与上下文信息的交通标志检测方法[J].计算机测量与控制,2022,30(03):54-59.