行人检测技术是自动驾驶、机器人以及智能视频监控等研究领域的核心技术。
近日,中国科学院沈阳自动化研究所通过对基于共享特征提取网络的目标检测网络和弱监督训练语义分割网络的输出结果进行融合,得到目标最终检测结果的方法可兼顾精度与速度。
研究人员首先通过改进的YOLO检测网络对图像中目标进行了检测,得到一系列候选区域。在此基础上,分析了候选区域中虚警与漏警的成因,发现前景与背景的区分错误对检测准确率影响较大。
据此,利用通过弱监督训练的语义分割网络得到的图像像素级分类结果,将前景与背景区分开来,进而提出一种模型融合方法,将语义分割结果作为二进制掩模与原有检测结果进行融合,提升算法精度,最终完成检测。实验结果表明,算法在检测速度与精度方面都具有较高性能。
相关研究成果以“基于双模全卷积网络的行人检测算法”为题发表于《红外与激光工程》。