目标检测的任务是从图像中识别感兴趣目标的类别并用检测框标记其大小和位置,随着深度学习的广泛应用,目前对于图像目标检测的研究取得了巨大的进步和成果,近年来人们开始研究对视频的目标检测方法。视频是由一系列连续图像组成,其图像之间存在一定的映射关系,视频在提供更多前后文时序信息和空间信息的同时,其场景的变化也增加了许多挑战,如:目标遮挡、运动变形、光照模糊等。如果将图像目标检测方法直接用于视频的目标检测,不仅速度慢,而且效果差。所以,如何利用视频数据提供的前后信息和冗余信息,在保证检测速度的同时,解决视频目标检测中出现的漏检、误检、检测框不精准等问题是目前视频目标检测研究的重点。
针对提取图像卷积特征时丢失部分细节信息的问题,采用了基于两次特征融合的视频目标检测方法。第一次特征融合是在提取图像卷积特征时,融合其浅层、中层、深层卷积层的特征图对最终表征图像的特征图进行信息增强,保留深度语义信息的同时增添目标的轮廓、纹理等细节信息。第二次特征融合是对当前检测帧图像的特征图融合其前后帧图像的特征图,目的在于对检测帧图像出现遮挡、变形、模糊等问题时进行特征增强,补全缺失信息。
提取图像帧的特征时,卷积神经网络中不同位置得到的特征图包含的信息不同,如浅层卷积特征图包含轮廓信息,纹理信息等,而深层卷积特征图包含更多的语义信息,为了充分利用不同卷积特征图中的信息,本文在进行当前帧与其前后帧特征融合前,先分别对当前帧及其前后帧图像的浅层、中层、深层卷积特征图进行融合,保留特征图中原有的语义信息,同时增加更多的边缘和纹理信息来应对目标出现的模糊,遮挡等问题。
各类基于图像的目标跟踪方法,对比之下,兼顾了精度和速度的双重需求。
视频目标检测相较于图像目标检测,主要区别在于视频是一系列连续的图像,提供了许多前后文时序信息和冗余信息,如何利用视频的连续性信息来提高检测的准确率并降低检测耗时是目前研究视频目标检测技术的重点和难点。本发明通过多层特征的融合,很好地解决了这一问题
可应用与视频中的特定目标跟踪与识别
对于智能监控等应用有极大的帮助。
专利转让。
如您想进一步了解本项目的详细信息,可以直接拨打大市场服务部了解详情或者可在下方填写相关资讯信息及您的联系方式,我们会有专家对您的咨询进行回复。