《飞机设计》
张永梅(1967—),女,教授,博士生导师。E-mail: ;
马健喆(1995—),男,硕士研究生。E-mail: ;
冯超(1993—),男,硕士研究生。E-mail: ;
束颉(1983—),男,讲师,博士。E-mail:
0 引言
装甲车是当代战争中的重要地面武装力量,拥有强大的破坏力以及超远射程,可对远程重要目标进行摧毁。飞机灵活性强、速度快,可以很好地进行空中支援以及对地面目标进行摧毁。
轨迹预测的目的是通过分析移动目标的历史轨迹数据来挖掘数据特征,从而得到轨迹数据模型,进一步实现轨迹的时空预测[1]。无论定位系统、社交平台或基于位置的服务软件等,都记录了移动目标的轨迹点信息。轨迹数据作为移动目标活动规律的历史依据,隐藏着大量的移动目标行为模式及潜在规律,如何从这些轨迹信息中提取有用信息,成为一个研究热点[2]。
当前轨迹预测常用的算法主要包括隐马尔可夫模型(HMM)[3]和混合高斯模型(GMM)[4-5]。HMM本质上是对时间序列的预测,但是对噪声没有较好的鲁棒性,并且随着数据集的增大,预测误差会不断累积。GMM则是一种广泛应用的基于概率统计的预测模型,它将轨迹数据视为由多个高斯过程线性组合产生,通过混合高斯建模,并利用最大似然估计算法求取模型参数,再通过高斯混合回归实现轨迹预测。但当数据复杂度提高时,GMM算法不再具有良好的适用性,而且随着数据集的增大,GMM算法的计算代价也会呈指数倍增加。
深度学习模型能够从像素级原始数据到抽象的语义概念逐层提取信息,学习高效的数据特征表示,并且模拟复杂的非线性问题,适用于多种类型的场景,具有很强的泛化能力,因此出现了基于深度学习的轨迹预测算法。
由Hochreiter等提出的长短时记忆(LSTM)网络可以更加有效地处理时间序列问题[6],现有大多数较好的轨迹预测算法都是基于LSTM的改进[7-8]。Xue等[9]设计了一种神经网络用来预测行人轨迹,着重考虑了待预测行人与其他人的位置关系,采用的网络包括基于多层感知机(MLP)的位置编码器、基于LSTM神经网络的运动编码器以及轨迹预测。
社交长短时记忆(Social-LSTM)网络是由Alahi等[10]于2016年提出的用于行人轨迹预测的网络,该算法利用了周围邻居信息,将个体周围的邻居信息引入当前轨迹预测,极大地提升了轨迹预测的效果。
目前大多数研究人员通过调整深度学习模型来实现典型目标的轨迹检测[11],利用深度学习模型的自学习特点可以很好地预测视频目标的轨迹,节省了大量的时间和人力。目前轨迹预测算法效果很好,但主要存在以下两个问题:
1)多目标跟踪是一个极具挑战的研究课题。目前视频典型目标轨迹检测算法在视频目标较少或视频目标之间不存在遮挡时,轨迹检测效果较好。但当视频目标较多时,存在漏检问题以及当视频目标之间相互遮挡或其他物体遮挡时,检测的轨迹片段不完整,影响后续视频典型目标轨迹预测。
2)目前轨迹预测算法在预测典型目标轨迹时,仅依赖其唯一的位置信息,没有考虑视频目标轨迹的上下文环境信息以及视频中多个目标轨迹间的相互影响,导致目标的轨迹预测准确率较低。
本文选取装甲车、飞机视频典型目标为移动对象,研究基于视频的多目标检测跟踪及轨迹预测算法。针对当前视频目标跟踪算法跟踪多目标时容易跟丢的问题,提出一种改进跟踪学习检测(TLD)的视频多目标检测跟踪算法,跟踪获取目标的运行行为轨迹,生成移动目标的轨迹时空图。针对目前轨迹预测算法没有考虑视频中多目标间运行轨迹影响而导致轨迹预测准确率较低的问题,提出一种基于Social-LSTM的视频典型目标轨迹预测算法,综合考虑典型目标自身运行方式以及其邻近目标运行方式对其的影响,预测视频典型目标的运行轨迹。
1 基于Social-LSTM的视频典型目标检测跟踪及轨迹预测算法
本文研究基于改进TLD的视频多目标检测跟踪算法,以获取移动目标的完整轨迹。对移动轨迹数据进行分析,提出一种基于Social-LSTM的视频典型目标预测算法,结合上下文特征信息进行预测,提高了预测的准确率。
1.1 基于改进TLD的视频多目标检测跟踪算法
视频目标轨迹获取主要包括视频目标检测和视频目标跟踪,检测视频目标的位置,再对视频目标进行跟踪,并标记视频目标在每一帧图像的位置,形成目标在视频中的运动轨迹。视频目标轨迹的获取方法主要可以分为基于深度学习结合相关滤波的跟踪方法、基于预测的跟踪方法和基于光流的跟踪方法[12]。3种方法对应的经典算法分别为用于跟踪的深度特征与相关滤波相结合的高效卷积运算符(ECO)算法[13]、Kalman滤波算法和Lucas-Kanade(LK)光流算法。虽然这3种算法能够很好地检测特定环境中的视频目标轨迹,但是在检测视频目标轨迹时仍然存在一些问题。
上一篇:基于技术的医院质控数据库系统设计与实现
下一篇:没有了