成果展示
文章发布时间:
2025-03-07论文提出一种面向无人机目标跟踪的高效分层特征池化变压器(HFPT)模型,该模型能够有效融合卷积神经网络和Transformer架构的优势。为解决Transformer在视觉跟踪中面临的高计算成本及特征利用不足的问题,本方法提出以下三点创新:首先,创新性地将单池化操作引入Transformer的多头自注意力机制中,构建了新的骨干网络架构。该设计不仅能够有效降低特征序列长度,从而减少计算复杂度,同时又能更好地捕获丰富的上下文信息。其次,本方法将多级卷积层产生的分层特征图引入池化Transformer中进行建模。通过这种方式,可以充分学习高分辨率特征与低分辨率特征之间的相互依赖关系,提升特征表达能力。第三,为应对小目标跟踪难题,本文设计一种特征校正层,用于丰富编码特征的细节信息,进一步增强模型对小目标的识别能力。本研究选取了DTB70、UAV20L和UAV123@10fps三个公认的无人机目标跟踪基准数据集进行评估。实验结果表明,本文提出的HFPT方法在Nvidia Jetson AGX Orin边缘计算平台上实现了平均30.3帧/秒的实时处理能力,并在跟踪精度方面优于目前表现最佳的跟踪器。
论文发表于《IEEE Geoscience and Remote Sensing Letters》,该期刊是国际电气和电子工程师协会(IEEE)旗下遥感领域的权威期刊。主要侧重航空遥感科学的新想法、新结果和新发现,关注与地球、海洋、大气和空间相关的理论、概念和技术。论文作者是飞行学院王海军博士。