摘要
在目标检测任务中, 多尺度特征在编码具有尺度方差的 目标方面具有重要意义。 多尺度特征提取的一种常见策略是采用经 典的自上而下和自下而上的特征金字塔网络。 然而, 这些方法存在 特征信息丢失或退化的问题, 削弱了非相邻层次的融合效果。 本文 提出了一种支持非相邻层次直接交互的渐近特征金字塔网络 (AFPN)。 AFPN首先融合两个相邻的低级特征, 然后逐渐将高级特 征纳入融合过程。 通过这种方式, 可以避免不相邻层次之间更大的 语义鸿沟。 考虑到在每个空间位置的特征融合过程中可能会出现多 目标信息冲突, 进一步利用自适应空间融合操作来缓解这些不一致 性。 我们将提出的AFPN纳入两阶段和一阶段目标检测框架, 并使 用MS-COCO 2017验证和测试数据集进行评估。 实验评估表明, 所 提出的方法比其他最先进的特征金字塔网络取得了更具竞争力的结 果。 代码可在https://github.com/gyyang23/AFPN上获得。
索引术语-目标检测, 特征金字塔网络, 渐近融合, 自适应空 间融合。
1、介绍
目标检测是计算机视觉中的一个基本问题, 旨在检测和 定位图像或视频中的目标。 随着深度学习的出现, 目标检 测发生了范式的转变, 基于深度学习的方法成为了主导方 法。 持续的研究导致