在给定图像中分割不同的对象一直是计算机视觉领域的一项众所周知的任务。多年来,我们已经看到自编码器到疯狂的深度学习模型(如 Deeplab)被用于语义分割。在所有模型的深海中,仍然有一个名字排在最前面,它就是U-Net。U-Net 于 2018 年发布,此后获得了巨大的普及,并以某种形式用于与分割相关的多种不同任务。在这篇博客中,我们将介绍 U-net 的一种变体,称为 U²-Net 或 U-squared Net。U²-Net 基本上是由 U-Net 构成的 U-Net。

因此,事不宜迟,让我们进入这篇精彩的论文。U²-Net 是为显着目标检测或 SOD而设计的。对于那些不知道的人,显着性物体检测基本上是检测给定图像中最重要或主要的物体。

U2-Net 使用嵌套 U 结构进行更深入的显着目标检测-LMLPHP

主要进展

我们的 U2-Net 的架构是一个两层嵌套的 U 结构。该设计具有以下优点:

由于在我们提出的 ReSidual U 块 (RSU) 中混合了不同大小的感受野,它能够从不同尺度捕获更多上下文信息。
由于这些 RSU 块中使用的池化操作,它增加了整个体系结构的深度而不会显着增加计算成本。

拟建网络

Residual U-Block:局部和全局上下文信息对于显着目标检测和其他分割任务都非常重要。为了降低内存和计算量,VGG16、ResNet 或 DenseNet 等网络使用较小尺寸的过滤器,通常为 1x1 或 3x3。在下图中,我们可以看到不同的网络是什么样子的。浅层的输出特征图仅包含局部特征,因为 1×1 或 3×3 过滤器的感受野太小,无法捕获全局信

11-19 08:21