我的图像大小为WxHx3,需要细分为21个类。使用CNN穿过某些图层后,我获得了W/4 x H/4 x 512特征图。最后,我们将使用ConvolutionalDeconvolutional层将其与softmax层中的标签进行比较。我有2种拓扑:

  Softmax_loss                                  Softmax_loss
       ^                                             ^
       |                                             |
  deconv_layer                                   conv_layer
       ^                                             ^
       |                                             |
    conv_layer                                  deconv_layer
       ^                                             ^
       |                                             |
Intermediate_layers                         Intermediate_layers
       ^                                             ^
       |                                             |
     Input                                         Input

      (1)                                           (2)


哪种拓扑更好?我见过他们两个。 FCN(用于语义分段的完全卷积网络)中的1号,VoxResNetUNet中的2号。

最佳答案

深度学习没有正确的方法。您通常会尝试一些最适合您的事情。如果您遵循fcn模型,则它的开始类似于conv->deconv->conv->deconv。语义分段中引用最多的论文都采用conv->deconv。所以我也建议第一。同样直观地,首先执行deconv没有多大意义。

关于machine-learning - 哪种拓扑最适合分割?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43555221/

10-12 19:26