Deformable conv赋予了CNN位置变换的能力,与普通卷积的对比如下。可以看到,在每个特征点上,会产生一个偏移,变成

不规则的卷积(感觉本质上,就是让CNN自己去学习感受野)。

Deformable Convolutional Network-LMLPHP

思想来源于STN(Spatial Transform Network),但它们有着巨大的差别:

STN得到的是全局(global)的变换,也就是说所得的的变换(旋转、缩放等)都是对整幅图片有效的,因而一幅图片只有一个变换。但许多图片是复杂的,

有多个目标,不同目标的变换方式不同,一个变换包打天下不成。因而出现了Recurrent STN,由递归产生不同的变换,作用在图中不同的目标。这种思想的效率不高,只能用于简单的情况。
     Deform-conv则不同,它产生的是稠密的(dense)偏移,每一个输入特征点(Feature_map point)均会得到一个偏移
     Deformable Convolutional Network-LMLPHP

由图中conv得到的就是偏移(offset),根据偏移,将原本规则的特征区域映射为不规则区域,进一步,因为偏移可能为小数,通过使用根据双线性插值,来抽取特征点。

参考:https://blog.csdn.net/StreamRock/article/details/80921550

05-02 01:02