在一篇论文中,我看到了下表,其中涉及层及其各自的接收场之间的关系。我有两个问题:
1)如何计算这种关系,有没有公式可以遵循。
2)例如,在最后几层中,例如pool5
,fc6&fc7
,具有很大的接收场。 fc6&fc7的接受域为404 * 404。如果训练图像是256*256
,是否表示fc6&fc7
在256*256
的边界之外看到很多像素(或者只是浪费作为接受场的fc6&fc7
的功效)。我不确定执行分类/特征提取类型的工作时如何从特定层理解接收场的物理含义。
最佳答案
假设您有2层,中间夹有最大拉力。
第一层将是具有过滤器3X3和步幅为1X1的污染层,而不是2X2且具有2X2步幅的最大合并层,而第二层将是过滤器尺寸为3X3和步幅为1X1的污染层。
第一层从原始图像中查看3X3的新生物,因此接收场将为3X3。比最大池化层有效地对图像进行2倍的下采样,因此第二层的输入是对2倍的原始图像进行2倍采样。现在,当前层也在寻找3X3的neigbhords,但是在DOWNSAMPLED图像上效果这个滤镜会查看来自原始图像的(downsapleFactorfilterSize)X(downsapleFactorfilterSize)像素的像素!!!因此接收字段为6X6。
关于machine-learning - 特定层与其接受场之间的关系,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42262762/