在this有关对象检测的教程中,提到了快速R-CNN。还提到了ROI(感兴趣区域)层。
从数学上讲,当根据最终卷积层激活函数(在每个单元中)调整区域建议的大小时,会发生什么情况?
最佳答案
兴趣区域(RoI)合并:
它是一种池化层,可对大小不一的输入(此处为convnet特征图)执行最大池化,并生成固定大小(例如7x7)的小特征图。该固定大小的选择是网络超参数,并且是预定义的。
进行这种合并的主要目的是加快培训和测试时间,并从端到端(以联合方式)培训整个系统。
由于使用了该池化层,因此与原始( Vanilla ?)R-CNN架构相比,训练和测试时间更快,因此命名为Fast R-CNN。
简单示例(来自Region of interest pooling explained by deepsense.io):
关于deep-learning - 快速R-CNN中ROI层的目的是什么?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43430056/