我已经阅读了呈现更快的R-CNN的paper,但是我不确定区域建议是否通过滑动窗口完成。
下图使我认为这确实是一个正常的滑动窗口:
如果是的话,这不是一个坏方法吗?
最佳答案
好吧,这个数字确实的确是一个滑动窗口。但是有一个陷阱,这个滑动窗口实际上是作为卷积实现的,因此,由于卷积是一种高度优化的操作(网络的其余部分具有许多卷积层),因此可以有效地实现它。
所以它本身还不错。生成建议的功能图的大小约为7x7(取决于所使用的网络),但是通道数量却很大。这可能是更大的性能问题。
我已经阅读了呈现更快的R-CNN的paper,但是我不确定区域建议是否通过滑动窗口完成。
下图使我认为这确实是一个正常的滑动窗口:
如果是的话,这不是一个坏方法吗?
最佳答案
好吧,这个数字确实的确是一个滑动窗口。但是有一个陷阱,这个滑动窗口实际上是作为卷积实现的,因此,由于卷积是一种高度优化的操作(网络的其余部分具有许多卷积层),因此可以有效地实现它。
所以它本身还不错。生成建议的功能图的大小约为7x7(取决于所使用的网络),但是通道数量却很大。这可能是更大的性能问题。