本文介绍了卷积神经网络对图像有定位能力吗?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

据我所知,CNN依靠滑动窗口技术,并且只能指示某个模式是否存在于给定边界框中的任何位置。这是真的吗?



可以用CNN实现本地化而无需任何帮助?

解决方案

这是图像识别中的一个开放问题。除了滑动窗口,现有的方法包括将图像中的对象位置预测为CNN输出,预测边界(将像素分类为属于图像边界或不属于图像边界)等。例如,请参阅及其中的参考资料。



另请注意,CNN使用max-pooling,可以识别贡献于对象识别的特征检测器的位置,并使用它来建议可能的对象位置区域。


As far as I know, CNN rely on sliding window techniques and can only indicate if a certain pattern is present or not anywhere in given bounding boxes. Is that true?

Can one achieve localization with CNN without any help of such techniques?

解决方案

Thats an open problem in image recognition. Besides sliding windows, existing approaches include predicting object location in image as CNN output, predicting borders (classifiyng pixels as belonging to image boundary or not) and so on. See for example this paper and references therein.

Also note that with CNN using max-pooling, one can identify positions of feature detectors that contributed to object recognition, and use that to suggest possible object location region.

这篇关于卷积神经网络对图像有定位能力吗?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

07-27 19:28