为了理解这一概念,我阅读了Mauricio Menegaz撰写的这篇文章,并在Deeplearning.ai上观看了YouTube上的video,但是我对S x S x(B * 5 + C)部分感到困惑。我知道S x S代表网格大小,5代表边界框的组件,C代表类。 B与锚框相同吗?如果万一我只想检测一个类别(例如车牌),那是否意味着只有1个B?
编辑
在将图像输入到神经网络之前,是否在图像上创建了边界框?
最佳答案
B与锚框相同吗?
是的。 B是锚框数量
如果万一我只想检测一个类别(例如车牌),那是否意味着只有1个B?
不,在这种情况下,C =1。但是,如果您事先知道需要检测的对象的宽高比,并且该比例在视点之间变化不大,则可能只需要匹配此比例的锚框即可,因此您的车牌,B也可以是1
但是,例如,如果您需要检测汽车,则可能需要更多的锚框,因为汽车的宽高比在视点之间会相差很大
关于machine-learning - 对YOLO流程感到困惑,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51737958/