为了理解这一概念,我阅读了Mauricio Menegaz撰写的这篇文章,并在Deeplearning.ai上观看了YouTube上的video,但是我对S x S x(B * 5 + C)部分感到困惑。我知道S x S代表网格大小,5代表边界框的组件,C代表类。 B与锚框相同吗?如果万一我只想检测一个类别(例如车牌),那是否意味着只有1个B?

编辑
在将图像输入到神经网络之前,是否在图像上创建了边界框?

最佳答案

B与锚框相同吗?


是的。 B是锚框数量


  如果万一我只想检测一个类别(例如车牌),那是否意味着只有1个B?


不,在这种情况下,C =1。但是,如果您事先知道需要检测的对象的宽高比,并且该比例在视点之间变化不大,则可能只需要匹配此比例的锚框即可,因此您的车牌,B也可以是1

但是,例如,如果您需要检测汽车,则可能需要更多的锚框,因为汽车的宽高比在视点之间会相差很大

关于machine-learning - 对YOLO流程感到困惑,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51737958/

10-13 00:02