当试图理解本文中HOG功能的大小时,我感到困惑。在Dalal的工作中,一个64 * 128像素的窗口由4 * 9 * 7 * 15 = 3780尺寸的HOG特征表示。但是在本文中,一个64 * 64像素的窗口由6 * 6 * 31的HOG特征表示。我已经阅读了引用的引用文献,但仍然不明白它是如何计算的。谁能帮助我理解每个64 * 64窗口提取6 * 6 * 31 HOG特征的想法吗?什么是像元大小,块大小和跨度在本文中?

最佳答案

您需要知道有两种不同的HOG功能。
Dalal提出了一个原始的建议(完全按照您在问题中所解释的,将图像分为块,并将块分为单元格)。第二个是UoCTTI HoG功能。

为了解释您的要求,让我首先解释数字31。这是本文描述的UoCTTI Hog功能的尺寸(PF Felzenszwalb,RB Grishick,D。McAllester和D. Ramanan。训练的基于零件的模型(PAMI,2009年)。在本文中,他们使用PCA将尺寸从36减小到13,然后执行不同类型的扩充以添加其余部分(18)。 6x6是将图像划分为单元格。

10-07 19:22
查看更多