他们在描述Viola-Jones object detection框架(Viola和Jones的Robust实时面部检测)的论文中说:



我的问题是“他们使用哪种工具对图像进行归一化?”

我不是在寻找Viola&Jones使用的特定工具,而是会产生几乎相同输出的类似工具。我一直在关注许多haar培训教程(尝试检测手),但还不能输出良好的检测器(xml)。

我曾尝试与作者联系,但仍未得到任何回应。

最佳答案

一种可能的方法是在假设所有元素都为正态分布的情况下应用简单且简单的归一化。

首先找到平均值(Mu)和standard deviation(S):

Mu = 1/N * Sum(a[i][j]) for each i,j
S  =  sqrt(1/(N-1) *  Sum((a[i][j] - Mu)^2)) for each i,j
       (in here N is the number of pixels, 20*20 in the viola jones case)

由此,我们可以使用标准正态分布公式(通过standardizing all values)对每个像素的值进行归一化:
a'[i][j] = (a[i][j] - Mu) / S

另一个方法是vector normalization,它基本上说:
  • 查找向量的长度:|a| = sqrt(sum (a[i][j]*a[i][j])) for each i,j
  • 分配:a'[i][j] = a[i][j] / |a|
  • 关于algorithm - 如何规范图像颜色?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/13835311/

    10-12 04:49