我正在使用来自OpenCV的letter_regcog示例,它使用了来自UCI的数据集,其结构如下:

属性信息:
1. lettr大写字母(从A到Z的26个值)
2. x-box框的水平位置(整数)
3.框的y框垂直位置(整数)
4.盒宽(整数)的宽度
5.高箱体(整数)
6. onpix总像素数(整数)
7. x-bar表示框内像素的x of(整数)
8. y-bar表示框内像素的y(整数)
9. x2bar平均值x方差(整数)
10. y2bar平均值y方差(整数)
11. xybar平均值x y相关性(整数)
12. x * x * y的x2ybr均值(整数)
13. x * y * y的xy2br平均值(整数)
14. X-ege平均边缘计数从左到右(整数)
15. x-ege与y的xegvy相关(整数)
16. y-ege平均边缘计数从下到上(整数)
17. y-ege与x(整数)的yegvx相关性

例:

T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8
I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10

现在我已经对字母图像进行了分割,并且想要将其转换成这样的数据以使其识别出来,但是我不明白所有值的平均值,例如“6. onpix total#on pixel”是什么意思?您能解释一下这些值的平均值吗?谢谢。

最佳答案

我不熟悉OpenCV的letter_recog示例,但这似乎是特征 vector ,或者是有关字母图像的统计信息集,用于对字母的 future 出现进行分类。分割的结果应为您提供一个二进制掩码,在字母上带有1的符号,在其他任何地方都带有0的符号。 onpix只是字母上的像素总数,换句话说,就是二进制掩码的总和。

列表中的大多数其余值都需要根据二进制掩码中值为1的像素集来计算。 x和y只是像素的位置。例如,x-bar只是在蒙版中具有1的所有像素的所有x位置的样本均值。您应该可以轻松地在网上找到有关均值,方差,协方差和相关性的数学定义的引用。

14-17稍有不同,因为它们基于边缘像素,但是计算应该是相似的,只是在一组不同的像素上。

09-06 16:17