什么是特征描述符?
特征描述符是图像或图像块的表示,它通过提取有用信息并丢弃无关信息来简化图像。
通常,特征描述符将大小为 width x height x 3 (channels ) 的图像转换为长度为 n 的特征向量/数组。在 HOG 特征描述符的情况下,输入图像的大小为 64 x 128 x 3,输出特征向量的长度为 3780。
请记住,可以针对其他尺寸计算 HOG 描述符,但在这篇文章中,我坚持使用原始论文中提供的数字,以便您可以通过一个具体示例轻松理解该概念。
这一切听起来不错,但什么是“有用的”,什么是“无关的”?要定义“有用”,我们需要知道它“有用”的目的是什么?显然,特征向量对于查看图像没有用处。但是,它对于图像识别和目标检测等任务非常有用。当将这些算法产生的特征向量输入支持向量机 (SVM) 等图像分类算法时,会产生良好的结果。
但是,什么样的“特征”对分类任务有用?让我们用一个例子来讨论这一点。假设我们要构建一个对象检测器来检测衬衫和外套的纽扣。