1 什么是目标检测?
用于判断一张图片中是否存在指定类别目标,并且输出目标坐标位置,类别和置信度。
2 目标检测是多任务还是单任务?
多任务。类别的分类和目标坐标的回归。分类和回归任务
3 单阶段和二阶段有什么区别?
二阶段第一步提取目标候选区域,第二步对提取的区域进行分类和回归。
单阶段不需要目标候选区域,直接进行目标分类和坐标回归。
4 单阶段精度为何没有双阶段高?
因为单精度负列样本过多,正样本很少.(很多anchor box都被标注为负样本,正样本只有几个)导致网络难以收敛
双阶段中Faster RCNN 中RPN首选筛选了执行度较高的候选区域,避免的了大量的负样本出现。
5 目标检测中的遮挡问题解决方案
其实现在目标检测问题中的物体对象遮挡问题也是一大难点。一般通过设计优化损失函数来解决这样的问题。
1.对于待检测目标之间的相互遮挡
通过优化损失函数,一方面对proposal向其它目标偏移或其它目标对应的proposals靠近的情况进行惩罚;另一方面设计损失函数使(1)所有的预测框逼近对应的Target框;(2)属于同一Target框的多个预测框尽量集中来解决待检测目标之前的相互遮挡。
2.对于待检测的物体被干扰物体(非检测的类别目标)遮挡,
因为算法只学习待检测的物体的特征,所以第二种遮挡只能通过增加样本来优化检测效果
6 目标检测的整体框架
1.数据集:Pacal voc 或者 coco数据集
2.数据增强和预处理:常用增强方式(概率翻转,随机裁剪,噪声,正则化,缩放)
3.目标检测主要网络(一阶段和二阶段网络的抉择)
4.评价指标:mAP
7目标检测模型评价指标
1 mAP(平均准确度值)
1.1 Precision and Recall
8 目标框重叠
解决方法:使用非极大值抑制
非极大值抑制,简称为NMS算法,英文为Non-Maximum Suppression。其思想是搜素局部最大值,抑制极大值。
前提:目标边界框列表及其对应的置信度得分列表,设定阈值,阈值用来删除重叠较大的边界框。
IoU:intersection-over-union,即两个边界框的交集部分除以它们的并集。
非极大值抑制的流程如下:
1.根据置信度得分进行排序
2.选择置信度最高的比边界框添加到最终输出列表中,将其从边界框列表中删除
3.计算所有边界框的面积
4.计算置信度最高的边界框与其它候选框的IoU。
5.删除IoU大于阈值的边界框
6.重复上述过程,直至边界框列表为空。
假设两个目标靠的很近,则会识别成一个bbox,会有什么问题,怎么解决?
当两个目标靠的非常近时,置信度低的会被置信度高的框抑制掉,从而两个目标靠的非常近时会被识别成一个bbox。为了解决这个问题,可以使用softNMS(基本思想:用稍低一点的分数来代替原有的分数,而不是直接置零)