我正在尝试训练一种用于检测巴基斯坦汽车牌照的模型。我发现了一种更快的技术,称为YOLO。这是链接YOLOv2
我跟随训练YOLOv2的博客是这个blog
根据此博客,我需要有汽车的图像,并且需要注释这些图像(需要标记车牌的位置)以准备测试数据和培训数据。问题是我已经有表格的训练数据
本教程要求我从这样的汽车图像中进行注释。
如果有人与YOLO合作,请告诉我如何避免标注,并使用我自己的训练数据来训练YOLO模型。
最佳答案
Yolo培训要求以下注释格式[class] [X] [Y] [W] [H]
即0 0.443359 0.434722 0.391406 0.869444
如果您具有相同的注释数据集,那么恭喜您可以开始训练。如果没有相同的名称,则可以使用github上可用的工具进行转换。
更新:注释是从中心计算的。例如。如果您使用的是x1,y1,x2,y2格式,则需要对其进行转换。
def convert_to_yolo_format(path, x1, y1, x2, y2):
"""
Definition: Converts (x1, y1, x1, y2) format to
(x, y, width, height) normalized YOLO format.
"""
size = get_img_shape(path) # size array [width,height]
dw = 1./size[0]
dh = 1./size[1]
x = (x1 + x2)/2.0 # centroid x
y = (y1 + y2)/2.0 # centroid y
w = x2 - x1 # width
h = y1 - y2 # height
x = abs(x*dw) # divide by width
w = abs(w*dw) # divide by width
y = abs(y*dh) # divide by height
h = abs(h*dh) # divide by height
return (x,y,w,h)
关于image-processing - 使用YOLO进行车牌检测,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50304871/