import xml.etree.ElementTree as ET#xml 是python自带的package
import os
classes=['walnut']#写自己的分类名
pre_dir='F:/2023walnut/labels'#xml文件所在文件夹
target_dir='F:/2023walnut/yolo'#想要存储txt文件的文件夹
path=os.listdir(pre_dir)
for path1 in path:
# path1=r'C:\Users\loadlicb\Desktop\chrome_RTJOXXsYHM.xml'#xml文件路径
tree=ET.parse(os.path.join(pre_dir,path1))
root=tree.getroot()#这两个步骤将xml文件拆出来了
oo=[]
for child in root:
if child.tag == 'filename':#tag对应的是《》中的内容,text对应的是两个《》中间的部分内容
oo.append(child.text)#获得xml文件的名
# print(child.text)
for i in child:
if i.tag == 'width':#获得图片的w
oo.append(i.text)
# print(i.text)
if i.tag == 'height':#获得图片的h
oo.append(i.text)
# print(i.text)
if i.tag == 'name':#获得当前框的class
oo.append(i.text)
# print(i.text)
for j in i:
if j.tag == 'xmin':#获得当前框的两个对角线上的点的两组坐标
oo.append(j.text)
# print(j.text)
if j.tag == 'ymin':
oo.append(j.text)
# print(j.text)
if j.tag == 'xmax':
oo.append(j.text)
# print(j.text)
if j.tag == 'ymax':
oo.append(j.text)
# print(j.text)
print(oo)
filename=oo[0]#读取图片的名和宽高
filename=os.path.split(filename)
# print(filename)
name,extension=os.path.splitext(filename[1])#获取xml名和后缀
width=oo[1]
dw=1/int(width)
height=oo[2]
dh=1/int(height)
oo.pop(0)
oo.pop(0)
oo.pop(0)#删除三次oolist的0号元素
back=[]
# print((len(oo))%5)
for i in range(len(oo)//5):
for p in range(len(classes)):#划定class的序号
if classes[p] == oo[5*i]:#str == str
cl=p
back.append(cl)
x=(int(oo[5*i+1])+int(oo[5*i+3]))/2#oo里的所有元素都是str,数字也是
y = (int(oo[5 * i + 2]) + int(oo[5 * i + 4])) / 2#计算标注框的中心点的xy坐标
w=int(oo[5*i+3])-int(oo[5*i+1])
h=int(oo[5*i+4])-int(oo[5*i+2])#计算标注框的宽高
back.append('{:.4f}'.format(x*dw))
back.append('{:.4f}'.format(y * dh))
back.append('{:.4f}'.format(w * dw))
back.append('{:.4f}'.format(h * dh))
# back.append(y*dh)
# back.append(w*dw)
# back.append(h*dh)#转换到0-1区间
print(back)
# dir=r'C:\Users\loadlicb\Desktop'#label文件夹名
file=open(os.path.join(target_dir,name+'.txt'),'w')
for i in range(len(back)):
l=' '
if (i+1)%5==0:
l='\n'
file.writelines(str(back[i])+l)#完成了,现在进行批量操作修改
#完成
这个脚本中只需要修改三处地方:
——————————————今天不学习,明天变垃圾!—————————————