这个问题是this one的扩展。
TLDR;
我正在尝试使用自己的数据集训练TS对象检测API。为了证明概念,我决定将我的数据集坚持到Pascal VOC 2012基准。
目前,我正在尝试从Pascal VOC注释创建一个TFRecord。
看一下create_pascal_tf_record.py脚本中的this line,他们只是在抓取飞机的描述符;幸运的是一个更好的单词,文本文件。为什么会这样?其他类的描述符呢?
旁注
此文件名为airplane_train.txt,与VOC2012/ImageSets/Main/中的Pascal VOC 2012 dataset一起包含。
浏览一下这个文件,第一个条目代表一个图像名,-1或1表示这个图像是否由我们感兴趣的类(飞机)组成。
飞机列车文件的部分内容
2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033 1
2008_000036 -1
2008_000037 1
2008_000041 -1
2008_000045 -1
2008_000053 -1
2008_000060 -1
2008_000066 -1
2008_000070 -1
2008_000074 -1
2008_000085 -1
2008_000089 -1
2008_000093 -1
2008_000095 -1
2008_000096 -1
2008_000097 -1
2008_000099 -1
2008_000103 -1
2008_000105 -1
2008_000109 -1
2008_000112 -1
2008_000128 -1
2008_000131 -1
2008_000132 -1
2008_000141 -1
最佳答案
我也回答了一个类似的问题。关键是,我们目前只看飞机的train.txt文件的第一列(与其他的xxx-train.txt文件相同),让我们找出训练集中每个图像的路径。