自定义image captioning数据集的格式整理(完整版) 作者:安静到无声 个人主页 目录 自定义image captioning数据集的格式整理(完整版) 1. 数据集的整理 1.1 将原始文件合并到uic_new_split(保证验证集和测试集数据是同步的) 1.1.1 将原始测试集,验证集和训练集合并 1.1.2 统计图片个数 1.1.3 复制异常图片 1.2 将合并文件划分新的训练,验证与测试 1.2.1 创建文件夹(训练,测试和验证) 1.2.2 按照比例将图片分配至三个文件夹下 1.2.3 统计各文件夹图片个数 1.3 更改uic.json的训