我正在尝试在https://www.kaggle.com/c/bengaliai-cv19中使用fastai库,但是找不到有关从镶木地板文件加载图像的任何文档。
我已经将实木复合地板文件转换为dataFrame,并且ImageDataBunch需要参数路径,但是image已经在dataFrame中,如何将其加载到ImageDataBunch中。
最佳答案
您可以遍历数据框并将图像保存到文件夹中,然后使用from_folder
类的ImageDataBunch
工厂功能。
从kaggle网站的数据描述中可以看出,parquet
文件的每一行都是形状为137 x 236
的测试图像。
image_id 0 1 2 3 4 5 6 7 8 .....
0 Test_0 247 253 253 252 252 252 252 253 253 .....
1 Test_1 253 253 253 253 253 253 253 253 253 .....
2 Test_2 253 253 253 253 253 252 251 252 252 .....
.
.
.
.
我已经尝试过以获得第一张图片。
# get the image
>>> img = df.iloc[1,1:].to_numpy().astype(int).reshape(137,236)
>>> img.shape
(137, 236)
# Image_id
>>> df.iloc[1,0]
'Test_1'
希望有帮助!