我正在尝试在https://www.kaggle.com/c/bengaliai-cv19中使用fastai库,但是找不到有关从镶木地板文件加载图像的任何文档。

我已经将实木复合地板文件转换为dataFrame,并且ImageDataBunch需要参数路径,但是image已经在dataFrame中,如何将其加载到ImageDataBunch中。

最佳答案

您可以遍历数据框并将图像保存到文件夹中,然后使用from_folder类的ImageDataBunch工厂功能。

从kaggle网站的数据描述中可以看出,parquet文件的每一行都是形状为137 x 236的测试图像。

  image_id    0    1    2    3    4    5    6    7    8  .....
0   Test_0  247  253  253  252  252  252  252  253  253  .....
1   Test_1  253  253  253  253  253  253  253  253  253  .....
2   Test_2  253  253  253  253  253  252  251  252  252  .....
.
.
.
.


我已经尝试过以获得第一张图片。

# get the image
>>> img = df.iloc[1,1:].to_numpy().astype(int).reshape(137,236)
>>> img.shape
(137, 236)

# Image_id
>>> df.iloc[1,0]
'Test_1'


希望有帮助!

09-25 22:14