我正在使用具有Lab格式(亮度,a,b)大小不同的图像的自定义数据集,这些图像被馈送到CNN中。输入层具有3个输入通道,所以我的想法是将所有3个通道(L,a,b)分开,并将其馈入网络。接下来,我想知道每个张量是否需要转置?我的怀疑是,它将失去其尺寸,该尺寸因图像而异,并且最终将无法重建图像。有什么想法或想法应如何规范化图像?
最佳答案
您可以进行归一化,而无需转置图像或根据其通道拆分图像torchvision.transforms.Normalize(mean=[l_channel_mean, a_channel_mean , b_channel_mean], std= [l_channel_mean, a_channel_mean , b_channel_mean])
唯一需要的转换是将图像转换为张量的转换:torchvision.transforms.ToTensor()
关于tensorflow - 将Tensor馈入CNN时应该转置张量吗,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58155920/