在进行图像处理之前,很多时候需要对图片先进行预处理,而最常见的预处理方法是 Resize and Crop。
在 resnet50 的实战中,在进行一张图片的推理实验之前,我们也会对输入的图像进行 Resize and Crop 操作。
这一节就介绍下这两个预处理操作。
实际上,Resize and Crop 是两种图片处理方法,Reize 代表的是对图片进行缩放,Crop 代表的是对图片进行裁剪。
为什么在 resnet50 模型推理前需要对图像做预处理
进行预处理主要有以下几个原因:
-
将输入图片尺寸标准化:很多模型要求输入图像具有固定的尺寸,这是因为很多模型的架构或者学习到的参数是针对特定的输入尺寸来设计的,例如,resnet50 通常要求输入图像的尺寸在长宽方向为224x224像素。
-
提高计算效率:如果输入的图像尺寸很大,那么在计算时就会增加计算复杂性,同时会消耗更多的计算资源。通过预处理将图像 resize 到一个较小的尺寸,可以减少计算负担,加快模型训练和推理的速度。
什么是图像的 Resize
resize 一般指的是图像在长和宽方向上的尺寸缩放。目前有很多算法可以完成图像的 resize 操作。
最常见的就是插值算法,插值算法很多同学可能接触过,大概就是通过已有的像素点来推测未知位置上的像素点的值,从而完成图像像素的填充,重建或者平滑。
常见的插值算法有以下几种:
-
邻近插值(N