VGG网络的基本结构

VGG网路结构-LMLPHP

如图所示,从A到E网络的深度是逐渐增加的,在A中有11个权重层(8个卷积层,3个全连接层),在E中有19个权重层(16个卷积层,3个全连接层),卷积层的宽度是十分小的,开始时在第一个卷积层只有64个filter,当经过最大池化后,倍增filter的个数,最后的卷积层是512个,在VGG中使用的filter的大小是3x3的,卷积的步长是1,空间填充的padding也是1,一共有5个最大池化层,使用的最大池化的池化区域的大小是2x2,步长也为2,是非重叠池化。

网络结构分析

由于使用了像素填充,则在滤波器与图像做卷积后,图像的分辨率是保持不变的,能够保持更多的空间信息,只有经过最大池化后,图像的分辨率才会衰减,其次在整个的VGGNet中都使用的是3x3的卷积,减少了参数的数量,因为2个3x3的卷积相当于一个5x5的卷积,3个3x3的卷积相当于一个7x7的卷积,那么2个3x3卷积的参数数量是18,1个5x5卷积的参数数量是25,参数明显减少了,其次在这里还用到了1x1的卷积,它相当于对输入进行一个线性变换,但是在卷积之后一般都会引入非线性激活函数,所以它相当于增加了非线性变换,此外用多个较小的卷积代替一个大的卷积,也能够提供更多的非线性变换。

05-07 15:17