卷积神经网络(CNN或ConvNet)是一种特殊的多层神经网络,旨在以最少的预处理直接从像素图像中识别视觉模式。ImageNet项目是一个大型视觉数据库,设计用于视觉对象识别软件研究。ImageNet 项目举办年度软件竞赛,即 ImageNet 大规模视觉识别挑战赛 (ILSVRC),软件程序竞相正确分类和检测对象和场景。在这里,我将讨论ILSVRC顶级竞争对手的CNN架构。

【回顾经典AI神作】卷积神经网络CNN架构系列:LeNet,AlexNet,VGG,GoogLeNet,ResNet-LMLPHP

LeNet-5

LeNet-5是LeCun等人在7年开创的1998级卷积网络,用于对数字进行分类,被几家银行应用于识别以32x32像素灰度输入图像数字化的支票(支票)上的手写数字。处理更高分辨率图像的能力需要更大和更多的卷积层,因此这种技术受到计算资源可用性的限制。

【回顾经典AI神作】卷积神经网络CNN架构系列:LeNet,AlexNet,VGG,GoogLeNet,ResNet-LMLPHP

AlexNet

2012年,AlexNet的表现明显优于之前

05-31 13:15