上一课是实战内容,我们使用Python一步步搭建了一个最简单的神经网络模型,只包含单层隐藏层。并使用这个简单模型对非线性可分的样本集进行分类,最终得到了不错的分类效果。
本节将继续从深度神经网络入手,介绍深层神经网络的数学原理和推导过程。
8.1 神经网络为什么要深?
我们都知道神经网络能处理很多问题,而且效果显著。其强大能力主要源自神经网络足够“深”,也就是说网络层数越多,神经网络就更加复杂,处理数据的能力越强,模型就越具有强大的学习能力。这符合我们直观的理解。下面通过两个例子来解释其中内在的原因。
首先来看神经网络在图像处理、人脸识别领域的应用。神经网络的输入是一张图片,从计算机角度来看,接收的是一个一个像素值。神经网络的第一层主要是从原始图片中提取一些边缘信息,