我已经在neural networks and deep learning中阅读了chap1,在“对手写数字进行分类的简单网络”部分中(可以使用ctrl-f搜索),我发现了一个好问题:“为什么我们应该在输出层中使用10个神经元,而不是4个?神经元?”

对于4个神经元,每个神经元的值为0或1,则表示2 ^ 4 = 16>10。那么,为什么我们在输出层中不使用4个神经元呢?

最佳答案

每个输出神经元负责一个数字。输出神经元i(总共10个神经元)将返回输入数字为[0,1)的概率i。这样,您知道每个数字的概率分布,而不是将它们用作位时的单个输出(例如在2 ^ 4的示例中)。

07-24 09:53