我已经在neural networks and deep learning中阅读了chap1,在“对手写数字进行分类的简单网络”部分中(可以使用ctrl-f搜索),我发现了一个好问题:“为什么我们应该在输出层中使用10个神经元,而不是4个?神经元?”
对于4个神经元,每个神经元的值为0或1,则表示2 ^ 4 = 16>10。那么,为什么我们在输出层中不使用4个神经元呢?
最佳答案
每个输出神经元负责一个数字。输出神经元i
(总共10个神经元)将返回输入数字为[0,1)
的概率i
。这样,您知道每个数字的概率分布,而不是将它们用作位时的单个输出(例如在2 ^ 4的示例中)。