我指的是此链接https://richliao.github.io/supervised/classification/2016/11/26/textclassifier-convolutional上“使用CNN进行文本分类”的实现。在“简化的卷积”部分中,他们使用了以下keras层:
Conv1D(128,5,activation ='relu')
根据我的理解,参数的个数不应为5 * 100 * 128 = 64,000。但是模型摘要显示了64,128个参数。
有人可以帮助我了解我的计算错误吗?
最佳答案
窗口大小为5,输入中的通道数为100。因此,输入大小为5 * 100。您需要将128个滤波器连接到整个输入。因此,要学习5 * 100 * 128个不同的边缘权重。另外,由于存在128个滤波器,因此偏置矢量的大小为128。因此,该层要学习的参数总数为5 * 100 * 128 + 128。
关于python - 如何计算一维卷积神经网络的参数数量?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/49211957/