我是研究递归神经网络的新手,现在对RNNLib中的参数感到困惑。具体来说,我不了解隐藏的块,隐藏的大小,输入块,子样本大小和带有mdl的内容。以我的经验,我只有输入向量,一个lstm隐藏层和softmax输出层。为什么块看起来像矩阵?

最佳答案

RNNLib实现了一种新型的RNN,即所谓的“多维递归神经网络”。以下在RNNLib页面上的引用解释说:Alex Graves,SantiagoFernández和JürgenSchmidhuber。Multidimensional recurrent neural networks人工神经网络国际会议,2007年9月,波尔图。此扩展程序旨在处理图像,视频等。如本文所述:

“ MDRNN的基本思想是替换标准中发现的单个循环连接
循环连接数与数据中维数一样多的RNN。
在前向传递过程中,在数据序列的每个点上,网络的隐藏层
从上一步开始接收外部输入及其自身的激活
所有尺寸”

我认为,这就是您有能力使用多维输入的原因。如果要使用RNNLib作为通常的一维RNN,只需为输入和LSTM块指定一维。

MDL代表“最小描述长度”代价函数,用于近似贝叶斯推断(一种正则化NN的方法)。如果要使用它,最好阅读RNNLib网站上提供的原始参考。否则,我认为可以忽略不计。

关于machine-learning - RNNlib中参数的含义,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27480878/

10-10 05:03