我的theano程序中存在一个导致NaN值的错误。该文档建议使用nanguardmode来跟踪问题的根源。

当我从文档网页复制/粘贴此行时:

from theano.compile.nanguardmode import NanGuardMode


我得到:

ImportError: No module named nanguardmode


键入时找不到nanguardmode的任何符号:

help(theano.compile)


知道为什么nanguardmode不存在吗?我怎样才能解决这个问题?

编辑:

多谢您的回覆。

关于我的Theano版本,我找不到如何检查它。但我认为它是最新的:大约一个月前,我从安装网页安装了它。我在Windows 64位上。

关于detect_nan hack:事情变得更奇怪了!

第一:如果我尝试使用:

post_func=theano.compile.monitormode.detect_nan


我得到:

File "C:\SciSoft\WinPython-64bit-2.7.9.4\python-2.7.10.amd64\lib\site-packages\theano\compile\monitormode.py", line 87, in detect_nan
if (not isinstance(numpy.random.RandomState, output[0]) and

NameError: global name 'numpy' is not defined


确实,numpy没有导入到monitormode模块中……这是一个已知的错误吗?

第二:如果我尝试使用detect_nan的副本/粘贴,NaN会神奇地消失。其他所有内容保持不变,但在我的theano函数(无需反复训练模型)中没有detect_nan的情况下,我在迭代5中获得了NaN:

epoch 1, valid 28.582677 %, train 27.723320 % 0.546633
epoch 2, valid 27.814961 %, train 25.681751 % 0.500522
epoch 3, valid 27.263780 %, train 24.262972 % 0.478799
epoch 4, valid 26.938976 %, train 23.209021 % 0.463017
epoch 5, valid 50.000000 %, train 50.000000 % nan


(最后一个数字是成本值)

当我添加时

mode=theano.compile.MonitorMode(post_func=detect_nan)


对于该函数,直到迭代100(甚至更多)之前,没有NaN出现。

epoch 1, valid 28.582677 %, train 27.723320 % 0.546633
epoch 2, valid 27.814961 %, train 25.681751 % 0.500522
epoch 3, valid 27.263780 %, train 24.262972 % 0.478799
epoch 4, valid 26.938976 %, train 23.209021 % 0.463017
epoch 5, valid 26.289370 %, train 22.320902 % 0.450454
... etc ...


这里发生了什么???

最佳答案

NanGuardMode于5月1日移至Theano最新版本(来自PyLearn2)。这是在3月26日发布0.7版之后的,因此您需要从GitHub upgrade to the bleeding edge version才能使用NanGuardMode。

或者,您可以使用在debug FAQ中找到的detect_nan示例:

import numpy

import theano

# This is the current suggested detect_nan implementation to
# show you how it work.  That way, you can modify it for your
# need.  If you want exactly this method, you can use
# ``theano.compile.monitormode.detect_nan`` that will always
# contain the current suggested version.

def detect_nan(i, node, fn):
    for output in fn.outputs:
        if (not isinstance(output[0], numpy.random.RandomState) and
            numpy.isnan(output[0]).any()):
            print '*** NaN detected ***'
            theano.printing.debugprint(node)
            print 'Inputs : %s' % [input[0] for input in fn.inputs]
            print 'Outputs: %s' % [output[0] for output in fn.outputs]
            break

x = theano.tensor.dscalar('x')
f = theano.function([x], [theano.tensor.log(x) * x],
                    mode=theano.compile.MonitorMode(
                        post_func=detect_nan))

10-06 13:55