我对共享变量有一点问题。代码如下:
np_array = numpy.ones(2, dtype='float32')
s_true = theano.shared(np_array,borrow=True)
np_array+=1.
print s_true.get_value()#[ 2. 2.] change np_array will change s_true
我可以理解以上内容。但反向无法正常工作,如下所示:
np_array = numpy.ones(2, dtype='float32')
s_true = theano.shared(np_array,borrow=True)
s_true+=1.0
print s_true.eval() #[ 2. 2.]
np_array #array([ 1., 1.], dtype=float32) **change s_true will not change np_array**
但是,以下工作:
s_true = theano.shared(np_array,borrow=True)
v_true=s_true.get_value(borrow=True,return_internal_type=True)
v_true+=1.0
print s_true.get_value() #[ 2. 2.] **change v_true will change s_true**
np_array #array([ 2., 2.], dtype=float32) **change v_true will change np_array**
我无法理解共享变量的逻辑,希望获得帮助
最佳答案
在theano-users mailing list上回答。
共享变量包装了一块内存,但不能保证在整个计算过程中只会使用用于初始化共享变量的那一部分内存。
在所有情况下,应将borrow=True
视为提示,而不是要遵循的明确指示。
在第一个示例中,由于borrow=True
,共享变量包装了初始的numpy数组。因此,更改numpy数组将更改共享变量的内容。但这不应该被依赖,并且对于Theano编程来说是不明智的做法。
在第二个示例中,s_true+=1.0
是符号表达式。除了将s_true
指向表示表达式的对象而不是共享变量之外,它实际上不会更改内存中的任何状态。 print s_true.eval()
显示执行符号计算的结果,但不会更改共享变量。更改共享变量内容的唯一“批准”方法是通过shared_var.set_value(...)
或通过updates=...
的theano.function(...)
机制。如第一个示例中所示,更改后备存储有时会起作用,但并非总是如此,通常应避免。
第三个示例只是第一个示例的一种更round回的方式,因此也是不好的做法。
This page in the documentation可能会有所帮助。