我正在尝试根据伯努利分布w.r.t.计算样本的梯度。概率p(样本为1)。

我尝试同时使用tensorflow.contrib.distributions中提供的Bernoulli发行版的实现和基于此discussion的我自己的简单实现。但是,当我尝试计算梯度时,两种方法都失败了。

使用Bernoulli实现:

import tensorflow as tf
from tensorflow.contrib.distributions import Bernoulli

p = tf.constant([0.2, 0.6])
b = Bernoulli(p=p)
s = b.sample()
g = tf.gradients(s, p)

with tf.Session() as session:
    print(session.run(g))


上面的代码给我以下错误:

TypeError: Fetch argument None has invalid type <class 'NoneType'>


使用我的实现:

import tensorflow as tf

p = tf.constant([0.2, 0.6])
shape = [1, 2]
s = tf.select(tf.random_uniform(shape) - p > 0.0, tf.ones(shape), tf.zeros(shape))
g = tf.gradients(s, p)

with tf.Session() as session:
    print(session.run(g))


同样的错误:

TypeError: Fetch argument None has invalid type <class 'NoneType'>


有没有一种方法可以计算伯努利样本的梯度?

(我的TensorFlow版本是0.12)。

最佳答案

出于显而易见的原因,您无法通过离散随机节点进行反向传播。由于没有定义渐变。
但是,如果您使用由温度参数控制的连续分布来近似伯努利,则可以。

这个想法称为重新参数化技巧,并在Tensorflow概率中的RelaxedBernoulli中实现(或在TF.contrib库中实现)

Relaxed bernoulli

您可以指定伯努利(Bernoulli)的概率p,它是您的随机变量,等等。

关于tensorflow - 伯努利 sample 的梯度,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41961649/

10-12 00:26