我正在使用负二项式分布建模变量。
除了预测预期平均值,我还想对分布的两个参数进行建模。因此,我的神经网络的输出层由两个神经元组成。为此,我需要编写一个自定义损失函数。但是下面的代码不起作用-遍历张量似乎是一个问题。
我应该如何使用Keras(和TensorFlow)编写损失函数以实现负二项式分布?
我只需要使用对TensorFlow的张量友好的代码来重写此代码。根据我得到的错误,也许tensorflow.map_fn
可能会导致解决方案,但是我对此没有运气。
总体来说,这很好用,但不适用于Keras / Tensorflow
from scipy.stats import nbinom
from keras import backend as K
import tensorflow as tf
def loss_neg_bin(y_pred, y_true):
result = 0.0
for p, t in zip(y_pred, y_true):
result += -nbinom.pmf(t, p[0], min(0.99, p[1]))
return result
我得到的错误:
TypeError:仅当急切执行时,Tensor对象才可迭代
已启用。要遍历此张量,请使用tf.map_fn。
最佳答案
您需要tf.map_fn
来实现循环,而需要tf.py_func
来包装nbinom.pmf
。例如:
from scipy.stats import nbinom
import tensorflow as tf
def loss_neg_bin(y_pred, y_true):
result = 0.0
for p, t in zip(y_pred, y_true):
result += -nbinom.pmf(t, p[0], min(0.99, p[1]))
return result
y_pred= [[0.4, 0.4],[0.5, 0.5]]
y_true= [[1, 2],[1, 2]]
print('your version:\n',loss_neg_bin(y_pred, y_true))
def loss_neg_bin_tf(y_pred, y_true):
result = tf.map_fn(lambda x:tf.py_func(lambda p,t:-nbinom.pmf(t, p[0], min(0.99,p[1]))
,x
,tf.float64)
,(y_pred,y_true)
,dtype=tf.float64)
result = tf.reduce_sum(result,axis=0)
return result
y_pred_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
y_true_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
loss = loss_neg_bin_tf(y_pred_tf, y_true_tf)
with tf.Session() as sess:
print('tensorflow version:\n',sess.run(loss,feed_dict={y_pred_tf:y_pred,y_true_tf:y_true}))
# print
your version:
[-0.34313146 -0.13616026]
tensorflow version:
[-0.34313146 -0.13616026]
另外,如果使用
tf.py_func
计算负二项式的概率质量函数作为损失反馈模型,则需要自己定义梯度函数。更新-添加可微分的负二项式损失
nbinom
的概率质量函数为:nbinom.pmf(k) = choose(k+n-1, n-1) * p**n * (1-p)**k
根据scipy.stats.nbinom表示
k >= 0
。因此,我添加了可微分的负二项式损失版本。
import tensorflow as tf
def nbinom_pmf_tf(x,n,p):
coeff = tf.lgamma(n + x) - tf.lgamma(x + 1) - tf.lgamma(n)
return tf.cast(tf.exp(coeff + n * tf.log(p) + x * tf.log(1 - p)),dtype=tf.float64)
def loss_neg_bin_tf_differentiable(y_pred, y_true):
result = tf.map_fn(lambda x: -nbinom_pmf_tf(x[1]
, x[0][0]
, tf.minimum(tf.constant(0.99,dtype=tf.float64),x[0][1]))
,(y_pred,y_true)
,dtype=tf.float64)
result = tf.reduce_sum(result,axis=0)
return result
y_pred_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
y_true_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
loss = loss_neg_bin_tf_differentiable(y_pred_tf, y_true_tf)
grads = tf.gradients(loss,y_pred_tf)
y_pred= [[0.4, 0.4],[0.5, 0.5]]
y_true= [[1, 2],[1, 2]]
with tf.Session() as sess:
print('tensorflow differentiable version:')
loss_val,grads_val = sess.run([loss,grads],feed_dict={y_pred_tf:y_pred,y_true_tf:y_true})
print(loss_val)
print(grads_val)
# print
tensorflow differentiable version:
[-0.34313146 -0.13616026]
[array([[-0.42401619, 0.27393084],
[-0.36184822, 0.37565048]])]
关于python - 我应该如何使用Keras(和TensorFlow)编写损失函数以实现负二项式分布?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55782674/