我正在尝试为Keras(link)实现弹性的反向传播优化器,但是具有挑战性的部分是能够根据其相应的斜率是正,负还是零来对每个单独的参数执行更新。我在下面编写了代码,以开始实现Rprop优化器。但是,我似乎找不到一种单独访问参数的方法。遍历params(如下面的代码)在每次迭代时都返回p, g, g_old, s, wChangeOld,它们都是矩阵。

有没有一种方法可以迭代各个参数并更新它们?如果我可以根据其梯度的符号为参数向量建立索引,它也将起作用。

class Rprop(Optimizer):
    def __init__(self, init_step=0.01, **kwargs):
        super(Rprop, self).__init__(**kwargs)
        self.init_step = K.variable(init_step, name='init_step')
        self.iterations = K.variable(0., name='iterations')

        self.posStep = 1.2
        self.negStep = 0.5
        self.minStep = 1e-6
        self.maxStep = 50.

    def get_updates(self, params, constraints, loss):
        grads = self.get_gradients(loss, params)
        self.updates = [K.update_add(self.iterations, 1)]

        shapes = [K.get_variable_shape(p) for p in params]
        stepList = [K.ones(shape)*self.init_step  for shape in shapes]
        wChangeOldList = [K.zeros(shape) for shape in shapes]
        grads_old = [K.zeros(shape) for shape in shapes]

        self.weights = stepList + grads_old + wChangeOldList
        self.updates = []

        for p, g, g_old, s, wChangeOld in zip(params, grads, grads_old,
                                                                  stepList, wChangeOldList):
            change = K.sign(g * g_old)

            if change > 0:
                s_new = K.minimum(s * self.posStep, self.maxStep)
                wChange = s_new * K.sign(g)
                g_new = g

            elif change < 0:
                s_new = K.maximum(s * self.posStep, self.maxStep)
                wChange = - wChangeOld
                g_new = 0

            else:
                s_new = s
                wChange = s_new * K.sign(g)
                g_new = p

            self.updates.append(K.update(g_old, g_new))
            self.updates.append(K.update(wChangeOld, wChange))
            self.updates.append(K.update(s, s_new))

            new_p = p - wChange

            # Apply constraints
            if p in constraints:
                c = constraints[p]
                new_p = c(new_p)

            self.updates.append(K.update(p, new_p))
        return self.updates

    def get_config(self):
        config = {'init_step': float(K.get_value(self.init_step))}
        base_config = super(Rprop, self).get_config()
        return dict(list(base_config.items()) + list(config.items()))

最佳答案

我也在Keras中寻找RProp算法,并发现了这个问题。我随意调整您的代码以达到我的目的,然后将其重新发布到此处。到目前为止,它似乎工作得很好,但是我没有对其进行广泛的测试。

免责声明:我对keras并不陌生,但是对theano(和块)有很多经验。此外,我仅使用theano作为后端对此进行了测试,而未对tensorflow进行过测试。

class RProp(Optimizer):
    def __init__(self, init_alpha=1e-3, scale_up=1.2, scale_down=0.5, min_alpha=1e-6, max_alpha=50., **kwargs):
        super(RProp, self).__init__(**kwargs)
        self.init_alpha = K.variable(init_alpha, name='init_alpha')
        self.scale_up = K.variable(scale_up, name='scale_up')
        self.scale_down = K.variable(scale_down, name='scale_down')
        self.min_alpha = K.variable(min_alpha, name='min_alpha')
        self.max_alpha = K.variable(max_alpha, name='max_alpha')

    def get_updates(self, params, constraints, loss):
        grads = self.get_gradients(loss, params)
        shapes = [K.get_variable_shape(p) for p in params]
        alphas = [K.variable(numpy.ones(shape) * self.init_alpha) for shape in shapes]
        old_grads = [K.zeros(shape) for shape in shapes]
        self.weights = alphas + old_grads
        self.updates = []

        for param, grad, old_grad, alpha in zip(params, grads, old_grads, alphas):
            new_alpha = K.switch(
                K.greater(grad * old_grad, 0),
                K.minimum(alpha * self.scale_up, self.max_alpha),
                K.maximum(alpha * self.scale_down, self.min_alpha)
            )
            new_param = param - K.sign(grad) * new_alpha
            # Apply constraints
            if param in constraints:
                c = constraints[param]
                new_param = c(new_param)
            self.updates.append(K.update(param, new_param))
            self.updates.append(K.update(alpha, new_alpha))
            self.updates.append(K.update(old_grad, grad))

        return self.updates

    def get_config(self):
        config = {
            'init_alpha': float(K.get_value(self.init_alpha)),
            'scale_up': float(K.get_value(self.scale_up)),
            'scale_down': float(K.get_value(self.scale_down)),
            'min_alpha': float(K.get_value(self.min_alpha)),
            'max_alpha': float(K.get_value(self.max_alpha)),
        }
        base_config = super(RProp, self).get_config()
        return dict(list(base_config.items()) + list(config.items()))

重要笔记:
  • RProp通常由于以下原因而未包含在机器学习库中:除非您使用全批次学习,否则它根本不起作用。而且,只有在您进行少量培训的情况下,全批次学习才有用。
  • Adam(内置Keras)优于该RProp算法。也许是因为它就是这样,或者是因为我弄错了:)

  • 关于代码的一些注释(指的是原始变量名称):
  • wChange从未在迭代中使用,因此您无需将它们存储在永久变量中。
  • change > 0不会执行您认为的操作,因为change是张量变量。您想要的是按元素进行比较,请使用K.switch()代替。
  • 您两次使用了maxStep,而不是另一次使用minStep
  • change为零的情况可以忽略不计,因为在实践中几乎不会发生这种情况。
  • g_new = 0g_new = p都是伪造的,应该像第一个if分支一样是g_new = g
  • 关于python - 在Keras中实现Rprop算法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43768411/

    10-12 16:42