我应该避免将L2正则化与RMSprop和NAG一起使用吗?
L2正则项会干扰梯度算法(RMSprop)吗?
此致,

最佳答案

似乎有人解决了(2018)问题(2017)。

Vanilla 自适应梯度(RMSProp,Adagrad,Adam等)与L2正则化匹配得不太好。

链接到论文[https://arxiv.org/pdf/1711.05101.pdf]和一些介绍:

关于machine-learning - 我应该避免将L2正则化与RMSProp结合使用吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42415319/

10-12 16:36