好吧,在机器学习中,一种防止过度拟合的方法是添加L2正则化,有人说L1正则化更好,为什么呢?我也知道使用L1来确保数据的稀疏性,对此结果的理论支持是什么?
最佳答案
L1正则化用于稀疏。这尤其有益于处理大数据的情况,因为L1比L2正则化可以生成更多的压缩模型。这主要是由于正则化参数的增加,您的最佳值为0的可能性更大。
L2正则化由于平方而惩罚更多人。当然,L2在平滑度方面更“优雅”。
您应该检查this webpage
附言
从数学上讲,更全面的解释可能不适用于此网站,例如,您可以尝试其他Stack Exchange网站
关于machine-learning - 为什么L1正则化在机器学习中起作用,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29799967/