从学习理论的角度L2可以防止过拟合:我们让L2的规则化项||w||2最小,可以使w中的每个元素都很小,但是不是像L1范数那样使元素等于0,而是接近于零。越小的参数说明模型越简单,越简单的模型越不容易产生过拟合的现象。通过L2范数可以防止过拟合,提升模型的泛化能力。
从优化计算的角度L2范数可以有助于处理condition number 不好地情况下矩阵求逆很困难的问题。L2范数不仅可以防止过拟合,还可以让我们的优化求解变的稳定和迅速。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。