第一点指类别不平衡性。因为在有标记的数据中,异常占的比例是非常非常低的。因此,为正事例的数据会远远的小于为负事例的数据。
第二个挑战就是基于监督的异常检测算法,要求尽可能的去识别所有的异常。因为在这样的一个问题中,将一个异常对象判别为一个正常的危害是要远远大于将一个正常的判别成为一个异常对象的危害,因此对于召回率的要求就会更高一些。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。