基于距离的异常检测办法不能够有效识别局部异常有什么举例吗?-
这里有两个簇,C1簇和C2簇。明显的C1簇的密度是比较稠密的,而C2簇的密度是比较稀疏的。对于对象O3,它离C1簇和C2簇都很远,那么O3则是一个异常对象。对象O4可以看到它基本位于C2簇的分布范围,那么他应该是一个正常对象。对象O1、O2和C1簇相比,密度分布是非常非常稀疏的,所以O1、O2相对于簇C1来说是异常对象,但是如果使用基于距离的异常检测算法,可以发现O1和O2对象的最邻近距离都会包含C1簇中的数据对象,也就是它的距离是比较小的,因为C1簇的分布是比较稠密的,它的距离往往会比C2簇中某些数据对象的距离要小。对于对象O4来说,要想把O1和O2对象在基于距离的异常检测算法中判别为异常对象,就需要调整阈值。调整阈值的结果是,所有C2的数据对象有可能会被全部判定为异常对象。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。