机器学习PAI我训练的AUC 0.7左右,这个效果是不是很差了?业界一般的我看都是0.8-0.9之间,数据量是百万级的样本
AUC,或称Area Under Curve,被广泛用作二分类模型的评价指标。它的取值范围在0到1之间,其中1表示完美分类器,即随机挑选一个正样本和一个负样本,正样本排在负样本前面的概率为1;0.5则表示模型的分类效果等同于随机猜测。
数值上来说,例如AUC为0.7意味着对于任一正样本和负样本,模型在70%的情况下会将正样本排在负样本前面。
虽然业界的一些报告显示AUC值通常在0.8到0.9之间,但这并不意味着0.7的AUC就是不好的。AUC值是否“好”取决于多个因素,包括数据集的大小、分布、特征等。重要的是理解AUC反映的是模型对正负样本排序的能力,而不仅仅是一个绝对的“好”或“坏”的指标。
值得注意的是,AUC仅适用于二元分类问题,并且它不考虑类别之间的阈值。对于多分类问题或者需要精确率和召回率的场景,可能需要使用其他评估指标如准确率、精准率、灵敏度等。
楼主你好,一般来说业界的AUC评估结果是在0.8到0.9之间,但恰当的评估指标取决于你正在解决的问题,以及你的数据,但是如果你觉得AUC 0.7并不能满足你的需求,你可以尝试调整模型参数,增加训练数据量等来提高效果。
机器学习PAI中训练得到的AUC 0.7左右的效果并不是特别差,但确实比业界常见的0.8-0.9之间的表现要稍微逊色一些。
AUC (Area Under the Curve) 是一种评估分类模型性能的指标,其数值范围在0到1之间,其中1代表完美分类,0.5代表随机猜测。通常情况下,AUC大于0.7就被认为是较好的模型效果。
然而,不同领域和应用场景对AUC的要求也可能有所不同,而且数据量也会对模型效果产生影响。您的百万级样本数据量相对于其他模型而言并不算太大,因此可能会影响到模型的表现。为了提高模型的性能,您可能需要尝试调整模型参数、增加更多的特征或者使用其他的模型架构。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。