模型的性能度量| 学习笔记

简介: 快速学习模型的性能度量。

开发者学堂课程【机器学习算法 :模型的性能度量】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7177


模型的性能度量

 

内容介绍

一、性能度量

二、分类算法常用的性能度量

三、聚类算法常用的性能度量

 

一、性能度量

性能度量( Performance Measure):评价模型泛化能力的标准。对于不同的横型,有不同的评价标准,不同的评价标准将导致不同的评价结果。横型的好坏是相对的,取決于对于当前任务需求的完成情況。

回归模型的性能度量通常选用均方误差。

给定样例集(每个数据由一个特征和一个结果组成)D={(x1,y1),(x2,y2),...,(xm,ym)},模型为 f,其性能度量均方误差为:

图片6.png

图片7.png

比如说有两条记录,x y;可以看到有三个点都在模型对应的直线上,其中一个点有偏离。

第二个模型,样本点分布在模型对应的两侧。计算:为什么是1/4,是因为有四个样本点,我们需要计算的是均值。结果为9,也就说第一个模型均方误差是9 .同样的方法计算图二,结果是3.8583

比较两个结果,显然第二个最小,也就是说两个模型在整个样本集上的表现是第二个模型的性能好于第一个模型。所以我们会选择第二个模型。

 

二、分类算法常用的性能度量

1、错误率:分类错误的样本占总样本数的此例,其公式为:

图片8.png

2、精度:分类正确的样本占总样本数的比例,其公式为

图片9.png

3、查准率:预测结果为正的样本中实际值也为正的比例(查出来是正的真为正的的比例)

4、查全率:实际值为正的样本中被预测为正的样本的比例(具体看例子)

5、P-R 曲线:查准率-查询率曲线

6、混淆矩阵:将预测分类结果和实际分类结果做成矩阵的形式显示(与业务场景和需求有关)

7、Pβ-score:β 值的不同体现了对查全率和查准率的不同倾向,其公式为

图片10.png

(需要设置一个阀值,一般为50%。曲线就是根据这个来的)

8、受试者特征曲线(ROC)和曲线下面积。可以量化 (AUC):TPR-FPR 曲线(真正例率-假正例率曲线)

9、代价曲线:不同类型的预测错误对结果影响不同而增加代价(cost),绘制 P(+)cost - cost norm 曲线.


三、聚类算法常用的性能度量

1、外部指标:将聚类(将所有的结果聚到不同类中)结果同某个参考模型进行比较,想评估好不好就弄一个参考模型,去与参考模型比怎样,通过这种方式来衡量外部指标

(1)jaccard 系数:

图片11.png

(2)FM 指数:

图片12.png

(3)Rand 指数:

图片15.png

2、内部指标:不适用参考模型(使用参数模型比的是内部结果)直接考察聚类结果

(1)DB指数:

图片13.png

(2)DUNN指数:

图片14.png

相关文章
|
6月前
|
存储 传感器 安全
数据不是“铁打的”,从出生到销毁它也有生命周期
数据不是“铁打的”,从出生到销毁它也有生命周期
478 1
|
设计模式 缓存 JavaScript
API设计模式:REST、GraphQL、gRPC与tRPC全面解析
API设计模式:REST、GraphQL、gRPC与tRPC全面解析
586 0
|
9月前
|
JavaScript 算法
Vue 中如何手动更新虚拟 DOM?
Vue 中如何手动更新虚拟 DOM?
472 57
|
存储 缓存 NoSQL
基于SpringBoot+Redis解决缓存与数据库一致性、缓存穿透、缓存雪崩、缓存击穿问题
这篇文章讨论了在使用SpringBoot和Redis时如何解决缓存与数据库一致性问题、缓存穿透、缓存雪崩和缓存击穿问题,并提供了相应的解决策略和示例代码。
474 0
|
机器学习/深度学习 计算机视觉
【YOLOv8改进 - 注意力机制】c2f结合CBAM:针对卷积神经网络(CNN)设计的新型注意力机制
【YOLOv8改进 - 注意力机制】c2f结合CBAM:针对卷积神经网络(CNN)设计的新型注意力机制
|
前端开发 JavaScript
Vue+Echarts实现一个折线图
Vue+Echarts实现一个折线图
294 0
|
机器学习/深度学习 计算机视觉 Python
YOLOv5改进系列(2)——添加CBAM注意力机制
YOLOv5改进系列(2)——添加CBAM注意力机制
11210 1
YOLOv5改进系列(2)——添加CBAM注意力机制
|
数据库
【系统架构】ER图
【系统架构】ER图
|
机器学习/深度学习 并行计算 计算机视觉
|
SQL 安全 Devops
DevOps流水线设计的最佳实践
谈到到DevOps,持续交付流水线是绕不开的一个话题,相对于其他实践,通过流水线来实现快速高质量的交付价值是相对能快速见效的,特别对于开发测试人员,能够获得实实在在的收益。很多文章介绍流水线,不管是jenkins,gitlab-ci, 流水线,还是drone, github action 流水线, 文章都很多,但是不管什么工具,流水线设计的思路是一致的。于此同时,在实践过程中,发现大家对流水像有些误区,不是一大堆流水线,就是一个流水线调一个超级复杂的脚本,各种硬编码和环境依赖,所以希望通过这篇文章能够给大家分享自己对于Pipeline流水线的设计心得体会。
1555 1