二、模型评估

简介: 模型评估的相关问题

1、区别欧式距离和余正弦距离?

dd9de3e55c17e8cb13256f1f3e10534c_watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2hlZGEz,size_16,color_FFFFFF,t_70.png

2f033b13e5faf32e3bcc3a122ed34891_watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2hlZGEz,size_16,color_FFFFFF,t_70.png2、无偏估计和有偏估计的区别?

32d9d393c476b2e0c080036240f118be_20190304212324573.png

4.模型评估中不同的指标应用在什么场景中?

(1)准确率acc(分类问题)应用于样本类别比例平衡时,平均准确率,应用在不同类别样本比例非常不平衡时。

(2)针对实际的需求,权衡不同阈值下的召回率和精确率(PR曲线),使用一个指标调和平均值来综合反映模型的性能(排序模型)

(3)均方根误差用于衡量回归模型的好坏,但出现样本的离群点非常大时,从指标的角度考虑,应该选择平均绝对百分比误差指标评估

(4)二值分类器的评估指标:精确率,召回率,F1 score,PR曲线,还有一种roc曲线。 其中roc曲线能降低不同测试卷集带来的干扰,特别适用于正负样本数量不平衡的情况。若是希望看到模型在特定数据集的表现则PR曲线更加合适。

(5)欧式距离体现数值的绝对差异,余弦距离体现方向的相对差异,实际的使用看哪个的差异较为明显 kl距离,评估两个分布之间的差异

(6)A/B测试用于验证模型的最终效果,分实验组和测试组

参考:百面


目录
相关文章
|
Kubernetes 数据安全/隐私保护 Docker
k8s使用私有镜像仓库的访问凭据配置
k8s使用私有镜像仓库的访问凭据配置
783 1
|
缓存 Java 编译器
【并发编程的艺术】内存语义分析:volatile、锁与CAS
几个理解下面内容的关键点:cpu缓存结构、可见性、上一篇文章中的总线工作机制。通过系列的前面几篇文章,我们可以初步总结造成并发问题的原因,一是cpu本地内存(各级缓存)没有及时刷新到主存,二是指令重排序造成的执行乱序导致意料之外的结果,归根结底是对内存的使用不当导致的问题。
333 0
|
4月前
|
数据采集 JSON Java
Java爬虫获取1688店铺所有商品接口数据实战指南
本文介绍如何使用Java爬虫技术高效获取1688店铺商品信息,涵盖环境搭建、API调用、签名生成及数据抓取全流程,并附完整代码示例,助力市场分析与选品决策。
|
安全 网络协议 Linux
内网穿透工具Frp
【10月更文挑战第6天】内网穿透工具Frp
1412 67
|
11月前
|
机器学习/深度学习 人工智能 监控
DiffuEraser:阿里通义实验室推出的视频修复模型,支持高清修复、时间一致性优化
DiffuEraser 是阿里通义实验室推出的基于稳定扩散模型的视频修复工具,能够生成丰富的细节并保持时间一致性,适用于电影修复、监控增强等场景。
794 27
DiffuEraser:阿里通义实验室推出的视频修复模型,支持高清修复、时间一致性优化
|
6月前
|
Linux iOS开发 MacOS
硬盘分区怎么做?这几款分区工具新手也能轻松上手
本文介绍了五款实用的硬盘分区工具,满足不同用户需求。Windows用户可使用内置的磁盘管理器或DiskPart命令行工具,简单易上手;DiskGenius功能全面,适合进阶用户进行复杂操作和数据恢复;Mac用户可借助Disk Utility完成基本磁盘管理任务;Linux用户及高级玩家可选择开源工具GParted,支持多种文件系统并具备高度自由度。根据自身需求和技术水平选择合适的工具,可高效完成硬盘分区与管理。
|
缓存 前端开发 程序员
JustAuth整合第三方登录组件
【10月更文挑战第3天】
482 57
|
Linux 应用服务中间件 Shell
linux系统服务二!
本文详细介绍了Linux系统的启动流程,包括CentOS 7的具体启动步骤,从BIOS自检到加载内核、启动systemd程序等。同时,文章还对比了CentOS 6和CentOS 7的启动流程,分析了启动过程中的耗时情况。接着,文章讲解了Linux的运行级别及其管理命令,systemd的基本概念、优势及常用命令,并提供了自定义systemd启动文件的示例。最后,文章介绍了单用户模式和救援模式的使用方法,包括如何找回忘记的密码和修复启动故障。
296 5
linux系统服务二!
|
XML Java 数据格式
spring复习02,xml配置管理bean
详细讲解了Spring框架中基于XML配置文件管理bean的各种方式,包括获取bean、依赖注入、特殊值处理、属性赋值、集合类型处理、p命名空间、bean作用域及生命周期和自动装配。
spring复习02,xml配置管理bean
|
C语言
LibreCAD+Mingw编译记录
本文记录了使用MinGW编译LibreCAD的过程,包括编译成功截图、编译脚本的修改以及相关参考链接。文章提供了详细的批处理脚本,用于设置编译环境、清理构建、编译程序以及部署安装包。
293 0
LibreCAD+Mingw编译记录