【正交球面正则化】让模型不偏不倚更加鲁棒的简单粗暴神器,推荐阅读和使用!!!

简介: 【正交球面正则化】让模型不偏不倚更加鲁棒的简单粗暴神器,推荐阅读和使用!!!

1、简介


深度学习模型通过使用分类交叉熵损失的在图像分类的任务中表现良好。然而,由此获得的许多模型往往存在提取特征冗余、可解释性低和校准差等一些列的问题。最近出现了一组工作试图通过建议使用新的正则化函数来解决其中一些挑战。例如,从更深层次的网络中学习到的深层特征,如图1所示。这使得模型对剪枝技术很敏感,从而导致模型的分类性能下降。

本文的动机主要来源于图像信息物理化和基于物理知识约束的深度学习模型潜在变量。其实正则化函数背后的核心思想很简单的。

许多重要的物理因素,如光线、运动、姿态,以及几何因素,如旋转群、格拉斯曼流形、微分同构群方面,具有某些自然的内在非欧几里得参数化。在一定的放宽条件下,这些因素中的每一个都可以被嵌入到具有不同维度的更大维度的超球面中。此外,使用正交性作为统计独立性的代理,得到一个正交球模型。然后可以用每个因子大小固定的块进一步放松这些约束,从而得到更简单的正交约束。它可以以闭合形式写成一个简单的标准正规性项。


2、本文方法


2.1、问题分析

如前所述,CNN模型训练使用常规的交叉熵损失自动编码不同物理因素之间的复杂交互作用,如光照和姿态。然而,所学习到的特征并不一定能够使得图像形成的基本约束或与之相关。

image.png

这些问题都和深度学习网络的深度相关,导致提取特征冗余,最终使得模型对剪枝高度敏感。当正则化函数与交叉熵损失一起使用时,可以帮助解决其中一些挑战。而本文所提的OS正则化,可以帮助自动合并不同的期望属性,同时不产生任何额外的可学习参数。

2.2、Proposed Method

所提方法的伪代码如下:

对于给定的输入图像,image.png表示CNN中特定层的全局平均池化的输出;潜层表征Z可以进一步转化为单独的特征块image.png这里表示分区的数量,d表示每个分区的长度/维数。根据设置的值,Z可以是一个横向矩阵(d<k)或纵向矩阵(d>k)。

正则化矩阵中的非对角元素使它尽可能正交。正交性的条件定义如下:

image.png

然后将这个条件作为一个简单的标准正规项应用到封闭形式的矩阵Z上,如下所示:

image.png

这里,是OS正则化器,表示Frobenius范数,I为k×k单位矩阵。同时这个函数可以与Cross Entropy Loss一起使用来约束Π模型:

image.png

3、实验结果


作者针对不同的任务和数据集分别进行实验和说明:

下面是针对Two-dimensional t-SNE使用本文所提方法以及其他方法的对比效果:

以下是不同方法对于实验中的类激活图对比:

可以看出OS方法的效果和鲁棒性还是比较好的。


4、总结


在这项工作中研究了一个简单的正交约束加在深层特征中。并提出的正交球面(OS)正则化不仅原理简单易懂,而且效果也非常的鲁棒,是一个不错的工作。

更为详细内容可以参见论文中的描述。


References


[1] Role of Orthogonality Constraints in Improving Properties of Deep Networks for Image Classification

相关文章
|
PyTorch 算法框架/工具
Pytorch中最大池化层Maxpool的作用说明及实例使用(附代码)
Pytorch中最大池化层Maxpool的作用说明及实例使用(附代码)
1441 0
|
存储 Kubernetes 关系型数据库
在Kubernetes中,helm是什么?如何使用?
【4月更文挑战第9天】在Kubernetes中,helm是什么?如何使用?
1223 5
|
10月前
|
人工智能 监控 安全
Java智慧工地(源码):数字化管理提升施工安全与质量
随着科技的发展,智慧工地已成为建筑行业转型升级的重要手段。依托智能感知设备和云物互联技术,智慧工地为工程管理带来了革命性的变革,实现了项目管理的简单化、远程化和智能化。
284 5
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
456 2
|
存储 缓存 数据库
【万字长文】微服务整合Shiro+Jwt,源码分析鉴权实战
介绍如何整合Spring Boot、Shiro和Jwt,以实现一个支持RBAC的无状态认证系统。通过生成JWT token,实现用户无状态登录,并能根据用户角色动态鉴权,而非使用Shiro提供的注解,将角色和权限信息硬编码。此外,文章还探讨了如何对Shiro的异常进行统一捕获和处理。作为应届生,笔者在学习Shiro的过程中进行了一些源码分析,尽管可能存在不足和Bug,但希望能为同样需要实现权限管理的开发者提供参考,并欢迎各位大佬指正完善。
689 65
【万字长文】微服务整合Shiro+Jwt,源码分析鉴权实战
|
存储 JSON 监控
开源日志分析Logstash
【10月更文挑战第22天】
298 1
|
IDE API 开发工具
通过IDE插件体验阿里云OpenAPI的高效集成, 精品礼品等你来拿!
轻量级的开放API工具——Alibaba Cloud Developer Toolkit及Alibaba Cloud API Toolkit。这些插件支持快速查阅阿里云产品的开放API,提供API调试与SDK示例生成等功能,帮助开发者轻松集成阿里云服务。您可通过JetBrains Marketplace或VS Code Marketplace搜索安装,完成身份验证后即刻体验。欢迎分享您的使用反馈,有机会获得精美礼品!
|
SQL 安全 API
在API 接口的设计中,如何保证数据的安全性和完整性?
在API接口设计中,确保数据安全与完整至关重要。关键措施包括:采用HTTPS协议防数据泄露;强认证机制(如OAuth2/JWT)确保用户授权;敏感数据加密(如AES);签名加时间戳防重放攻击;输入验证防SQL注入等攻击;恰当错误处理避免敏感信息泄露;限频防滥用及DDoS攻击;详尽日志记录助安全审计;数据完整性校验(如哈希比对);版本控制保兼容;严格避免响应中泄露敏感信息;定期安全审计与测试。这些措施共同保障API安全。
1782 0
|
机器学习/深度学习 传感器 SQL
领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)(下)
本文首先介绍了用于2D和3D道路数据采集的传感系统,包括摄像机、激光扫描仪和微软Kinect。随后,对 SoTA 计算机视觉算法进行了全面深入的综述,包括: (1)经典的2D图像处理,(2)3D点云建模与分割,(3)机器/深度学习。本文还讨论了基于计算机视觉的路面坑洼检测方法目前面临的挑战和未来的发展趋势: 经典的基于2D图像处理和基于3D点云建模和分割的方法已经成为历史; 卷积神经网络(CNN)已经展示了引人注目的路面坑洼检测结果,并有望在未来的进展中打破瓶颈的自/无监督学习多模态语义分割。作者相信本研究可为下一代道路状况评估系统的发展提供实用的指导。
领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)(下)