备案控制台

开发者社区 ModelScope模型即服务文章正文

【最强模型之道】AWS Auto-Aug:通过Weight共享改进自动数据增广，打造最高精度单模型

2023-05-18 465

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【最强模型之道】AWS Auto-Aug:通过Weight共享改进自动数据增广，打造最高精度单模型

1 Introduction

深度学习技术在计算机视觉领域得到了大量应用，在图像分类、目标检测、图像分割、图像描述、人体姿态估计等许多任务中都取得了显著地进展。而过拟合是深度学习中一个广泛存在而又很难回避的问题。很多学者针对不同的任务也提出了不同的正则化方法来缓解过拟合的问题。

数据增强是将具有语义不变性的图像变换方法应用于训练数据中以增加数据的数量和多样性，该方法简单有效，同时也是最常用的正则化方法。对于图像数据，有各种常用的增强操作，包括传统的图像转换，如调整大小、裁剪、剪切、水平翻转、平移和旋转。最近，一些特殊的操作被提出，如Cutout和Sample Pairing。

但是，选择适当的数据增强策略非常耗时，并且需要经验丰富的专家大量努力。因此，自动增强技术被用来根据特定的数据集和模型进行搜索性能增强策略。

2 本文方法

2.1 Motivations

为了验证Data Augmentation可以缓解过拟合的问题，作者探究了性能增加和周期增加之间的关系。在Cifar-10上使用ResNet-18总共训练了300个Epoch，其中一些被AutoAug的搜索策略扩充数据。具体来说增加的开始或结束 Epoch，表示数量扩张的时代。

主要证明了两点:

1)、在增大Epoch 数相同的情况下，在后期进行数据增强可以不断获得较好的模型性能，虚线曲线总是在实线曲线之上。
2)、为了将模型训练到相同的性能水平，在后期进行数据增强比在早期进行数据增强需要的Epoch更少，因为虚线总是在实线的左边。

综上所述，实证结果表明，在训练的后期，数据增强的作用更大，可以利用它对不同的增强策略产生有效和可靠的奖励估计。

2.2、Augmentation-Wise Weight Sharing

本文提出了一种新的用于自动增强方法。它包括两个阶段：

第一阶段，选择一个共享的增强策略来训练共享的权值，即基于增强的共享模型权值。借鉴了NAS中的权重共享方法，在不同的网络架构中共享权重，以加快搜索速度。
第二阶段，进行有效的策略搜索。可靠性在后期更多地作为增强操作功能。

2.3、 Auto-Aug Formulation

本文的搜索数据扩充策略为一个特定的模型表示ω，参数化的ω。这里将增强策略看作是对候选图像变换的一个分布函数，它是由线性变换控制的。最优增强策略可以描述为一个优化问题。通过求解最优ω来固定以得到最优的权重优化模型，进而得到最优的增强策略。

式中L为损失函数，即交叉熵损失。

外部层是增强策略优化，即对策略参数进行优化给出了内部层次问题的结果。值得注意的是，的优化的目的是验证准确性ACC

表示参数的最优值和ω表示验证准确性。于是该问题便是一个典型的优化问题。

2.4、Proxy Task

在观察到后期的增强操作比早期的增强操作影响更大的情况下，本文提出了一种新的Proxy任务，该Proxy任务用计算效率评估过程代替了内部层优化的求解过程。

Proxy任务是通过2个part来训练增强的参数ω：

第一个part：采用共享增强策略对网络进行训练，而不考虑外部优化给出的当前策略；
第二个part：通过给定策略的加权，对网络模型的扩展共享权值进行微调，以评估该策略的性能。

由于第一个part中共享的增强训练独立于给定的策略冗余，对于所有候选的增强策略只需训练一次就可以进行搜索，大大加快了优化速度。

此外，通过调整微调的次数，还可以在很大程度上保持评估的可靠性。

3 消融实验

3.1、Cifar10实验

3.2、Cifar100实验

3.3、ImageNet实验

更为详细内容可以参见论文中的描述。

文章标签：

计算机视觉

机器学习/深度学习

网络架构

文件存储

5i77ajz5u7ji6

目录

相关文章

月照银海似蛟龙

|

编解码索引

pcl 无序点云数据空间变化检测

pcl 无序点云数据空间变化检测

月照银海似蛟龙

574 0 0

pcl 无序点云数据空间变化检测

栈江湖

|

12月前

|

网络协议安全网络安全

探索网络模型与协议：从OSI到HTTPs的原理解析

OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层，而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据，确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤，以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤，确保用户与服务器之间的安全通信。

栈江湖

717 3 3

奔跑的数据

|

数据采集存储 JavaScript

如何使用Cheerio与jsdom解析复杂的HTML结构进行数据提取

在现代网页开发中，复杂的HTML结构给爬虫技术带来挑战。传统的解析库难以应对，而Cheerio和jsdom在Node.js环境下提供了强大工具。本文探讨如何在复杂HTML结构中精确提取数据，结合代理IP、cookie、user-agent设置及多线程技术，提升数据采集的效率和准确性。通过具体示例代码，展示如何使用Cheerio和jsdom解析HTML，并进行数据归类和统计。这种方法适用于处理大量分类数据的爬虫任务，帮助开发者轻松实现高效的数据提取。

奔跑的数据

212 2 2

如何使用Cheerio与jsdom解析复杂的HTML结构进行数据提取

喜欢猪猪

|

架构师关系型数据库 MySQL

MySQL最左前缀优化原则：深入解析与实战应用

【10月更文挑战第12天】在数据库架构设计与优化中，索引的使用是提升查询性能的关键手段之一。其中，MySQL的最左前缀优化原则（Leftmost Prefix Principle）是复合索引（Composite Index）应用中的核心策略。作为资深架构师，深入理解并掌握这一原则，对于平衡数据库性能与维护成本至关重要。本文将详细解读最左前缀优化原则的功能特点、业务场景、优缺点、底层原理，并通过Java示例展示其实现方式。

喜欢猪猪

507 1 1

1030024444162706

|

前端开发 Java 应用服务中间件

【Tomcat源码分析】"深入探索：Tomcat 类加载机制揭秘"

本文详细介绍了Java类加载机制及其在Tomcat中的应用。首先回顾了Java默认的类加载器，包括启动类加载器、扩展类加载器和应用程序类加载器，并解释了双亲委派模型的工作原理及其重要性。接着，文章分析了Tomcat为何不能使用默认类加载机制，因为它需要解决多个应用程序共存时的类库版本冲突、资源共享、类库隔离及JSP文件热更新等问题。最后，详细展示了Tomcat独特的类加载器设计，包括Common、Catalina、Shared、WebApp和Jsp类加载器，确保了系统的稳定性和安全性。通过这种设计，Tomcat实现了不同应用程序间的类库隔离与共享，同时支持JSP文件的热插拔。

1030024444162706

694 6 7

【Tomcat源码分析】"深入探索：Tomcat 类加载机制揭秘"

君子世无双~

|

机器学习/深度学习数据采集人工智能

利用AI技术提升文本分类效率

【8月更文挑战第73天】在信息爆炸的时代，文本数据的快速增长使得文本分类成为数据处理的重要环节。本文将介绍如何利用AI技术提升文本分类的效率和准确性，包括数据预处理、模型选择与训练以及结果评估等关键环节。通过实际案例的代码示例，我们将展示如何实现一个高效的文本分类系统。

君子世无双~

263 3 3

软件求生

|

运维程序员数据库

如何用TCC方案轻松实现分布式事务一致性

TCC（Try-Confirm-Cancel）是一种分布式事务解决方案，将事务拆分为尝试、确认和取消三步，确保在分布式系统中实现操作的原子性。它旨在处理分布式环境中的数据一致性问题，通过预检查和资源预留来降低失败风险。TCC方案具有高可靠性和灵活性，但也增加了系统复杂性并可能导致性能影响。它需要为每个服务实现Try、Confirm和Cancel接口，并在回滚时确保资源正确释放。虽然有挑战，TCC在复杂的分布式系统中仍被广泛应用。

软件求生

865 5 5

Echo_Wish

|

监控数据挖掘数据安全/隐私保护

ERP系统中的预算管理与控制

【7月更文挑战第25天】 ERP系统中的预算管理与控制

Echo_Wish

897 3 3

小空门123-30335

|

供应链 Python

Demand Forecasting模型解释与Python代码示例

Demand Forecasting模型解释与Python代码示例

小空门123-30335

4229 1 1

郑小健

|

机器学习/深度学习数据采集算法

机器学习入门：scikit-learn库详解与实战

本文是面向初学者的scikit-learn机器学习指南，介绍了机器学习基础知识，包括监督和无监督学习，并详细讲解了如何使用scikit-learn进行数据预处理、线性回归、逻辑回归、K-means聚类等实战操作。文章还涵盖了模型评估与选择，强调实践对于掌握机器学习的重要性。通过本文，读者将学会使用scikit-learn进行基本的机器学习任务。【6月更文挑战第10天】

郑小健

1411 3 3

ModelScope模型即服务

热门文章

最新文章

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Meta SAM3开源：让图像分割，听懂你的话

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

共学 | 2025年，更加有效地搭建Agent

一文读懂“大语言模型”

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

智谱开源GLM-ASR：动动嘴，活就干了

0-1教程 ChatGPT Apps Store应用提交教程——和MCP开发部署

BOSS直聘3B超越Qwen3-32B，更多训练数据刷新小模型极限

面对"祖传代码"不敢动？用这条指令让AI做你的首席重构架构师

Nacos配置中心

Eureka服务注册与发现

Ribbon负载均衡

什么是WebFlux

什么是跨域

SpringCloud概述

Jmeter快速入门

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

安全设备篇——WAF