AI生图美学在淘宝的实践应用(1)

简介: AI生图美学在淘宝的实践应用

本文介绍了如何制定和应用美学标准来评估和改善人工智能生成的图像质量,特别是在电商领域的应用,主要分为制定美学标准、训练美学模型、应用美学模型、升级淘宝风格模型四个步骤。




美学的定义与分析


  1. 图像质量标准:现代设计框架下,定义的图像质量标准基本是统一的。侧重技能和技法的定义,也由此延伸出对图、画、照片、影像的质量评判,再此基础上对成图手段的特性会有所要求和侧重。
  2. 图像内容标准:意识形态下的表达好坏要求是广泛的,图像质量的标准会被打破,服务于内容表达的需要。业内通常由评论家或评委等权威人士进行定义和解读。



美学项目的目标


  1. 第一步-制定美学标准:制定AI生图标准与AI风格标准,联合中国美院与教授一起共研。突出专业性、针对性、客观性、权威性。
  2. 第二步-训练美学模型:基于AI美学标准培育美学判定模型,使机器能自动判定打分。
  3. 第三步-应用美学模型:基于美学模型能力指导淘宝AI生图模型调优升级。
  4. 第四步-升级淘宝风格模型:基于风格标准建立淘宝风格模型库,使商家具备丰富多样的风格模型可供选择。打造淘宝特色风格模型。
    image.png


第一步:制定美学标准


基于「图像」的构成要素进行准则框架的定义,同时侧重AI生成的特性构建美学的标准:

图像构成:物形/环境/构图/光影/质感

AI生成特性:元素真实性&场景合理性

AI美学标准:5项准则,19项标准

image.png

image.png


第二步:训练美学模型


  1. 美学模型目标:机器对图片自动打分判定的准确率提升。
  2. 准确率:相同图片进行美学AI打分与人工打分,取人与机器分数的重叠率。


 沉浸式体验


image.png


我们的AI美学评价模型采用多模态美学预训练与多任务微调学习方式。这样做的优点如下:

  1. 我们的模型参数较少,可快速训练迭代,推理速度快,可快速筛选高美学图像,也可测评不同生成模型的生成效果,减少人工标注与审核成本;
  2. 相比于只输出美学分的模型,我们模型可以输出生成图像异常属性,可解释性较高;
  3. 我们的模型输出的异常属性既可以作为生图修复的前置判别器,也可以为异常生成图像打标优化生成模型;


 训练过程


基于美学标准制定评分规范,建立5分制的评分规则,由设计师进行打标沉淀优质AI训练数据:

  1. 制定评分规则:用于AI生图的评分规范(5档),以及用于原图筛选的评分规则(3档)。 image.png
  2. 人模图原图美学评价能力:根据对人模、环境、构图、光影、质感等图像品质的偏好,训练专门的人模图原图美学模型,用于美学分层。可过滤的低美学类型包括图像模糊、白边图或贴图,人面部不完整或裁切,人体被遮挡多,背景差或者整体美感差等。
  3. AIGC生图美学评价能力:我们的AIGC生图美学评价主要针对于含有人物的生图,从关注画面合理性与关注画面融合度两大方面出发,基于5大准则、19项标准要求,制定评分规则,同时针对生图异常属性进行标注。目前我们的模型已支持的异常属性包括人与背景融合度异常(人物悬空、背景质感差等)、手部异常、面部异常、肢体异常、其他异常等,输出的美学分范围1到5分。
  4. image.png

图:AIGC生图美学评价预测的不同美学分数的图片


合理训练:人与机器多轮匹配校验,保证数据优质。

  1. 1轮打分校验: 取3人平均分来累积数据,保障打分客观。有分差部分重新解读差异具体呈现的问题点。再进行校验重打。确保不同人对准则的解读能保持理解一致和稳定(5分制度)。
  2. 2轮AI打分校验:取3人平均分与机器进行校对,有分差部分重新解读差异具体呈现的问题点,明确是人的问题还是机器的问题,确保两者能逐步一致,保障机器理解的准确性。(有初版AI判定模型后开始进行)。
相关文章
|
2月前
|
人工智能 IDE Java
AI Coding实践:CodeFuse + prompt 从系分到代码
在蚂蚁国际信贷业务系统建设过程中,技术团队始终面临双重考验:一方面需应对日益加速的需求迭代周期,满足严苛的代码质量规范与金融安全合规要求;另一方面,跨地域研发团队的协同效率与代码标准统一性,在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量,我们积极探索人工智能辅助代码生成技术(AI Coding)的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验,梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。
490 25
AI Coding实践:CodeFuse + prompt 从系分到代码
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
456 30
|
2月前
|
人工智能 自然语言处理 测试技术
从人工到AI驱动:天猫测试全流程自动化变革实践
天猫技术质量团队探索AI在测试全流程的落地应用,覆盖需求解析、用例生成、数据构造、执行验证等核心环节。通过AI+自然语言驱动,实现测试自动化、可溯化与可管理化,在用例生成、数据构造和执行校验中显著提效,推动测试体系从人工迈向AI全流程自动化,提升效率40%以上,用例覆盖超70%,并构建行业级知识资产沉淀平台。
从人工到AI驱动:天猫测试全流程自动化变革实践
|
2月前
|
数据采集 存储 人工智能
从0到1:天猫AI测试用例生成的实践与突破
本文系统阐述了天猫技术团队在AI赋能测试领域的深度实践与探索,讲述了智能测试用例生成的落地路径。
从0到1:天猫AI测试用例生成的实践与突破
|
2月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
398 1
|
2月前
|
人工智能 新制造
TsingtaoAI受邀参加宁波AI海曙科创训练营并分享技术落地实践
10月12日至15日,由宁波市海曙区组织部主办的AI海曙科创训练营在宁波成功举办。作为受邀企业代表,TsingtaoAI团队深入参与了多项活动,与政府领导、行业专家及科创企业代表围绕AI技术在制造业、成果转化等领域的实际应用展开交流,用真实案例诠释了“技术扎根产业”的价值逻辑。
104 2
|
2月前
|
人工智能 运维 关系型数据库
云栖大会|AI时代的数据库变革升级与实践:Data+AI驱动企业智能新范式
2025云栖大会“AI时代的数据库变革”专场,阿里云瑶池联合B站、小鹏、NVIDIA等分享Data+AI融合实践,发布PolarDB湖库一体化、ApsaraDB Agent等创新成果,全面展现数据库在多模态、智能体、具身智能等场景的技术演进与落地。
|
2月前
|
存储 人工智能 前端开发
Qoder + ADB Supabase :5分钟GET超火AI手办生图APP
本文介绍如何利用Qoder、阿里云ADB Supabase和通义千问图像编辑模型,快速搭建AI手办生图Flutter应用。无需传统后端,实现从前端生成到数据存储、AI服务集成的全链路敏捷开发,展现Vibe Coding的高效实践。
Qoder + ADB Supabase :5分钟GET超火AI手办生图APP
|
人工智能 自然语言处理 前端开发
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
淘宝推荐信息流业务,常年被“需求多、技术栈杂、协作慢”困扰,需求上线周期动辄一周。WaterFlow——一套 AI 驱动的端到端开发新实践,让部分需求两天内上线,甚至产品经理也能“自产自销”需求。短短数月,已落地 30+ 需求、自动生成 5.4 万行代码,大幅提升研发效率。接下来,我们将揭秘它是如何落地并改变协作模式的。
414 37
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
|
2月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
496 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀