美图AI绘画机器人上线,小姐姐们,新一轮头像可以换起了

简介:
本文来自AI新媒体量子位(QbitAI)

ba1c3f100a2d01d05c4ceac64c0f421741938c52

你是不是也想要一张插画风格的头像?又要像你,又要插画风格、彩绘色系?

OK,美图AI绘画机器人Andy上线了。

之前美图专门给Angelababy打造的“插画风格”AI绘画师,现在已升级迭代到最新版本美图秀秀App中。

只要上传一张自拍照,“Andy”就能画出不同风格的插画像,风格达10多种。

7b570f36c9783281b6a5d2fb0ebdbe7c60137f6e

其实更早之前,美图还推出过“手绘自拍”的功能,不过相比“Andy”还是弱爆了。

二者区别在于,手绘自拍不能算是完全的人工智能绘画作品,主要是应用了深度学习的技术,分割出头发、皮肤不同区域, 然后在皮肤区域做出不同的特效。

而Andy使用的AI绘画,核心是一套算法在根据用户的照片画画。背后是美图影像实验室(MTlab)最新的影像生成技术:MTgeneration。

443f7b9bdb9a6a449a6c1df5cf5f68225f65220e

背后技术原理

影像生成技术(MTgeneration)核心是基于MTlab自主研发搭建的生成网络Draw Net,通过深度学习技术对大量图像数据进行精准分析与学习,不断增强机器人的绘画能力。

针对不同需求的图像处理的任务,构建出不同应用场景的图像生成模型,经过模型处理,当用户输入自己的图片,Andy便可直接画出相应的插画像。

在这个过程中,还结合使用了美图影像实验室的MTface(人脸技术)和MTsegmentation(图像分割技术)。

目前,AI绘画在全球有几大派别。

107a4cc6d31aa9c1633b39df76eb4f1bcdd93cd8

比如美图投资人李开复在达沃斯论坛上尝试过的机械臂为人作画或者用机械臂copy的作品;

又比如谷歌的AutoDraw,可以根据用户画的简笔画,匹配数据库的图片,生成一幅完整的画。

而美图Andy是基于插画数据进行分析和学习,建模,因此可以根据用户上传的自拍照,来画出用户专属的不同风格插画像,不是简单的复制粘贴或是风格迁移,是AI艺术化的产物。

在美图Andy之前,也还没有AI绘画产品直接用于移动端。

除了移动产品化打磨,美图Andy还有一些技术上的挑战:

相比于风景和静物绘画,人像是一个具有明显主流观念和复杂规则的特殊对象,细微的瑕疵和丝毫的违和都会打破人像艺术作品的完整性、协调性。

所以,用户对于人像画的容错率更低,利用AI绘制人像画的要求更高,难度也更大。

美图MTlab的解决方式是通过分析不同风格的插画作品,归纳出大到构图、小到笔触的不同层面的艺术风格和绘制规则;再通过不断尝试对各式各样的年龄、性别、人种的人物进行人像绘制来印证它掌握的“艺术理解”。

与此同时,MTlab还不断训练AI插画技术的归纳纠错能力,它会在反复的失败中——大约画了数十万张画作,相当于一个画师一辈子作品的上百倍,不断修正完善,使其最终理解并可以在超出“老师”所教授的情境下进行创作。

f25e59ed99bd16983b496424f873e0accb18bbd4

MTlab

值得注意的是,Andy也算是美团影响实验室MTlab出品的第一款移动端AI产品,之前,这个美图内部专注于机器视觉和机器学习的研发团队,由CTO Mitta担纲,神龙见首不见尾。

量子位获悉,MTlab作为美图AI算法研发主力,目前主要的涉足领域有:人脸技术、图像识别、图像/视频美化、3D视觉、人像美化,以及AR技术——之前还参与了AR项目亮风台的投资。

美图去年香港IPO时,MTlab也是公司路演展示的“潜力股”,由于美图在图像数据和用户方面的规模,在深度学习为核心的AI突破方面,并不缺乏基础。

目前MTlab主要有这么几方面技术应用:

MTface,人像处理基础,自主研发了包括人脸检测、人脸关键点、人脸属性分析(性别、年龄)等,能够在复杂条件下实时进行准确分析,人脸检测已经在权威数据集FDDB上试过水,排名还不错。

MT3Dtech,人脸3D模型重建,通过人脸正面照片就能完成,可以实现更加逼真的人像编辑。

MTrestoration,对低画质图像进行增强、去噪、去模糊和超分辨率处理等。

MTsegmentation,图像分区处理,通过分析轮廓、遮挡、颜色、文理、形状等把图像划分成若干互不交迭区域,美图在头发分割和皮肤分割方面准确率达到98.5%——相比传统平均准确率80%,可以说很高了。

MTstyle,利用卷积神经网络实现的风格迁移,即对普通图像进行艺术化处理,俗称“加滤镜”。

MTbeauty,这是美图最核心的美颜算法,通过人脸分析,进行不同年龄、性别的个性化美颜处理,同时通过大规模数据训练和机器学习,优化美颜效果。

MTphotos,通过人脸识别和图像识别进行的照片归类管理——目前在手机中已经很常见了。

MTmakeup,主打“化妆”,背后是人脸检测技术,使用人脸网格分析,实时图像和视频中的实时上妆,被用到了直播产品美拍和电商产品中。

毫无疑问,MTlab也是美图未来重点打造的技术实验室。美图IPO上市时,美图CEO吴欣鸿反复强调:AI趋势如此汹涌,唯有更大的品牌效应、更大的资本推动,才能在AI时代竞争中保持前进。

现在,他推出AI绘画机器人:Andy。

本文作者:李根 假装
原文发布时间: 2017-12-01
相关文章
|
16天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
23天前
|
人工智能 前端开发 程序员
通义灵码 AI 程序员全面上线,能和人类协作完成复杂开发任务
1 月 8 日消息,阿里云通义灵码 AI 程序员已全面上线,成为全球首个同时支持 VS Code、JetBrains IDEs 开发工具的 AI 程序员产品。此次上线的 AI 程序员相比传统 AI 辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,通过全程对话协作的方式,就能完成从 0 到 1 的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。
311 65
|
22天前
|
人工智能 前端开发 程序员
官宣!通义灵码 AI 程序员全面上线
通义灵码2.0 你的AI程序员来了!速来领取你的全新魔法搭档吧!
381 50
|
22天前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
60 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
15天前
|
机器学习/深度学习 人工智能 算法
黑科技上线!AI帮你一眼看穿真实面貌
本文介绍了一种利用多模态文件信息抽取技术识别图片中物品材质的方法。通过深度学习算法和大量训练数据,该技术能精确区分不同材料的纹理、颜色等特征,广泛应用于电商、设计等领域。教程详细讲解了如何使用百炼模型服务、对象存储OSS及函数计算部署应用,帮助用户轻松提取图片中的材质信息。跟随步骤实践,人人都能成为鉴宝大师。点击阅读原文,体验图片视觉理解与属性信息提取的强大功能。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
134 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
3月前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
262 64
|
2月前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
90 13
|
3月前
|
人工智能 机器人 Shell
AI语音机器人安装方法 AI机器人安装代码
AI语音机器人安装方法 AI机器人安装代码
49 2
|
3月前
|
人工智能 自然语言处理 机器人
手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇)
本文介绍了如何从零开始搭建一个语音对话机器人,涵盖自动语音识别(ASR)、自然语言处理(NLP)和文本到语音合成(TTS)三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS,以及FastAPI和Gradio等技术,详细指导读者轻松实现个人AI小助手的构建,适合技术新手快速上手。
708 1

热门文章

最新文章