【视觉智能产品速递——视频人脸融合产品能力升级】

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 本文介绍视频生产(videoenhan)类目下的通用视频人脸融合MergeVideoFace的功能介绍以及代码示例。

一、产品描述

1.产品概述

     在获得用户授权的前提下,视频人脸融合可以精准地定位视频中的人脸,将用户上传的目标人脸照片与另一个人的人脸形象进行面部融合,达到换脸的感官效果。 支持单脸、多脸、选脸融合应用场景。

免费试用直通车🚝视频人脸融合—能力展示

   

2. 功能介绍

  1. 支持多人脸融合


融合前

1687165096320-f16765f8-a090-4f73-8ca5-28d9423f3522.jpg

融合人脸1

1687165126849-cb9cbf90-52dc-4c7e-b120-77df0b6a7702.jpg

融合人脸2

融合后

  1. 指定人脸融合

d1bc8dffeebce2d6b2fc7201a8591d35.gif

原视频-指定融合左侧女孩

1686898594758-1be9ff2d-21c7-41eb-8b19-bcf9ca9fc802.png

融合人脸

2.gif

  • 融合后

3. 应用场景

  • 影视后期制作:在影视后期制作时,因为某些原因需要替换演员,通过视频人脸融合技术,可利用前期拍摄素材进行处理,让前期视频素材中的人物看起来是新的演员在表演,可以为制片方节省大量的重新拍摄成本。
  • 娱乐性短视频制作:用户可以将已获授权的合法视频中的人物,换成自己的人脸,生成趣味性视频。
  • 虚拟试衣制作:在婚纱摄影、民族服饰、汉服、仿妆等试衣场景,通过视频人脸融合技术进行服饰虚拟试穿。
  • 电商数字人直播:在电商卖货带货直播场景,通过网红脸ID换脸实现数字人直播带货、虚拟人换脸。


4. 产品优势

  • 高保真、低违和效果:融合后的人脸保留了替换者人脸身份信息的视觉特征,而融入被替换者人脸中又无违和感,融合效果自然。算法业界领先,融合效果自然,对真人、油画、水彩等风格兼容性好。
  • 表情肤色一致性:融合后的人脸最大限度保留被替换者的面目表情、肤色一致性。
  • 支持复杂人脸角度:支持模板人脸偏侧一定角度,融合后的结果真实稳定。
  • 支持多人脸指定换脸:支持视频中含有多张人脸,并指定每个脸与不同的用户脸进行融合,可应用在全家福、婚纱摄影、多人角色创作等多人互动场景。
  • 超大容量:同一用户最多可支持上传3000个视频模板。


5.产品收费

视频人脸融合能力支持按量付费通用预付费资源包方式进行计费。

按量付费:计费标准为1元/分钟

通用预付费资源包:阿里云视觉智能开放平台提供首次购买5000点规格享0元免费试用

资源包支持叠加购买,当资源包点数耗尽或过期后,将按照按量付费进行计费。资源包有效期1年。


详情请点击🚝:视频人脸融合功能付费


二、代码示例

1.请求示例

http(s)://videoenhan.cn-shanghai.aliyuncs.com/?Action=MergeVideoModelFace //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html &TemplateId=3bf2418c-7adf-4002-a9d6-2f7cf1889c0d &FaceImageURL=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/videoenhan/MergeVideoFace/MergeVideoFace-xxxx.png &MergeInfos=[{"TemplateFaceID":"f913c614-d542-42ba-b173-07db2058c207_0","TemplateFaceURL":"f913c614-d542-42ba-b173-07db2058c207_0","ImageURL":"http://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/MergeVideoModelFace/xxx.jpg"}] &公共请求参数


2.正常返回示例

XML格式

HTTP/1.1 200 OK Content-Type:application/xml 334F180F-3B50-51CB-B4CB-9A86A542D3BC该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。

JSON格式

HTTP/1.1200OKContent-Type:application/json { "RequestId" : "334F180F-3B50-51CB-B4CB-9A86A542D3BC", "Message" : "该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。" }


3.返回示例补充说明

//查询结果:请求示例http(s)://videoenhan.cn-shanghai.aliyuncs.com/?Action=GetAsyncJobResult &JobId=E75FE679-0303-4DD1-8252-1143B4FA8A27 &<公共请求参数> //查询结果:返回示例 { "RequestId" : "43A0AEB6-45F4-4138-8E89-E1A5D63200E3", "Data" : { "Status" : "PROCESS_SUCCESS", "JobId" : "186AC396-0EEC-46F1-AAA1-BF3585227427", "Result" : "{\"VideoURL\":\"http://vibktprfx-prod-prod-aic-gd-cn-shanghai.oss-cn-shanghai.aliyuncs.com/video-face-fusion/334F180F-3B50-51CB-B4CB-9A86A542D3BC-5716-20210906-074905.mp4?Expires=1630916420&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=OEtNqVYxXRwkyO4BrsYVJ8q5bx****\"}" } } //Result反序列化 { "VideoURL" : "http://vibktprfx-prod-prod-aic-gd-cn-shanghai.oss-cn-shanghai.aliyuncs.com/video-face-fusion/334F180F-3B50-51CB-B4CB-9A86A542D3BC-5716-20210906-074905.mp4?Expires=1630916420&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=OEtNqVYxXRwkyO4BrsYVJ8q5bx****" }


三、新功能直通车


想了解更多相关信息,详情见   阿里云——视觉智能开放平台—产品文档

免费试用直通车🚝       视频人脸融合—能力展示

相关文章
|
4月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之处理一张图片大概耗时多久
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
4月前
|
编解码 文字识别 API
视觉智能开放平台产品使用合集之是否支持视频和字幕同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
4月前
|
编解码 API 数据库
视觉智能开放平台产品使用合集之用Score还是Confidence可以判断人脸相似度
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
4月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何批量添加人脸数据
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
7天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
62 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
6天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用
本文将探讨深度学习技术在图像识别领域的应用。我们将介绍深度学习的基本原理,以及如何利用这些原理进行图像识别。我们将通过一个简单的代码示例来演示如何使用深度学习模型进行图像分类。最后,我们将讨论深度学习在图像识别领域的未来发展趋势和挑战。
|
6天前
|
机器学习/深度学习 数据采集 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的基本原理、优势以及面临的主要挑战。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率,同时指出了数据质量、模型泛化能力和计算资源等关键因素对性能的影响。
|
6天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用及其面临的挑战。通过分析深度学习模型如卷积神经网络(CNN)的工作原理,我们揭示了这些模型如何有效地处理和识别图像数据。同时,文章也指出了当前深度学习在图像识别中遇到的一些主要问题,包括过拟合、数据集偏差和模型解释性等,为读者提供了对这一领域全面而深入的理解。
|
7天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用,分析了当前主流的深度学习模型及其在图像识别中的优势和面临的挑战。通过具体案例分析,揭示了深度学习如何推动图像识别技术的边界,并讨论了未来可能的发展方向。
21 4
|
6天前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的革命性应用####
本文不采用传统摘要形式,直接以一段引人入胜的事实开头:想象一下,一台机器能够比人类更快速、更准确地识别出图片中的对象,这不再是科幻电影的情节,而是深度学习技术在图像识别领域带来的现实变革。通过构建复杂的神经网络模型,特别是卷积神经网络(CNN),计算机能够从海量数据中学习到丰富的视觉特征,从而实现对图像内容的高效理解和分类。本文将深入探讨深度学习如何改变图像识别的游戏规则,以及这一技术背后的原理、关键挑战与未来趋势。 ####
25 1