阿里云视觉智能开放平台正式上线,阿里集团核心视觉AI能力对外开放

简介:

1月底,阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台(vision.aliyun.com),平台目前已上线8大类目,超过50多种视觉AI能力,面向人脸识别,文字识别,商品理解,内容安全,图像识别,图像增强,目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放,最大程度降低开发者接入成本。

阿里云作为亚洲最大的公有云服务商,支撑起了国内最大的零售平台淘宝,天猫,最大的支付平台支付宝,背后得益于雄厚的技术研发能力和运维能力。视觉技术作为AI领域应用最广泛的技术之一,在阿里巴巴内部一直作为核心技术不停的进行研发创新,最终形成了成熟的视觉体系。今天,阿里这些所有成熟的视觉AI都能在阿里云视觉智能平台调用(vision.aliyun.com)

据了解,阿里云视觉智能平台上所有AI能力均来自阿里巴巴经济体,包括达摩院、阿里云、支付宝、菜鸟、天猫等事业部,其中包含了深度学习、图像识别、OCR,图计算等方面的最新前沿研究成果,并且所有AI能力都经过了阿里经济体的具体应用与实践,确保各能力符合场景实际需求。

平台特点

阿里云视觉智能平台荟聚了阿里巴巴集团最专业、全面、易用的视觉AI能力,同时还提供最快捷有效的方式为开发者提供服务,降低开发者研发成本,降低使用门槛,让小白也能使用人工智能。
01.jpg

平台能力

平台已经上线超过50种AI能力,涵盖8大类目视觉智能能力,以满足开发者在安防、数字营销、新零售、生活娱乐等方面的功能开发需求。还有100+AI能力在陆续上新中。具体能力如下所示:

人脸识别:人脸数量检测,人脸特征点检测,人脸定位检测,人脸置信度检测,人脸姿态检测,人脸特征点定位检测,瞳孔检测,性别识别,年龄识别,简单表情识别,佩戴眼镜识别,人脸属性识别,人脸对比1:1,人脸对比1:N

文字识别:身份证识别,户口页识别,银行卡识别,名片识别,驾驶证识别,行驶证识别,车牌识别,VIN码识别,出租车发票识别,火车票识别,营业执照识别,公章识别,通用文字识别,表格识别

商品理解:商品分类

内容安全:图片智能鉴黄,图片暴恐涉政识别,图片logo识别,图片垃圾广告识别,图片不良场景识别,图片风险人物识别

图像识别:颜色识别,风格识别,元素识别,通用图像打标,场景识别

图像增强:图像裁切,图像超分,色彩迁移,风格迁移

图像分割:通用分割,人像分割,面部分割,头部分割,头发分割,商品分割

目标检测:主题检测,机动车检

效率平台

视觉智能领域能力技术相比其它AI类技术(语音语言等),功能流派更多,场景也更复杂 ,各种能力逻辑也存在互相包含的情况。阿里云视觉智能平台依靠整个阿里巴巴经济体的大量业务场景和应用实践(电商零售、金融物流、文娱营销、企业服务等多个行业),将复杂的视觉AI能力进行系统划分,形成最符合实践场景的AI能力系统,并通过平台进行统一输出,开发者可以轻松找到适用于自身研发需求和业务场景的能力,以最低的成本调用最匹配的AI能力进行视觉场景研发。
02.png

普惠三面

“使用门槛越来越低“
“使用人群越来越多“
“使用面越来越广“
阿里云视觉智能平台希望为视觉智能AI领域带来真正的普惠AI,将接入使用视觉AI门槛和成本降到最低,以整个阿里云最强的运维能力和技术为用户提供最高的价值。未来,阿里云视觉智能将集合更多视觉领域的AI能力,拓展更多成熟的使用场景,在图像识别,人脸识别,文字识别等视觉智能领域帮助开发者和企业实现研发为核心,创造为价值的普惠AI。

了解更多AI产品请戳https://vision.aliyun.com/
点击观看产品发布会https://developer.aliyun.com/live/1915
03.jpg

相关文章
|
6月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3469 166
|
6月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
6月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
1027 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
6月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
289 3
|
文字识别 算法 API
视觉智能开放平台产品使用合集之处理一张图片大概耗时多久
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
286 1
|
API 开发工具 Android开发
视觉智能开放平台产品使用合集之人脸活体检测能力是否支持Android端或者iOS端直接调用
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
256 1
|
存储 移动开发 数据库
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
236 1
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何提升人体人脸的QPS
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
234 1
|
文字识别 API 开发工具
视觉智能开放平台产品使用合集之要使用考勤系统需要接入哪个接口
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
240 0

热门文章

最新文章