阿里云NPU云服务器AN1搭载平头哥含光NPU高性价比AI推理

简介: 阿里云NPU云服务器AN1搭载平头哥含光NPU,提供高性价比AI推理解决方案,阿里云NPU云服务器介绍、NPU云服务器特点及NPU云服务器使用场景:

 

一、阿里云NPU云服务器AN1

阿里云NPU云服务器AN1配备阿里平头哥自研神经网络加速芯片-含光NPU,提供单芯片超强AI推理性能。虚拟化技术采用阿里云自研神龙虚拟化计算平台,为用户提供弹性裸金属NPU加速实例,兼顾了物理服务器的功能性能优势,以及云服务器的高可用优势。关于阿里云NPU云服务器配置性能可以参考:NPU云服务器配置性能详解 - 阿里云,NPU计算型ebman1实例搭配自研深度神经网络加速器含光800(AliNPU)。

Ali-NPU计算加速实例

开发工具采用阿里平头哥RatelNN自动化开发工具,支持主流深度学习框架TensorFlow、Caffe和MXNET,并针对通用模型进行了深度优化,广泛适用于语音、图片、视频等AI推理业务,为客户提供超高性价比的推理解决方案。

二、NPU云服务器特点及性能

搭载平头哥含光NPU的云服务器具备全球最高单芯片AI推理性能:

单芯片最高AI推理性能

含光NPU采用TSMC 12nm工艺制程,提供全球最高单芯片AI推理性能。 在ResNet50模型的推理应用中,含光NPU每秒钟可处理高达78000 IPS的图片,是同类处理器的数十倍性能。

阿里云自研神龙裸金属虚拟化平台

阿里NPU云服务器采用阿里云自研神龙裸金属虚拟化平台,实现全Hypervisor卸载,为用户提供功能无损,性能无损的AI计算加速服务,同时兼容阿里云整体产品生态,为客户提供数据传输,计算,存储等一系列完整解决方案。

完善的自动化开发工具

阿里平头哥RatelNN自动化开发工具,支持主流开源框架TensorFlow,Caffe以及MXNET;支持离线量化、编译以及图优化;支持多模型动态部署以及多设备管理;完善的设备驱动调试工具。

针对业务场景深度优化

针对CNN及视觉类算法,如ResNet-50,SSD/DSSD,Faster-RCNN,DeepLab等模型进行了深度优化。因有效优化了计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

三、NPU云服务器应用场景

图像搜索

通过输入具有相同元素或主体内容的图片,在自建图片库中查找相似或相同的图片。如图库网站图像搜索,图片分享和社交类网站通常有大量图片供用户搜索使用,利用图像搜索服务,可快速实现用户的以图搜图需求。

场景识别

场景识别通过深度学习算法,自动识别图像中的数十种常见的场景,如天空、草地、人物等。客户的应用程序可以基于这个功能,轻松实现图片的自动管理、分组和搜索功能,完成大型图像库的智能管理。

视频内容识别

如直播、点播、短视频等违规画面审核。直播、点播、短视频场景中视频中的色情、政治敏感、暴力、武器、恐怖、血腥、爆炸、抽烟、吸毒、画中画等内容进行识别,避免出现的内容带给青少年不良影响。

自然语言处理

自然语言处理目前已成为各类企业及开发者用于文本分析及挖掘的核心工具,已经广泛应用在电商、文化娱乐、金融、物流等行业客户的多项业务中。自然语言处理技术帮助用户搭建内容搜索、内容推荐、舆情识别及分析、文本结构化、对话机器人等智能产品。

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
人工智能 文字识别 监控
|
2月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
2752 166
|
2月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
1764 120
|
2月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
927 47
|
2月前
|
人工智能 数据处理 API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
427 6
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
|
3月前
|
消息中间件 人工智能 运维
事件驱动重塑 AI 数据链路:阿里云 EventBridge 发布 AI ETL 新范式
“一个简单的数据集成任务,开始时总是轻松愉快的,但随着业务扩展,数据源越来越多,格式越来越乱,整个数据链路就会变得一团糟。”陈涛在演讲中指出了当前 AI 数据处理的普遍困境。扩展难、运维难、稳定性差,这三大挑战已成为制约 AI 应用创新和落地的关键瓶颈。针对这些痛点,在2025云栖大会期间,阿里云重磅发布了事件驱动 AI ETL 新范式,其核心产品 EventBridge 通过深度集成 AI 能力,为开发者提供了一套革命性的解决方案,旨在彻底改变 AI 时代的数据准备与处理方式。
407 31
|
2月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。