开发者社区 > 弹性计算 > 云服务器ECS > 视频 > 正文

基于阿里云 eRDMA 的训练实例大幅提升多机训练性能

发布者:Dev-Talk 2023-03-20 15:41:10 414
视频介绍

随着互联网数据量指数级膨胀,数据中心分布式计算的规模以及大规模集群间的数据传输开销也越来越大。弹性RDMA(eRDMA) 技术相比传统 TCP 网络,能够大幅降低网络通信延迟,大幅提升分布式计算的性能和性价比。eRDMA 依托阿里云神龙架构,结合NVIDIA GPU 的算力支撑以及兼容 IB verbs 的协议软件接口,最终客户可以无缝迁移线下RDMA 业务上云或者云上实例无缝升级到 eRDMA。本次演讲将分享如何基于阿里云eRDMA 的训练实例大幅提升多机训练性能。

云服务器ECS是一种安全可靠、弹性可伸缩的IaaS级云计算服务。在这里你可以获取最新的ECS产品资讯、最前沿的技术交流以及优惠活动等信息,加速自己的技术成长。

+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
+ 订阅

相关产品

  • 轻量应用服务器
  • FPGA云服务器
  • 云服务器 ECS
  • 相关文章
    更多