阿里云基础设施网络亮相SIGCOMM22 - 可预期网络取得重大突破

简介: 阿里云基础设施网络亮相SIGCOMM22 - 可预期网络取得重大突破

首图-图标.png


【阅读原文】戳:阿里云基础设施网络亮相SIGCOMM22 - 可预期网络取得重大突破


本期亮点

连续四年入选SIGCOMM,基础设施网络领域研究创新一骑绝尘。

Solar:继SIGCOMM 2019发布HPCC高性能流控后,高性能RDMA网络方面取得的又一里程碑。

Predictable uFAB:面对日益增长的超大规模算力需求,阿里云在大规模部署RDMA高性能网络实践基础上,在业界首创了端网融合的技术体系,开启了可预期数据中心网络新型架构。

Meissa:有力保障了阿里云基于P4可编程平台的大规模部署的稳定性。


8月24日至26日,全球知名网络顶会SIGCOMM 2022在荷兰阿姆斯特丹举行,阿里云基础设施网络团队代表阿里云参会并发表多个演讲,介绍阿里云在高性能可预期网络方面取得的技术成果。阿里云基础设施网络团队负责人蔡德忠也在大会上作了以“Alibaba Cloud PredNET-Our Journey towards Predictable Network”为主题的演讲,阐述了阿里云在业界首创的端网融合技术体系,在面对日益增长的大算力需求下,通过一系列的硬核技术创新,开启了可预期网络新型架构时代,有力支撑了AI/ML算力集群的高效规模扩展。

1.jpg

阿里云基础设施网络团队负责人蔡德忠作“可预期网络”主题分享


蔡德忠认为,我们已进入了AI时代,而AI/ML需要强大的算力,云计算则是提供这种大算力的高效敏捷的一种有效方式,云计算大力促进了算力的普惠化,让千千万万的中小企业都能在云上享用先进的AI/ML产品和功能,AI/ML已成为云计算的new face(新的招牌)。不过,过去数据中心网络的协议和架构都是为传统IT workload而设计的,面对人工智能、深度学习等浪潮,网络性能严重影响了算力集群的大规模扩展。在过去5年大规模部署RDMA高性能网络实践基础上,阿里云在业界首创了端网融合技术体系,并进行了一系列技术创新,打造了可预期网络新型架构,能提供微秒级网络延时以及带宽保障,可高效支撑万卡级规模GPU算力集群。


0.jpg

作为国际网络通信领域旗舰会议,SIGCOMM对论文的质量和数量要求极高:质量方面要求面向基础性网络问题、提出具有高度创新的解决方案、实现坚实的系统与大规模实验;数量方面每年只录用30-50篇正式会议论文。


由于SIGCOMM录用的论文大多数都会被广泛引用、具有非常大的影响力,因此能在SIGCOMM上发表论文是所有网络通信从业人员至高无上的荣誉。


本次录取的多篇论文简要说明如下:


1. Solar

下一代高性能“计算-存储” RDMA协议,与阿里云存储产品团队历时三年联合打造。这是阿里云继 SIGCOMM 2019上发布HPCC高性能流控之后,在高性能RDMA网络方面取得的又一里程碑。


2. Predictable uFAB

端网融合可预期数据中心网络架构,微秒级别保障租户的可达性,带宽和延迟。面对日益增长的超大规模算力需求,阿里云在大规模部署RDMA高性能网络实践过程中,在业界首创了端网融合的技术体系,并进行了一系列的技术创新,打造了有效支撑AL/ML workload的数据中心新型网络架构。


3. Meissa

大规模全覆盖的可编程网络正确性测试自动生成系统软件,有力保障了阿里云基于P4可编程平台的大规模部署的稳定性。


4. GSO

钉钉音视频新一代Simulcast架构,全量部署钉钉5亿用户,显著提升用户体验。


5. Zhuge

针对即时通信和音视频应用的WiFi网关路由调度框架和算法。


6. GRTN(参与)

边缘云团队打造的全球音视频传输网络项目,基础网络作为项目参与方,提供音视频传输技术的优化和服务保障。


4.png


在此次年度大会分享上,阿里云基础设施网络团队代表马云飞、缪睿和高佳琦也分别针对入选主题进行了宣讲。


缩小后.jpg

2523F8BB-9EA6-4B4E-84CD-06C5C7F3BF21.png

59B61A40-6EB8-433F-95A9-23F38336B92A.png

766DAF8D-E6EA-401E-B4E0-C6ED0095234E.png


2019年,阿里云基础设施网络团队在SIGCOMM首次实现主会论文的历史性突破,到今年,已是连续第四年入选,四年16篇论文,简单的数字背后是阿里云基础设施网络团队一路“仰望星空,砥砺求实”的结果,也彰显了团队深厚的技术沉淀和强大的研发实力。在基础网络探究创新的路上,他们一直在前进~



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
24天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
18天前
|
人工智能 网络协议 数据中心
阿里云基础设施网络2024年创新总结
本文将盘点阿里云基础设施网络团队2024年在AI时代可预期网络的技术突破、学术成果、开源生态共建与重要会议技术布道等,与业界同仁一同探讨和展望AI时代的网络技术发展热点和趋势。
阿里云基础设施网络2024年创新总结
|
22天前
|
负载均衡 芯片 异构计算
NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关 洛神云网关
NSDI‘24于4月16-18日在美国圣塔克拉拉市举办,阿里云飞天洛神云网络首次中稿NSDI,两篇论文入选。其中《LuoShen: A Hyper-Converged Programmable Gateway for Multi-Tenant Multi-Service Edge Clouds》提出超融合网关LuoShen,基于Tofino、FPGA和CPU的新型硬件形态,将公有云VPC设施部署到边缘机柜中,实现小型化、低成本和高性能。该方案使成本降低75%,空间占用减少87%,并提供1.2Tbps吞吐量,展示了强大的技术竞争力。
|
24天前
|
Web App开发 监控 网络协议
网络分析与监控:阿里云拨测方案解密
阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下,介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘,为客户的业务保驾护航。
|
22天前
|
SQL Cloud Native API
NSDI'24 | 阿里云飞天洛神云网络论文解读——《Poseidon》揭秘新型超高性能云网络控制器
NSDI‘24于4月16-18日在美国加州圣塔克拉拉市举办,汇聚全球网络系统领域的专家。阿里云飞天洛神云网络的两篇论文入选,标志着其创新能力获广泛认可。其中,《Poseidon: A Consolidated Virtual Network Controller that Manages Millions of Tenants via Config Tree》介绍了波塞冬平台,该平台通过统一控制器架构、高性能配置计算引擎等技术,实现了对超大规模租户和设备的高效管理,显著提升了云网络性能与弹性。实验结果显示,波塞冬在启用EIP时的完成时间比Top 5厂商分别快1.8至55倍和2.6至4.8倍。
|
1月前
|
负载均衡 容灾 Cloud Native
云原生应用网关进阶:阿里云网络ALB Ingress 全能增强
在过去半年,ALB Ingress Controller推出了多项高级特性,包括支持AScript自定义脚本、慢启动、连接优雅中断等功能,增强了产品的灵活性和用户体验。此外,还推出了ingress2Albconfig工具,方便用户从Nginx Ingress迁移到ALB Ingress,以及通过Webhook服务实现更智能的配置校验,减少错误配置带来的影响。在容灾部署方面,支持了多集群网关,提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。
455 19
|
2月前
|
运维 供应链 安全
阿里云先知安全沙龙(武汉站) - 网络空间安全中的红蓝对抗实践
网络空间安全中的红蓝对抗场景通过模拟真实的攻防演练,帮助国家关键基础设施单位提升安全水平。具体案例包括快递单位、航空公司、一线城市及智能汽车品牌等,在演练中发现潜在攻击路径,有效识别和防范风险,确保系统稳定运行。演练涵盖情报收集、无差别攻击、针对性打击、稳固据点、横向渗透和控制目标等关键步骤,全面提升防护能力。
|
2月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
79 17
|
2月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。
|
2月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
61 10

热门文章

最新文章