国内云网络首家!阿里云网络产品论文入选世界级顶会SIGCOMM

简介: 国内云网络首家!阿里云网络产品论文入选世界级顶会SIGCOMM 5月,阿里云网络的” VTrace: Automatic Diagnostic System for Persistent Packet Loss in Cloud-Scale Overlay Network”论文入选SIGCOMM — 国际通信网络领域的顶尖会议,是国内历年来唯一一篇云网络方向的入选论文,历年入选率只有10%,阿里云网络洛神平台的技术实力得到了全球网络业界的认可。

5月,SIGCOMM 2020公布了今年的入选论文,阿里云网络产品的” VTrace: Automatic Diagnostic
System for Persistent Packet Loss in Cloud-Scale Overlay Network”是国内历年来唯一一篇云网络方向的入选论文,今年SIGCOMM总计收到了250篇投稿,成功入选的仅54篇,阿里云网络产品洛神平台的技术实力得到了网络业界顶级会议的认可。
SIGCOMM_

SIGCOMM,全称Special Interest Group on Data Communication,是美国计算机协会(ACM)组织在通信网络领域的旗舰型会议,也是目前国际通信网络领域的顶尖会议,由ACM SIGCOMM组织举办。SIGCOMM对论文的质量和数量要求极高,要求具有基础性贡献、领导性影响和坚实系统背景,由于SIGCOMM录用的论文大多数都会被广泛引用、具有非常大的影响力,因此能在SIGCOMM年会上发表论文是通信网络研究者的非常高的荣誉。

超大规模下的云网络异常定位

如果把我们每天在用的手机App当成现实生活里的商场,电影院,餐馆的话,云网络就是把这些商场,电影院和餐馆连接在一起的高速公路。在现实社会里,如果我们驾车去电影院时发现路堵了,可能会导致我们错过一场期待已久的电影,同样的,在云网络的世界里,当某个设备发生拥塞或者事故了,会导致各种应用出现异常,给我们看到的现象就是App很卡,视频打不开等。

面对这个问题,云网络业需要一个”交警”,每当网络中间有拥塞或者事故了它需要能够及时发现具体位置,然后及时处理,来让整个网络恢复正常。区别于传统的交警,一旦出现问题,云网络的这个交警需要能在几秒钟内从这张遍布全球数百万的设备里找到定位到问题,这对云网络的交警带来了非常大的挑战。

传统网络工具 VS 大数据染色报文分析

在阿里云网络团队之前,云网络碰到类似问题只能用网工三板斧来处理: 抓包,ping, trace。这个方式在云网络上无论是性能上还是可操作性上都非常差,这也是让所有云网络工程师在排查问题时头疼的地方,传统的方式玩不转了。

阿里云网络产品团队首次采用大数据结合染色报文的方式,通过大数据技术给这个交警配备了一个超强的大脑,让他能实时处理千万级网络数据,同时,结合染色报文技术让所有网络里面的数据包信息实时传递给我们的云网络交警。最后的结果就是这个云网络交警能实时感知到整个云网络每台设备的丢包和拥塞情况。阿里云网络产品团队给这个交警取了一个名字,叫vTrace。当用户在上网过程中碰到网络问题时,vTrace能很快找到对应链路上出现问题的节点在哪里,解决了云网络排查问题难的痛点,加快用户网络问题恢复过程。
vTrace_

目前该项技术已经在阿里云网络内部大规模普及,未来将会逐步开放给阿里云用户,让阿里云用户业能享受到vTrace带来的秒级网络问题定位能力。

关于阿里云网络:全球最丰富网络产品家族,数百万企业的首选

云网络是阿里云核心的基础产品线,目前已拥有20+款网络产品,是业界最丰富的网络产品家族,涵盖云上网络、混合云网络、跨地域网络等诸多企业网络场景。
_

阿里云网络产品已服务新浪微博、优酷、12306等全球数百万企业,世界杯、春晚、春运等大流量、国民级应用场景都有阿里云网络产品的身影。
这些云网络产品的背后是基于全自研网络技术的飞天洛神云网络平台,目前已经升级到洛神2.0,连接全球,超大规模,弹性开放是洛神提供的核心能力。目前,阿里云已经建立全球网络基础设施,覆盖全球21个地域,63个可用区,110+个POP点,2600+个边缘节点。

相关文章
|
3月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
254 10
|
3月前
|
机器学习/深度学习 边缘计算 算法
SEENN: 迈向时间脉冲早退神经网络——论文阅读
SEENN提出一种时间脉冲早退神经网络,通过自适应调整每个样本的推理时间步数,有效平衡脉冲神经网络的准确率与计算效率。该方法基于置信度判断或强化学习策略,在保证高精度的同时显著降低能耗与延迟,适用于边缘计算与实时处理场景。
213 13
|
3月前
|
机器学习/深度学习 缓存 算法
2025年华为杯A题|通用神经网络处理器下的核内调度问题研究生数学建模|思路、代码、论文|持续更新中....
2025年华为杯A题|通用神经网络处理器下的核内调度问题研究生数学建模|思路、代码、论文|持续更新中....
448 1
|
7月前
|
人工智能 算法 异构计算
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
近日,阿里云基础网络技术5篇论文被NSDI 2025主会录用。研究涵盖大模型训练网络故障诊断、仿真、容器网络性能诊断、CDN流控算法智能选择及GPU解耦推理优化等领域。其中,《Evolution of Aegis》提出增强现有体系+训练过程感知的两阶段演进路线,显著降低故障诊断耗时;《SimAI》实现高精度大模型集群训练模拟;《Learning Production-Optimized Congestion Control Selection》通过AliCCS优化CDN拥塞控制;《Prism》设计全新GPU解耦推理方案;《ScalaCN》解决容器化RDMA场景性能问题。
362 7
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
|
7月前
|
canal 负载均衡 智能网卡
阿里云洛神云网络论文入选SIGCOMM'25主会,相关实习生岗位火热招聘中
阿里云飞天洛神云网络的两项核心技术Nezha和Hermes被SIGCOMM 2025主会录用。Nezha通过计算网络解耦实现vSwitch池化架构,大幅提升网络性能;Hermes则提出用户态引导I/O事件通知框架,优化L7负载均衡。这两项技术突破解决了云网络中的关键问题,展现了阿里云在网络领域的领先实力。
1215 2
|
SQL 监控 安全
网络安全与信息安全:漏洞、加密与安全意识
随着互联网的迅猛发展,网络安全和信息安全问题日益受到关注。本文深入探讨了网络安全漏洞、加密技术以及提高个人和组织的安全意识的重要性。通过分析常见的网络攻击手段如缓冲区溢出、SQL注入等,揭示了计算机系统中存在的缺陷及其潜在威胁。同时,详细介绍了对称加密和非对称加密算法的原理及应用场景,强调了数字签名和数字证书在验证信息完整性中的关键作用。此外,还讨论了培养良好上网习惯、定期备份数据等提升安全意识的方法,旨在帮助读者更好地理解和应对复杂的网络安全挑战。
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
280 17
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
232 10
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。

热门文章

最新文章