“云+AI”浪潮下,阿里云&龙蜥携手打造智算时代最佳服务器操作系统

简介: AI 时代的来临,也推动着云计算发展迎来第三次浪潮。

编者按:随着 AI 时代推动云计算迎来第三次浪潮,借力"云+AI"趋势,阿里云携手龙蜥打造云上体验最佳的服务器操作系统 - Alibaba Cloud Linux/Anolis OS。在「飞天技术沙龙-CentOS 迁移替换专场」上,阿里云基础软件部产品总监张鹏程分享了《阿里云与龙蜥携手打造智算时代最佳服务器操作系统》,从阿里云和龙蜥的角度,详细介绍了在共建服务器操作系统这条路线上走过的历程,以及未来的发展方向。以下是本次分享原文:


 

(图/阿里云基础软件部产品总监张鹏程)

谈起阿里云的开源战略,我想先与大家一起回顾阿里开源历程。在这个过程中阿里云经历了使用、贡献、开拓三个阶段。首先开源是应用战略。阿里云在创业早期就大量使用开源软件,阿里云技术的发展根植于开源的沃土中,借助开源力量实现去 IOE 满足业务发展诉求,并通过学习研究国外优秀开源实践积累了更多技术研发力量。

其次开源成为技术战略。当阿里云具备一定的能力,尤其是在大规模互联网系统和云计算的研发中开始积累越来越多的技术经验,解决越来越多疑难杂症之后,也积极地将自己的实践以开源软件的形态回馈到社区,解决技术孤岛,并将阿里云内部沉淀的技术通过开源的方式推广成为行业标准。

如今开源是发展战略。随着阿里云越来越深入地参与到各行各业,携手合作伙伴共同建设数字新世界,开源也成为阿里云发展战略的重要部分。云的时代开创了新的软件开发模式和商业模式,云计算让操作系统、数据库、中间件类产品成为集业务技术一体的业务单元。云已经成为开源软件运行的最佳环境,开源也从小众的爱好者行为发展成为基础软件的源头活水。因而在基础软件领域的开拓与开源,成为近几年来阿里云开源的重点。

既然基础软件领域的开源共建已成为阿里开源的重心,因此阿里云明确了一个新兴方向和四大战略领域,形成“1+4”开源战略,持续加大在开源社区建设与研发上的投入。

一个新兴方向是 AI 模型开源社区。魔搭社区成立初衷就是通过开源开放、共建社区生态的方式,让 AI 开发使用更简单。魔搭社区践行模型即服务(Model as a Service)新理念,提供多类优质 AI 模型以及模型调优、训练、部署等一体化服务,旨在降低 AI 模型应用门槛。经过一年多的发展,魔搭成为国内规模最大、最活跃的 AI 模型开源社区,开发者数量超过 280 万,累计开源开放了 2300 多个优质 AI 模型,模型下载量超过 1 亿。魔搭社区也将继续帮助开发者将 AI 模型转化为生产力,持续推动 AI 领域的开源生态建设。

四大战略领域分别是操作系统、云原生、数据库、大数据在操作系统领域,阿里云联合产业伙伴共同发起的龙蜥社区,已成长为国内领先的操作系统开源社区。目前合作伙伴超过 800 家,基于龙蜥技术路线的衍生操作系统已达 12个,部署规模超过 600 万,累计服务用户超过 80 万。在云原生领域,阿里云拥有国内最全面的云原生开源贡献,覆盖分布式应用架构、分布式应用治理、容器调度等多个重要领域,开源了完整的分布式框架和组件,帮助开发者解决分布式应用的落地难题。在数据库领域,阿里云核心产品 PolarDB 数据库的 PostgreSQL 版和分布式版已经开源。在大数据领域,Flink 是当下被广泛使用的开源大数据计算引擎之一。基于其“流批一体”技术,越来越多的企业选择 Flink 应用于自身的业务场景。

阿里云是开源的受益者,也是积极贡献者。阿里云将持续拥抱开源生态,持续投入 AI、云原生、数据库、大数据、操作系统等领域的开源工作,持续提升开发者服务和企业创新支持,为开源创新提速,与开源生态同行。

AI 时代的来临,也推动着云计算发展迎来第三次浪潮。

在云计算技术诞生初期,创立初始就在互联网上面向公众提供服务的企业自然而然地开始使用云服务,他们的需求造就了云计算产业的第一次浪潮。随着云计算技术逐渐成熟,一批传统企业也开始基于信息技术发展成果开启数字化转型,并引发了云计算产业的第二次浪潮。而今天,生成式 AI 技术的飞速发展又对云计算行业起到了极大的推动作用,使行业即将迎来第三次大跨越。

在这种划时代的发展机遇下,阿里云坚持以飞天云计算操作系统为核心,依托自研创新的云基础设施,致力于服务产业数字化和智能化。在这其中,服务器操作系统作为飞天的底座,承上启下发挥着不可或缺的关键作用,这也是阿里云会在操作系统领域坚持数十年长期投入的原因。

阿里云在操作系统上长期投入的初心,总结为三点,解决业务发展问题、实现关键技术突破、促进计算产业变革业务发展中最突出的诉求是实现大规模复杂算力场景稳定、可靠、高效运行,这需要操作系统在复杂算力场景下发挥出稳定、安全、性能、成本的综合竞争力。关键技术的突破会集中体现在三次浪潮叠加下软硬协同创新突破,在一云多芯、云+AI的发展模式下,需要操作系统连接软硬件上下游协同创新。计算产业的变革离不开产业生态的协同和自主演进路线的发展,通过开源社区可以有效连接供给侧和需求侧力量,聚力共建自主可控的技术体系,实现可持续发展。

正是意识到开源社区对于操作系统发展的决定性作用,阿里云坚持长期投入,携手产业伙伴共建龙蜥社区,共促生态协同发展。

2009 年,阿里便开启操作系统自研探索,通过大规模实践形成深厚积累,随着一云多芯的发展需要,阿里云在 2020 年联合产业伙伴共同发起成立了龙蜥社区,恰逢其时在 CentOS 停服替代中社区也发挥了关键作用,促进科技自立自强。如今,龙蜥已完成根社区建设布局,走出一条基于分层分类、独立演进的技术路线,逐步解决操作系统开源供应链等安全可控问题。

在龙蜥社区的发展过程中,阿里云致力于构建开放中立的社区治理体系,促进社区技术成果规模化应用,并携手上下游生态伙伴共同规划社区技术路线。

如今,龙蜥社区开放中立治理理念已成为现实,社区成为国内独具特色的多厂商治理模式合作型开源操作系统社区,得益于治理模式的成功,龙蜥已经成为我国活跃贡献机构最多、最多样化的社区,在云智融合浪潮下迈向高质量发展阶段。

在智能计算快速发展的时代背景下,服务器操作系统产业迎来新发展格局,在云+AI 的催化剂下,我们有机会聚力实现产业升级三步走,实现国产生态自主演进、引领云+AI 技术潮流、实现基础软件换道超车,同时承担起更重要的产业责任,促进自主生态可持续发展、商业开源生态双循环、防止产业发展踏空。


阿里云会持续投入龙蜥社区建设和贡献,继续坚持共建、共享、共治、共赢发展理念,用开放创新谱写国产操作系统和基础软件的新未来。


预测未来的最好方式是创造未来,让我们聚力龙蜥,共同打造中国操作系统黄金年代。


精彩视频回放、课件获取:

本次演讲直播回放及技术 PPT已上线,欢迎点击下方链接观看~

回放链接:

https://openanolis.cn/video/#1114869210846130212

技术 PPT :关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
9天前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。
|
1天前
|
存储 人工智能 网络协议
浅聊阿里云倚天云服务器:c8y、g8y、r8y实例性能详解与活动价格参考
选择一款高性能、高性价比的云服务器对于企业而言至关重要,阿里云推出的倚天云服务器——c8y、g8y、r8y三款实例,它们基于ARM架构,采用阿里自研的倚天710处理器,并基于新一代CIPU架构,通过芯片快速路径加速手段,实现了计算、存储、网络性能的大幅提升。2025年,计算型c8y云服务器活动价格860.65元一年起,通用型g8y云服务器活动价格1187.40元一年起,内存型r8y云服务器活动价格1454.32元一年起。本文将为大家详细解析这三款实例的性能特点、应用场景以及最新的活动价格情况,帮助大家更好地了解阿里云倚天云服务器。
|
4天前
|
机器学习/深度学习 弹性计算 缓存
简单聊聊,阿里云2核2G3M带宽云服务器与轻量应用服务器区别及选择参考
2核2G3M带宽云服务器与轻量应用服务器是目前阿里云的活动中,入门级走量型云服务器,轻量云服务器2核2G3M带宽68元一年,经济型e实例云服务器2核2G3M带宽99元1年。同样的配置,对于有的新手用户来说,有必要了解一下他们之间的区别,以及各自的购买和续费相关政策,从而选择更适合自己需求的云服务器。本文为大家简单分析一下我们应该选择哪一款。
|
4天前
|
监控 安全 数据库
阿里云国际站:如何使用阿里云国际站服务器
阿里云国际站服务器是一种强大的云计算服务,可以帮助用户轻松搭建和管理自己的网站、应用程序和数据库。本文将介绍如何使用阿里云国际站服务器,包括注册账户、选择服务器配置、安装操作系统、配置网络和安全设置等方面。
|
7天前
|
弹性计算 安全 搜索推荐
阿里云国际站注册教程:阿里云服务器安全设置
阿里云国际站注册教程:阿里云服务器安全设置 在云计算领域,阿里云是一个备受推崇的品牌,因其强大的技术支持和优质的服务而受到众多用户的青睐。本文将为您介绍阿里云国际站的注册过程,并重点讲解如何进行阿里云服务器的安全设置。
|
7天前
|
人工智能 监控 测试技术
阿里云磐久服务器稳定性实践之路
阿里云服务器质量智能管理体系聚焦自研服务器硬件层面的极致优化,应对高并发交付、短稳定性周期、早问题发现和快修复四大挑战。通过“三个重构”(质量标准、开发流程、交付模式)、“六个归一”(架构、硬件、软件、测试、部件、制造)策略,实现芯片、整机和云同步发布,确保快速稳定上量。此外,全场景测试体系与智能预警、分析、修复系统协同工作,保障服务器在萌芽阶段发现问题并及时解决,提升整体质量水平。未来,阿里云将继续深化大数据驱动的质量管理,推动服务器行业硬件质量的持续进步。
|
8天前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
8天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
8天前
|
存储 人工智能 芯片
面向AI的服务器计算互连的创新探索
面向AI的服务器计算互连创新探索主要涵盖三个方向:Scale UP互连、AI高性能网卡及CIPU技术。Scale UP互连通过ALink系统实现极致性能,支持大规模模型训练,满足智算集群需求。AI高性能网卡针对大规模GPU通信和存储挑战,自研EIC网卡提供400G带宽和RDMA卸载加速,优化网络传输。CIPU作为云基础设施核心,支持虚拟化、存储与网络资源池化,提升资源利用率和稳定性,未来将扩展至2*800G带宽,全面覆盖阿里云业务需求。这些技术共同推动了AI计算的高效互联与性能突破。
|
8天前
|
人工智能 运维 监控
阿里云Milvus产品发布:AI时代云原生专业向量检索引擎
随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。

热门文章

最新文章