企业级存储与操作系统的协同设计
随着数字经济的发展,数据即资源已经成为共识,其与土地、劳动力、技术、资本并成为五大基础资源,在数据基础设施中,存储平台扮演了核心角色。数据基础设施在多场景化、数据巨量化、多态化等方面对存储提出了越来越多的挑战和要求。孟宪伟通过本次演讲就企业级存储当前面临的挑战,面向极致可靠、极致可用、极致性能、极致安全四个方面,分享和探讨了企业级存储与操作系统协同设计的现状和未来。
龙蜥社区 Intel ARCH SIG 阿里云实践之路
介绍了龙蜥社区发展现状,讲解了 Intel Arch SIG、Anolis 内核 ANCK 以及商业发行版 Alibaba Cloud Linux 内核之间的上下游关系,并分享了阿里云选择 Anolis OS 作为上游的原因。随后,介绍了 Intel Arch SIG 目前的工作进展,对 Intel 主流服务器平台支持的情况。最后,通过解决方案在阿里云应用场景的最佳实践对 Intel Arch SIG 合作成果进行的展示。
龙蜥系统中基于 Intel Crypto Acceleration 的加速实践
当前安全越来越重视的前提下,越来越多的网站由 HTTP 转为 HTTPS,更多的服务之间会由 SSL/TLS 来建立安全通道进行通讯,在带来安全的同时,性能问题也随之而来。张力在本次演讲中,将从这类场景中的问题介绍开始,分析 SSL/TLS 带来的性能问题,介绍英特尔第三代志强处理器中的密码学加速特性是如何帮助解决这些问题的,并概览该特性在龙蜥系统及部分业务场景中的加速实践,供大家参考使用。
SPDK 高性能存储实践与优化
童坤坤对 SPDK 的概念原理做了介绍,包括 SPDK 实现高性能的核心要点、SPDK 线程模型、通道模型等。结合 SPDK 在移动云虚拟云主机应用场景,阐述了虚拟化技术、I/O 虚拟化、虚拟化分类、virtio 原理、vring IO 请求流程、基于 qemu-vhost 的半虚拟化存储。并介绍了移动云在 SPDK 实践中遇到的问题以及应对与优化,包括 SPDK 可运维监控、SPDK 存储热迁移、SPDK 热更新、SPDK 快速恢复。最后介绍 SPDK 演进历史并对 SPDK 未来做出展望。
一站式自动化测试平台的探索与实践
开源软件发展迅速,应用非常广泛,其质量保证在开源社区以及评测机构都面临巨大的挑战,传统的自动化测试平台在运行模式、测试场景上具有非常大的局限。龙蜥社区的开源项目 T-One 一站式质量协作平台,打通了从测试设计、测试计划、用例集成、测试部署、测试执行、结果分析、测试报告等整个测试流程闭环,源于阿里云操作系统团队经过多年的内部业务打磨,支撑了 30 多个团队产品质量保证的通用自动化测试平台,超过 930 万小时的运行时间,具有非常高的稳定性和运行效率。 T-One 在龙蜥社区开源后,通过 T-One SIG 兴趣组,构建了开源版、企业版、机构版三大下游版本,多家合作单位接入社区开源版或者内部独立部署,共同贡献,在社区获得了快速的发展。电子五所于 2021 年 12 月加入龙蜥社区作为合作伙伴,基于T-One SIG 在社区合作开发了 T-One 机构版,在 testlib 组件上进行了非常深入的合作,共同参与测试需求管理、用例管理、设备管理等模块的开发,积极推动评测平台标准化。后续会进一步加深合作,双方基于开源模式,持续完善 T-One 功能,提升评测效率,在 AI 技术引入、下一代质量技术标准的探索上,加深与龙蜥社区的合作,共同把 T-One 打造成为具有广泛影响力的标准化质量平台。
平头哥在 RISC-V 软件生态的探索和实践
熊健以平头哥最新发布的无剑 600 SoC 平台和曳影 1520 开发板为出发点,阐述了平头哥软件团队对开源社区的贡献,以及龙蜥社区与平头哥 RISC-V 的生态互补。 在无剑 600 平台上,平头哥与龙蜥社区、中科院软件所 PLCT 实验室进行了软硬件全栈的联合优化,完成了 RISC-V 与龙蜥操作系统的 3000 多个基础包适配,并在曳影 1520 上首次运行 FireFox 浏览器、LibreOffice 等大型桌面级软件,以及 Hexo 和 Open Rocket 等基于 NodeJS 和 JAVA 的应用,极大拓展了 RISC-V 的想象力。 平头哥是 RISC-V 国际基金会董事会成员,领导基金会中的数据中心、存储管理、安卓、安全等 11 个技术方向,重要性及数量居世界前列、中国机构首位。在 RISC-V 国际舞台上,平头哥正推进 RISC-V 国际标准制定,推动全球 RISC-V 技术与生态发展。
RISC-V 边缘 AI 芯片的开源生态和应用落地
除了在嵌入式和高性能领域的应用,RISC-V 在边缘 AI 领域也正在大放异彩,来自嘉楠科技的技术总监何含分享了主题为《 RISC-V 边缘 AI 芯片的开源生态和应用落地》的主题演讲。 何含介绍了嘉楠科技如何满足边缘计算和 AI 产业的普适计算需求,面对场景多样化、落地难的行业挑战,嘉楠科技在整个芯片技术栈和软件栈坚持全链路自主设计,一方面深耕 RISC-V 的开源、可定制和灵活技术路线,另一方面打造极开放的 AI 核心 IP 和相关工具链,以及软件栈的异构协同。嘉楠的极客风格和开放风格,对于边缘 AI 计算的持续演进、应对多样化、场景化的边缘计算需求,更具备开放性和适应性。何含还分享了嘉楠科技在构建开源生态方面的经验教训,以及如何通过“真开源真开放”,为用户提供差异化价值和更好的体验。同时也将介绍芯片和解决方案在国内和海外市场的广泛落地的应用心法。
SysOM 在系统可靠性与安全上的实践
系统运维 SIG 的重磅项目 SysOM 是一个一站式运维管理平台,是与统信软件有非常深入的合作共建。统信软件高级系统研发工程师,系统运维 SIG Maintainer 魏东分享《SysOM 在系统可靠性与安全上的实践》。魏东从 sre 切入,分享了操作系统稳定性相关知识,展开介绍了龙蜥社区运维SIG出品的一站式系统运维平台 SysOM 在系统稳定性上所做的相关工作,其中,重点介绍批量运维和系统诊断功能。接着,就操作系统安全知识以及 SysOM 安全中心的漏洞修复功能展开介绍。最后,指出当前系统稳定性的痛点,并介绍未来的展望。
Coolbpf 的应用实践
eBPF 技术探索 SIG 推出的 Coolbpf 是一站式 eBPF 开发编译平台,目的是让大家更快速的入门和进行开发,不用关注太多环境搭建问题。大家了解最多的是Coolbpf 是用来开发编译的,那么基于它之上的应用有什么呢?阿里云高级技术专家、龙蜥系统运维SIG Owner、龙蜥eBPF技术探索 SIG Maintainer 毛文安带来《Coolbpf 的应用实践》分享,与现场嘉宾针对 eBPF SIG 的 Coolbpf 项目,从它的原理和设计实现层面进行了阐述,具体介绍了远程云编译和低版本内核运行 eBPF 的技术原理。最后,通过一个具体网络抖动案例,展示了 Coolbpf 在业务观测和抖动发现上的具体应用实践过程。
人工智能驱动下的翻译组新模式
在2023开放原子全球开源峰会上,分享 Linux 中国在生成式 AI 上的新实践,以及其对于通过开源推动 Linux 中国翻译组的持续发展的一些想法和探索。
Nydus容器镜像加速技术及实践
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容阿里云技术专家关尔昱与蚂蚁金服高级技术专家高级技术专家彭涛联合做《Nydus容器镜像加速技术及实践》技术分享。彭涛介绍,nydus容器镜像服务,是一个在CNCF dragonfly项目中孵化的子项目。相比目前的OCI镜像标准,nydus具有按需加载镜像数据、安全增强等特性。nydus能够大大增加容器和应用启动的速度。它的安全相关的特性是提供安全的金融服务和企业级云服务的关键。根据关尔昱的分享,nydus在阿里云上的实践可以将镜像拉取的时间缩短为原来的十分之一。
kata Containers on Openshift
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师介绍及内容红帽中国首席架构师张家驹做主题《Kata Containers on OpenShift》分享。OpenShift是红帽基于Kubernetes的企业级容器平台,本讲主要讨论在OpenShift如何使能Kata containers,技术难点、工作进展及未来走向等。围绕OpenShift的讨论异常活跃,张家驹在演讲中还提到明年的OpenShift 4.8版本将提供Kata Containers的Tech Preview的支持。
Cloud Hypervisor or Cloud Native Hypervisor
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍Intel 系统软件部云原生基础设施软件研发经理朱江云介绍Cloud Hypervisor诞生的缘起,从其架构和特性的介绍,我们可以看到Cloud Hypervisor是一款为云原生打造的虚拟机管理器。Clou Hypervisor技术委员会成员刘奖分享了云原生基础设施对于Kata Containers和Cloud Hypervisor在理论和实践上的根本诉求,给了大家进一步的思考和启发。
KeenTune(轻豚)OS 性能调优的智能助手:如何让应用发挥到最优性能?
内容简介《KeenTune(轻豚)OS 性能调优的智能助手:如何让应用发挥到最优性能?》技术分享。介绍轻豚是一款智能化的调优产品,是全栈性能调优工具。并从以下四个方向带大家认识 KeenTune(轻豚):1、OS 性能调优为什么这么难?2、KeenTune:静态调优/动态调优、3、KeenTune 能做什么?4、如何玩转KeenTune?讲师简介胡玉溪——KeenTune(轻豚)SIG负责人、阿里云高级技术专家。另龙蜥专场视频已经上线至龙蜥社区官网(官网首页-支持-视频),欢迎观看。
阿里巴巴AI智能专场
阿里巴巴AI智能专场 讲师/嘉宾简介: 施兴(叔宝):阿里巴巴自身算法专家 高星(空崖):阿里巴巴算法专家 张宁豫(凌羽):阿里巴巴高级算法工程师 王跃(跃神):阿里巴巴高级算法专家
阿里云总监课第三期第三节:Linux开源存储技术
课程讲师:吴忠杰(储道)课程纲要:a) Linux存储软件概述b) 内核存储软件堆栈c) 用户态存储软件栈下载PPT链接:https://yq.aliyun.com/download/2999
英特尔平台上的功耗性能优化
功耗与性能在许多情况下存在竞争关系,但二者并非总是互斥的。通过合理分配各组件间的功耗,可以有效提升整体性能表现。英特尔高级工程师张锐分享了《英特尔平台上的功耗性能优化》,与现场嘉宾深入探讨了近期基于最新英特尔平台在龙蜥社区中开展的功耗相关工作,并阐述了这些工作的必要性,以及如何运用这些技术来优化功耗管理并提升系统性能。
多核场景下的 Linux 调度器现状和未来|龙蜥MeetUp
分析了多核场景下Linux调度器的挑战与机遇:优化进程唤醒时随核数增加而递增的idle CPU搜索开销;改进默认时间片调度,使其感知进程工作集、线程数据共享等指标,推进同进程线程组在相同LLC domain唤醒以减少跨核缓存失效;探讨了内核调度器支持的用户态BPF自定义调度与AI结合的潜力,即AI预测进程需求辅助BPF生成智能调度策略。
Confidential AI:基于机密计算的 AI 推理安全与隐私保护方案|龙蜥MeetUp
针对AI在医疗、金融等敏感领域应用带来的数据隐私与模型安全推理问题,介绍了基于机密计算技术的Confidential AI解决方案。解析了如何在机密计算环境中实现端到端安全推理,涵盖加密模型部署、端到端通信安全、系统数据落盘加密保护等关键技术,旨在为行业提供可复用的安全推理框架。
调测容器实践|龙蜥MeetUp
况明富提出了将调测工具打包到一个容器内,以容器的方式完成调试环境的"一键式"部署。 调试容器部署后,即可在调测容器内对业务容器或主机系统上的目标的调测,所有的调测活动都可以在此调测容器中进行,使用完后清理此调测容器即可,这样也可避免对主机环境产生污染。这种基于容器的调试方式和策略不仅提高了问题诊断的速度和效率,同时也减少了对生产环境的影响,体现了中兴通讯在容器技术和运维实践方面的先进理念和技术实力。
高效可靠的处理器微体系结构性能测量技术
在Arm成熟的软硬件生态支持下,Arm架构处理器走进数据中心。应用的跨平台迁移及处理器设计研发均依赖于处理器微体系结构的性能数据,准确、可靠的性能测量是性能工程的重要基础。本次演讲围绕性能测量,着重分享了两项工作。第一项工作是关于如何高效地复用硬件性能计数器进行可靠测量,此项工作主要针对现有工具在复用硬件性能计数器测量时存在的低效行为,通过研究Linux内核性能事件的调度机制,提出一种自适应的性能事件分组方法提高性能计数器的复用效率。第二项工作是关于Arm架构处理器实时内存带宽的通用测量方法,Arm架构的灵活性赋予了各硬件厂商定制处理器的能力。此项工作探索了Arm架构下实时内存带宽测量通用方案的可能性。
AArch64架构调用链性能数据采集原理
调用链 (Callchain) 是软硬件事件上下文信息之一,对性能优化和故障排具有非常重要的作用。如著名的火焰图 (Flamegraph) 就是对调用链信息汇总统计和可视化的结果。但是在调用链收集的过程中,工程师往往因为不了解底层的采集原理导致调用链收集不完整,采集开销不可控等问题。本议题核心介绍了在AArch64架构下调用链采集的原理,比较它们之间的不同和阐述适用场景。同时对Linux内核态和eBPF调用链采集做了一些简单介绍。
通过层级内隔离提升软件的安全性|龙蜥大讲堂第112期
内存错误漏洞是攻击者对操作系统发起攻击的一个重要渠道,通过层级内的划分和隔离,可有效地防止攻击者通过对关键数据的破坏来所发起攻击。本次课题将介绍层级内隔离的原理,防御方法,以及部分代表性的研究成果。
龙蜥技术委员会主席杨勇致辞|飞天技术沙龙-CentOS 迁移替换专场
在这个关键时刻,企业面临的挑战远不止现有系统的迁移,更要有前瞻性地考虑,那就是选用何种操作系统来支撑未来业务的拓展,确保 IT 基础设施的持续稳健运行。CentOS 停服事件迫使企业深入审视服务器操作系统的长远稳定使用,同时需要妥善解决当前业务平稳过渡。龙蜥社区致力于为广大用户提供一站式迁移解决方案,因此,社区在 CentOS 替换、一云多芯,包括国产化算力、AI 都有成果落地。
阿里云操作系统迁移最佳实践|飞天技术沙龙-CentOS 迁移替换专场
Alibaba Cloud Linux /Anolis OS 兼容 CentOS 生态,因此能够很丝滑的进行迁移替换。无论是对企业的运维人员,还是对企业操作系统的使用者来说,相对简化了它的维护成本。王喆还通过 SMC 操作系统迁移实践带用户深入了解,不仅阐述了原地迁移方案的独特优势,还针对不同的迁移场景,逐步剖析了整个迁移流程,力求使复杂的操作变得直观易懂,实现了真正的“白屏化”体验。
龙蜥衍生版KeyarchOS国密应用、eBPF安全技术实践介绍|龙蜥大讲堂107期
了解浪潮信息KeyarchOS操作系统在商密方面的技术实现,以及可以使用的支持商密算法的底层加密库和加解密工具。了解eBPF技术在入侵行为检测、违规行为拦截等安全技术方面的实际应用。
基于Intel RDT平台技术的系统资源隔离能力提升|龙蜥大讲堂103期
介绍 Intel RDT 发展概述;RDT 与 NRI 在 Koordinator 混部框架中的开发进展与未来规划。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。