【阿里云总监课第四期】阿里云P10技术专家褚霸:我是一个程序员

简介: 在阿里内部有一个“拜霸爷神教”,不少 P8、P9 级技术专家都是其中的教众,据说褚霸对计算机的了解到了庖丁解牛的地步。这样一位 P10 级别的技术大牛,却说:我是一个程序员。

在阿里内部有一个“拜霸爷神教”,不少 P8、P9 级技术专家都是其中的教众,据说褚霸对计算机的了解到了庖丁解牛的地步。这样一位 P10 级别的技术大牛,却说:我是一个程序员。
_

褚霸,真名余锋,江湖人称霸爷。现阿里云弹性计算负责人,曾一手将数据库团队带到国内云数据库顶尖水平。
褚霸身上标签众多,中国第一代技术网红,软硬兼修,是阿里云备受外界关注的技术大牛。知乎网友对他有一句评价很经典:对于计算机的了解到了庖丁解牛的程度。

磁带机和自建实验室
上世纪八十年代初,中国社会对于科技发展的关注开始趋热。

偶然一次,当时大约 7 岁的褚霸拆了家里的磁带机,结果装不回去了,索性开始思考这个东西为什么能发出声音。从此他一发不可收拾,开始偷家里钱买万用表,电焊器,组建了一个小实验室。

“我发现把交流电接到直流电机里面去不会转,但是装四个二极管进去它就转了。后来上大学学了电路原理,才明白为什么。”少年褚霸成为了一名当时时髦的无线电爱好者,这对他的未来影响深远。

“后来面对未知领域时,你有过去的一些经历,其实你是不怕的。探索出规律,自然也就明白了道理。”褚霸说。

大学时期和病毒的故事
大学时期的褚霸是个潮男,留着长发,还留着胡子,甚至常常去美容院洗脸做面膜。褚霸的理论是成为校园名人需要“软硬件结合”,形象是硬件,能力是软件。某一天,他突发奇想,要做个病毒来显示能力。

那是 1994 年,互联网没有普及,除了学校的 286 电脑,没有其他任何资源。褚霸坐了很久的火车去省城,淘遍各大书店买回几本关于计算机杀毒的书,开始反推病毒怎么写。学徒阶段,褚霸就常常把计算机弄死机,最夸张的时候一天要重启上百次。

临近崩溃的他找到一个叫 RAMInit 的工具,可以用于清除内存的驻留程序。24 年后,褚霸还清晰记得这个小工具,长度是 4156 字节,在它的二进制文件里留有作者的签名:Lei Jun(雷军),没错,就是小米创始人雷军。受此影响,后来褚霸也习惯在自己编译出的二进制文件里,留下签名: “YuFeng is a good boy”。

技术大牛是怎样炼成的?
刚投身互联网的褚霸,觉得自己软件能力相对欠缺。2001 年的某天,褚霸在网上发现了一个荷兰人做的技术博客,清晰具体地描述了 windows 程序的完整制作流程,每个示例还可以购买源代码。于是办了第一张信用卡,花了几十美金买了一份 FTP 服务器搭建的示例。

他开始背代码,一点点理解 FTP 怎么接受事件,监听,接受链接,协议处理……然后再自己扩展到其他协议,比如 POP3,SMTP 等等。

几次购买后,这位博主就没有再收钱。而这些教程让褚霸着实琢磨了两三年。“当时买的绝对是工业级的代码,所以我的起点很高”。褚霸非常感谢这位博主。

褚霸的技术突飞猛进,来到阿里后,褚霸负责的项目越来越复杂,他仍然坚持全链路思考的习惯,这让他异常辛苦但是带来了巨大收获。

例如,当时的项目涉及到底层 IO(Input/Output) 技术。IO 技术涉及面非常广,驱动,块设备,文件系统,内存关系等等,每一个环节都要适配。
对这块知识零起点的褚霸请教了当时内核组负责人伯松,伯松想了想说:我不知道你要多久,但是我有生之年能把它搞明白,就很不错了。

这个回答让褚霸备受打击,但没让他退却。褚霸进入了“魔怔状态”,几乎天天熬夜看代码,把 IO 内核栈所有参数都研究了一遍,然后反推背后的道理。整整 8 个月的坚持,褚霸搞定了 IO 这道难题,将当时淘宝的商品数据库和交易数据库全部迁移到 MySQL 上,系统稳定运行。

640

Linux 之父 Linus Benedict Torvalds 与褚霸

从飞天到神龙,总是有新的挑战
2012 年,中国云计算的攻坚战“飞天 5K”打响。阿里巴巴集结了一批当时阿里集团内最优秀的工程师,投入到自研飞天系统当中,褚霸就是其中一员,负责当时飞天系统的女娲模块。

最终,“飞天 5K”成功了,标志着阿里云成为世界首家对外提供 5K 规模计算能力的云计算公司,褚霸也开始带领阿里云数据库团队 (RDS)。
数据库每时每刻都在运行,对于稳定性要求非常高。从客户的应用端访问,到中间链路层,最后到底层的数据存取,每一个环节都不能出错。
褚霸要求自己团队的人,对于自己写的代码,都要检查三遍以上。“安全的问题需要从事前、事中、事后三个时间轴,以及存储层、网络层、访问层、应用层四个层面,立体化地构建解决方案。”褚霸说。

正是这样的全链路思考和布局,让阿里云数据库产品线 3 年间由两个产品增加到 18 个,市场规模增长了 50 多倍。

2017 年底,褚霸开始全面负责阿里云弹性计算 (ECS),并带领团队研发下一代云服务器——神龙。
640

神龙云服务器组件

这是一个极有前景的项目,过去虚拟机和物理机是水火不相容的,褚霸和他的团队就是要解决这个问题,让用户在阿里云“神龙”云服务器上既能享受到物理机的无损性能,又能灵活弹性使用计算资源。

这是云计算的一个全新领域,只有少数厂商在攻坚,褚霸带领技术团队已经攻克难关,取得了阶段性的成果,下一步则是继续挖掘“神龙”的潜力,让更多用户能用上新技术。

极致的程序人生

11

褚霸参加平昌冬奥会火炬接力

“上得了厅堂,下得了厨房”这是褚霸身边同事对他的评价,无论是一行小代码中的 BUG 还是对未来趋势的把控,褚霸都能在交流中帮助同事提升视野和格局。

有人说程序员把代码当成自己老婆般宠爱,有人说程序员写代码时就像吃大餐般享受,但在褚霸看来,IT 男得有品味,只有这样,他才能将产品做到极致。

“极致”贯穿了褚霸的程序人生,在他身上凝结了从一个优秀程序员到一个杰出程序员所需要的特质,不管是数据库还是弹性计算,都要做到极致、做到业内第一。

12

褚霸喜欢骑行


所以他喜欢骑机车,在空旷无人的道路上,飙车;他爱看时尚杂志;他带着家人,走遍了三十几个国家;一个人自驾 8000 公里,历时半个月从杭州到西藏,经历各种爆胎……

然而,团队里的这帮程序员,不太让他省心。“霸爷霸爷,护照是什么?”当团队里的一员这样问他时,他说自己差点“吐血”。“他们除了写代码,就没有什么业余生活,比如有的人一年四季就穿公司发的文化衫;有的人没有驾照,出门基本靠老婆;还有人连银行卡都没有……”褚霸的想法是,既要在工作上给他们足够的自由,保持他们每个人的独特性,又要“改善”他们的生活。

“让他们知道生活不只有苟且和代码,还有远方。”褚霸说。

阿里云总监系列课重磅上线!聚焦人工智能、弹性计算、数据库等热门领域,首次集齐12位阿里云技术高管,耗时半年精心打磨,从理论到实践倾囊相授,从零开始绘制技术大牛成长路径,限时直播课程免费报名中!欢迎戳“https://yq.aliyun.com/promotion/689”免费报名学习。
IMG_1996

点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
算法 Java 关系型数据库
2年5个月13天,从外包到拿下阿里offer,没想到屌丝也能有今天
不说太多废话,但起码要让你先对我有一个基本的了解。本人毕业于浙江某二本院校,算是科班出身,毕业后就进了一家外包公司做开发,当然不是阿里的外包,具体什么公司就不透露了,在外包一呆就呆了整整2年多,直到现在才从外包离开,如今拿到阿里的offer准备入职了。
|
4月前
|
边缘计算 测试技术 数据格式
小体积,大潜力 - 腾讯混元Dense模型多尺寸正式开源
混元是腾讯开源的高效大型语言模型系列,旨在在各种计算环境中灵活部署。从边缘设备到高并发生产系统,这些模型通过先进的量化支持和超长上下文能力提供了最佳性能。
289 0
|
开发工具 git 缓存
Git忽略规则.gitignore不生效
在项目开发过程中个,一般都会添加 .gitignore 文件,规则很简单,但有时会发现,规则不生效。 原因是 .gitignore 只能忽略那些原来没有被track的文件,如果某些文件已经被纳入了版本管理中,则修改.gitignore是无效的。
62252 4
|
4月前
|
机器学习/深度学习 人工智能 运维
什么是ai智能?AI的九年飞跃史:从AlphaGo到Agent智能体
2025年,AI已深入生活与产业,从“大模型”到“智能体”,技术实现跃迁。智能体具备记忆、工具调用、任务规划与反馈能力,推动AI从“问答”走向“执行”。推理成本下降使AI平民化,落地场景集中在流程自动化与认知决策。但幻觉、责任归属与长程任务仍是挑战。未来将向多模态、端侧计算与联邦智能体发展。
|
7月前
|
SQL 数据可视化 关系型数据库
Doris Manager 24.3 版本正式发布,增强集群巡检能力
Apache Doris 是全球领先的开源实时数据仓库,已被 5000+ 中大型企业广泛应用。为解决传统客户端工具在功能、成本及适配性上的不足,飞轮科技推出专为 Apache Doris 打造的可视化工具 SelectDB Studio。它提供 Desktop 和 Server 两个版本,支持永久免费使用,具备多数据源连接、SQL 编辑器、Profile 分析、日志检索、查询审计和权限管理等核心功能,深度集成 Apache Doris 的联邦查询与湖仓一体分析能力。未来还将新增数据导入与迁移功能,助力用户高效开发与管理数据。
673 27
|
5月前
|
监控 Linux 开发者
理解Linux操作系统内核中物理设备驱动(phy driver)的功能。
综合来看,物理设备驱动在Linux系统中的作用是至关重要的,它通过与硬件设备的紧密配合,为上层应用提供稳定可靠的通信基础设施。开发一款优秀的物理设备驱动需要开发者具备深厚的硬件知识、熟练的编程技能以及对Linux内核架构的深入理解,以确保驱动程序能在不同的硬件平台和网络条件下都能提供最优的性能。
301 0
|
10月前
|
缓存 视频直播
flutter3-dart3-dymall原创仿抖音(直播+短视频+聊天)商城app系统模板
基于最新版flutter3.27+dart3.x+Getx+mediaKit原创实战研发抖音app带货商城项目。集成了直播+短视频+聊天三大功能模块。实现了类似抖音app首页全屏沉浸式联动左右滑动页面模块、上下滑动短视频。
417 1
|
11月前
|
人工智能 算法 芯片
天天都在说的“算力”到底是个啥?一文全讲透!
算力是数字经济发展的重要支撑,尤其在AI和大数据应用中起着关键作用。阿里云致力于构建全球领先的算力基础设施,助力各行业数字化转型。吴泳铭和马云均强调了算力在未来科技竞争中的核心地位。2023年底,我国算力总规模达230EFLOPS,位居全球第二。算力分为通用、智能和超算算力,广泛应用于人工智能训练与推理等场景。中国正加速建设智算中心,推动算力产业链发展,并注重绿色低碳和智能运维,以应对日益增长的计算需求。
16822 19
|
分布式计算 监控 NoSQL
图数据库 Nebula Graph 是什么
图数据库 Nebula Graph 是什么?本文将带你了解它的特性和功能,并提前揭秘部分 Nebula Graph 1.0 功能
3505 0
|
SQL 监控 druid
Spring Boot 整合 Druid 指南
Spring Boot 整合 Druid 指南
47076 3