单芯片处理器走到尽头?苹果&英伟达倾心多芯片封装,互连技术最关键

简介: 单芯片处理器走到尽头?苹果&英伟达倾心多芯片封装,互连技术最关键

当单芯片处理器已达到极限,苹果和英伟达相继发布的芯片证明多芯片封装或许才是未来发展方向,但互连技术仍是一大难题和巨头角逐的主战场。


3 月 10 日,苹果在 2022 年春季发布会上 M1 Max 芯片的升级版 ——M1 Ultra,创新性地采用了封装架构 UltraFusion,将两个 M1 Max 芯片的管芯相连,制造出了具有前所未有性能和功能的片上系统(SoC)。


3 月 23 日,英伟达在 GTC 2022 大会上发布了类似的新闻。黄仁勋宣布推出首款面向 AI 基础设施和高性能计算的数据中心专属 CPU,其中新的 Grace Hopper 可以在同一块主板上两块并联,形成了一个 144 核的 Grace CPU 超级芯片,内存带宽为 1TB/s。


两家公司的芯片具有不同的目标市场。苹果瞄准消费者和专业工作站市场,而英伟达力图在高性能计算市场掀起风云。然而,目标的不同只会凸显快速结束单芯片设计时代面临的广泛挑战。


图源:top10.digital


芯片巨头纷纷入场


多芯片设计不是什么新概念,但直到最近五年才越来越受青睐。AMD、苹果、英特尔和英伟达等芯片巨头都不同程度地涉足其中。


AMD 通过自身的 EPYC 和 RYZEN 处理器在小芯片(chiplet)设计领域展开探索。英特尔在 2021 年架构日活动上发布了下一代英特尔至强可扩展处理器 Sapphire Rapids,这款面向服务器市场的架构使用小芯片「tiles」构建而成。


现在,苹果和英伟达也加入了多芯片设计的行列,尽管面向的目标市场截然不同。应该看到,向多芯片设计的转变是由现代芯片制造中的挑战所驱动的。晶体管小型化的速度已经变慢,但前沿设计中晶体管数量的增长仍未见放缓的迹象。


以苹果 M1 Ultra 芯片为例,它的晶体管数量为 1140 亿,是个人计算机芯片中有史以来最多的,为 M1 的 7 倍。单个 M1 Max 的芯片面积为 432 平方毫米,由此推知,M1 Ultra 的面积约为 860 平方毫米(官方数字未知)。


M1 Ultra 示意图。


英伟达 Grace CPU 的晶体管数量处于保密状态,但与它一起发布的 Hopper H100 GPU 拥有 800 亿个晶体管,20 块即可承载全球流量。2019 年,AMD 发布的 64 核 EYPC Rome 处理器拥有 395 亿个晶体管。


英伟达 Grace CPU 超级芯片。


市场研究公司 Counterpoint Research 的研究分析师 Akshara Bassi 表示,「随着芯片面积变得越来越大以及晶圆成品率问题越来越重要,多芯片模块封装设计能够实现比单芯片设计更佳的功耗和性能表现。」


目前,除了致力于造出单个完整硅晶圆的 AI 芯片创业公司 Cerebras 之外,芯片行业似乎达成了一致意见,即单芯片设计变得越来越「得不偿失」。


2021 年 4 月,Cerebras 发布了 2.6 万亿晶体管、比 ipad 还大的巨无霸芯片 WSE 2


此外,行业转向小芯片与芯片制造商的支持是同步进行的。2020 年 8 月,全球最大芯片代工厂台积电推出了 3DFabric 先进封装技术系列,包含了前端 3D 硅堆栈和后端封装技术。


AMD 在其 EPYC 和 RYZEN 处理器设计中使用了属于 3DFabric 的技术,并且几乎可以肯定苹果 M1 Ultra 芯片也使用了台积电相关封装技术(虽然苹果尚未给予确认,但 M1 Ultra 是由台积电制造的)。


其他芯片巨头如英特尔,它有自己的封装技术,如 EMIB 和 Foveros。尽管最开始意在自己使用,但随着英特尔代工服务的开展,该公司的芯片制造技术正变得与更广泛的行业息息相关。


多芯片设计的前景如何?


另一家市场研究公司 Hyperion Research 的一位高级分析师 Mark Nossokoff 认为,「围绕基础半导体设计、制造和封装的生态已经发展到了能够支持『设计节点经济可靠生成小芯片解决方案』的程度。无缝集成多样化小芯片功能的软件设计工具也已经成熟到可以优化目标解决方案的性能了。」


小芯片将继续存在,但就目前而言,该领域是一个孤岛。AMD、苹果、英特尔和英伟达正在将自研的互连设计方案应用于特定的封装技术中。


今年 3 月 2 日,英特尔、AMD、Arm、高通、台积电、三星、日月光、谷歌云、Meta、微软等十大巨头宣布成立 Chiplet 标准联盟,推出了通用小芯片互连标准(Universal Chiplet Interconnection Express, UCIe),希望将行业聚合起来。该标准提供了一个面针对成本效益性能的「标准」2D 包和面向前沿设计的「高级」包。


UCIe 还支持通过 PCIe 和 CXL 进行封装之外(off-package)的连接,从而为高性能计算环境中跨多台机器连接多个芯片提供了可能。


UCIe 白皮书中 UCIe 封装方案示例。


UCIe 标准是一个开始,它的未来仍有待观察。Nossokoff 对此表示,最初发起 UCIe 的创始成员代表了众多技术设计和制造领域的杰出贡献者,但很多主要组织并没有加入进来,包括苹果、AWS、博通、IBM、英伟达以及其他硅代工厂和内存芯片供应商。


Bassi 指出,英伟达可能特别不愿意加入 UCIe 联盟。英伟达已经为定制硅集成开放了自研的 NVLink-C2C 互连技术,使其成为了 UCIe 的潜在竞争对手。


虽然 UCIe 和 NVLink-C2C 等芯片互连技术的命运决定了行业游戏规则,但它们不太可能改变行业现有局面。


原文链接:https://spectrum.ieee.org/single-chip-processors-have-reached-their-limits

相关文章
|
机器学习/深度学习 人工智能 前端开发
未来趋势:人工智能在前端开发中的应用
随着人工智能技术的快速发展,前端开发领域也迎来了新的变革。本文将深入探讨人工智能在前端开发中的应用现状,并展望未来的发展趋势,带领读者一窥未来前端开发的可能面貌。
|
传感器 供应链 监控
数字化应用场景
数字化应用场景
830 0
|
1月前
|
弹性计算 小程序 安全
阿里云服务器199元一年:企业专享,2核4G/5M带宽/80G系统盘,2026年值得买!
阿里云企业专享ECS u1实例,2核4G内存、5M带宽、80G云盘,仅需199元/年,支持Windows/Linux,新老用户同享,续费不涨价。性能稳定,适合官网、电商、小程序等多种企业场景,助力中小企业低成本上云。
|
6月前
|
C# 图形学 开发者
【Unity3D实例-功能-镜头】第三人称视觉
本文介绍了Unity中常用的第三人称视角实现方法,适用于角色扮演游戏。内容包括安装Cinemachine插件、为角色添加面朝向点、创建虚拟摄像机、编写控制脚本及测试运行,帮助开发者快速掌握镜头控制技巧。
229 0
|
人工智能 前端开发 API
OpenAI 12天发布会内容全纪录!一文快速回顾获知亮点信息,原文附发布会中文字幕视频
OpenAI 于12月5日宣布将举行为期12天的系列发布活动,期间每天发布一个产品或样品,包括备受期待的AI视频生成工具Sora和新的推理模型。本文将介绍这12天的发布会每日的发布内容和相关亮点信息。
976 82
|
11月前
|
存储 JSON Java
《从头开始学java,一天一个知识点》之:方法定义与参数传递机制
**你是否也经历过这些崩溃瞬间?** - 看了三天教程,连`i++`和`++i`的区别都说不清 - 面试时被追问"`a==b`和`equals()`的区别",大脑突然空白 - 写出的代码总是莫名报NPE,却不知道问题出在哪个运算符 🚀 这个系列就是为你打造的Java「速效救心丸」!我们承诺:每天1分钟,地铁通勤、午休间隙即可完成学习;直击痛点,只讲高频考点和实际开发中的「坑位」;拒绝臃肿,没有冗长概念堆砌,每篇都有可运行的代码标本。上篇:《输入与输出:Scanner与System类》 | 下篇剧透:《方法重载与可变参数》。
261 25
|
存储 弹性计算 搜索推荐
快速部署 Qdrant 社区版
Qdrant是一个矢量相似性搜索引擎,提供生产就绪服务和方便的 API,用于存储、搜索和管理具有额外负载的点(即矢量)。您可以将有效负载视为附加信息,可以帮助您深入搜索并接收可以提供给用户的有用信息。本文介绍如何使用计算巢快速部署Qdrant服务。
快速部署 Qdrant 社区版
|
自然语言处理 监控 算法
【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享
本文详细阐述了Prompt的设计要素,包括引导语、上下文信息等,还介绍了多种Prompt编写策略,如复杂规则拆分、关键信息冗余、使用分隔符等,旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化,可逐步实现更优的Prompt设计。
4158 11
|
Cloud Native 关系型数据库 分布式数据库
亚太唯一,阿里云连续4年稳居Gartner全球云数据库报告「领导者」
在“愿景完整性”和“执行能力” 2大评估维度中,阿里云均取得了历史最好成绩
亚太唯一,阿里云连续4年稳居Gartner全球云数据库报告「领导者」
|
Dubbo 网络协议 Java
性能基础之常见RPC框架浅析
【4月更文挑战第23天】性能基础之常见RPC框架浅析
838 1
性能基础之常见RPC框架浅析