AI原生芯片

简介: 我们都知道,全球芯片制造企业中,制程工艺最先进的,就是台积电。过去几年,台积电最大的客户就是苹果,占到了年度营收的20%以上。

我们都知道,全球芯片制造企业中,制程工艺最先进的,就是台积电。过去几年,台积电最大的客户就是苹果,占到了年度营收的20%以上。

 

既是自己的第一大客户,而这个客户还非常愿意尝试最新的制程工艺;因此,当台积电量产10纳米、7纳米、5纳米的时候,苹果始终都是最早尝鲜的那个。

微信图片_20211224143318.jpg

如今,这个“国际惯例”似乎要被打破了。据外电报道,台积电3纳米或将于明年7月量产,而率先引入的客户会有两家,一家是英特尔,另一家则是Graphcore。

 

英特尔咱们以后再说,先说这家Graphcore,其实是一家成立仅仅6年时间的英国公司。也是在今年,这家公司获得了E轮融资,估值高达27.7亿美元,也是西方国家里唯一的半导体行业“独角兽”(估值超过10亿美元的未上市公司)。


微信图片_20211224151143.jpg


那么,为什么Graphcore这么值钱?老冀仔细琢磨了一下,想出了一个理由:因为Graphcore是一家“AI原生”的芯片设计公司,只有它设计的IPU(Intelligence Processing Unit),从一开始就是为了AI(人工智能)而生的。

 

说到AI,大家应该也能够感觉到,经历了数字化浪潮之后的我们,即将进入智能化时代。未来,越来越多的企业、消费者、地方、场景都会用到AI。最近老冀就看到了一个新闻,全球领先的新能源电池生产商宁德时代,就与AI公司第四范式达成战略合作,要让AI系统与现有生产系统对接,实现对生产线数据的实时分析与决策。

 

AI应用的过程一般可以分为训练和推理,哪个阶段都离不开强大算力也就是芯片的支持。以AI训练为例,要满足其不断增长的需求,一方面需要不断提升芯片的计算能力,另一方面可能大家就知道得比较少了,那就是还需要不断提升存储容量和带宽,这是因为在AI训练的过程中需要存储大量的中间激励函数。


微信图片_20211224151309.jpg


可是,目前用于AI训练的主流芯片——GPU,当初是为了大规模并行计算而开发的,那个时候还没有大规模AI计算的需求,这也导致其在做AI训练的时候存在短板。

 

其中一个比较大的短板,就是“存储墙”。简单来说,无论是CPU还是GPU,它的计算单元与大部分的存储单元是分开的,而要完成一个复杂的AI训练,就需要在计算单元和存储单元之间频繁地、大批量地传输数据。可是,最近这些年数据传输的提升速度,远远赶不上计算能力的提升速度,这就导致AI训练卡在了这个瓶颈上。


微信图片_20211224151328.jpg


Graphcore想出了办法解决这个瓶颈,它设计的第一代IPU拥有高达1216个核,每个核里都集成了计算单元和内存,使得单个IPU的存储带宽达到了45TB,比性能最快的HBM还提升了50倍以上。而且,由于避免了频繁访问外部存储,在相同算力下,IPU的功耗还降低了一半。


微信图片_20211224151347.jpg


正因为IPU解决了AI计算的痛点,2019 年,Graphcore的IPU一经推出,立即获得了微软、戴尔、Uber、DeepMind(曾经发布过击败人类所有围棋大师的AlphaGo的那家大神级AI公司,如今已经归于Google旗下)等科技巨头的青睐,因为它打破了AI处理能力的瓶颈。

 

老冀看到微软公司研究员Sujeeth Bharadwaj曾经表示,微软曾经用AI来读取X光胸片并诊断肺部病症。一开始AI训练用的是最高端的GPU,结果花了5个小时;改用Graphcore的IPU之后,只用了半个小时就搞定。

 

不过,鉴于IPU要集成这么多的核,还要把计算单元和内存“攒”在一起,这就导致了非常复杂的芯片内部结构,也让IPU成为了当前最复杂的处理器芯片。2020年7月,Graphcore发布了第二代IPU GC200,它采用了台积电7纳米工艺,晶体管数量高达594亿个,比两个月前NVIDIA发布的安培架构GPU A100的晶体管数量还要多出10%。


微信图片_20211224151408.jpg


这么复杂的芯片,当然是制程工艺越先进,越能够缩小裸片面积,越能够降低功耗。因此,虽然台积电最先进的3纳米工艺还没有量产,Graphcore却已经急吼吼地找上门来。对于台积电来说,也是非常乐于接受像Graphcore这样的新鲜客户,一来能够帮助检验制造工艺的可靠性,二来说不定将来Graphcore能够长成像苹果、AMD、高通那样的大客户呢?


微信图片_20211224151428.jpg


不过,如果IPU能够在AI领域成为主流的话,GPU的地位就将动摇,这也许会影响到GPU老大NVIDIA的江湖地位。要知道,正是因为赶上了AI的风口,NVIDIA的市值才得以超越领跑几十年的英特尔,成为芯片行业新的领袖。

 

要知道,Graphcore与NVIDIA还有一笔旧账要算,它的两位创始人 Nigel Toon 和 Simon Knowles曾经创办过一家名为Icera的芯片公司,并在2011年被NVIDIA收购。他们两人从NVIDIA离职之后,才在2016年创办了Graphcore。由于在NVIDIA工作过一段时间,他们对于GPU在AI计算中的优点和缺点都门清。

 

Graphcore的早期投资人同时也是ARM公司的联合创始人Hermann Hauser曾经有过一个著名的论断:在计算机的计算架构上,历史上一共只发生了三次革命,第一次革命上个世纪 70 年代的 CPU,第二次革命上个世纪 90 年代的 GPU,第三次革命则是2019年横空出世的IPU。他的论断会成为现实吗?

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
3月前
|
人工智能 运维 监控
首个云上 AI 原生全栈可观测平台来了!
9月21日,2024 云栖大会,阿里云发布全新的 AI 原生全栈可观测平台,首次实现云上 AI 大模型从训练到推理再到应用的全链路实时观测、告警与诊断。
173 13
|
2月前
|
人工智能 Cloud Native 安全
从云原生到 AI 原生,网关的发展趋势和最佳实践
本文整理自阿里云智能集团资深技术专家,云原生产品线中间件负责人谢吉宝(唐三)在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中,网关所扮演的各类角色,AI 应用的流量新特征对软件架构和网关所提出的新诉求,以及基于阿里自身实践所带来的开源贡献和商业能力。
192 12
|
6月前
|
机器学习/深度学习 人工智能 搜索推荐
《百炼成金-大金融模型新篇章》––09.金融级AI原生的发展
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。
|
2月前
|
人工智能 安全 芯片
【通义】AI视界|谷歌 Tensor G5 芯片揭秘:1+5+2 八核 CPU,支持光线追踪
本文由【通义】自动生成,涵盖黄仁勋宣布台积电协助修复Blackwell AI芯片设计缺陷、苹果分阶段推出Apple Intelligence、OpenAI保守派老将辞职、英伟达深化与印度合作推出印地语AI模型,以及谷歌Tensor G5芯片支持光线追踪等最新科技资讯。点击链接或扫描二维码,获取更多精彩内容。
|
2月前
|
消息中间件 人工智能 Cloud Native
|
2月前
|
机器学习/深度学习 人工智能 JSON
微信小程序原生AI运动(动作)检测识别解决方案
近年来,疫情限制了人们的出行,却推动了“AI运动”概念的兴起。AI运动已在运动锻炼、体育教学、线上主题活动等多个场景中广泛应用,受到互联网用户的欢迎。通过AI技术,用户可以在家中进行有效锻炼,学校也能远程监督学生的体育活动,同时,云上健身活动形式多样,适合单位组织。该方案成本低、易于集成和扩展,已成功应用于微信小程序。
|
28天前
|
人工智能 Anolis 开发者
|
3月前
|
人工智能 Cloud Native Java
新趋势、新开源、新实践|云栖大会 AI 原生应用架构专场邀您参会
新趋势、新开源、新实践|云栖大会 AI 原生应用架构专场邀您参会
207 17
|
2月前
|
人工智能 机器人 云计算
【通义】AI视界|OpenAI据称已计划联手博通和台积电共同打造自研芯片
本文由【通义】自动生成,涵盖苹果iOS 18.2将集成ChatGPT、OpenAI联手博通和台积电自研芯片、微软指责谷歌发起影子运动、英伟达高管预测AI将呈现人类形态、OpenAI董事会主席的初创公司估值达45亿美元等热点资讯。更多精彩内容,请访问通通知道。
|
2月前
|
数据采集 人工智能 搜索推荐
【通义】AI视界|迎接Apple Intelligence,Mac家族进入M4芯片时代
本文概览了近期科技领域的五大热点:苹果宣布Apple Intelligence将于2025年4月支持中文;新款Mac将搭载M4芯片;ChatGPT周活跃用户达2.5亿,主要收入来自订阅;Meta开发AI搜索引擎减少对外部依赖;周鸿祎支持AI发展但反对构建超级智能。更多详情,访问通义平台。