阿里云高级技术专家李鹏:AI基础设施的演进与挑战 | GenAICon 2024

简介: 阿里云高级技术专家、阿里云异构计算AI推理团队负责人李鹏将在主会场第二日上午的AI Infra专场带来演讲,主题为《AI基础设施的演进与挑战》。

  图片1.jpg


ChatGPT面世以来,生成式AI已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。


AI大模型飞速迭代,创新应用层出不穷。我们正处于技术野蛮生长的爆发时刻,见证着AI向通用人工智能全速冲刺的破竹之势。


值此之际,由智一科技旗下智东西联合智猩猩发起主办的2024中国生成式AI大会将于418-19日在北京JW万豪酒店举办。今年大会以“重构世界 奔赴未来”为主题,拟邀请50+位重量级嘉宾同台分享,以前瞻性视野全景式解构生成式AI的时与势、危与机、破与立。这是继2023年举办国内首场聚焦AIGC的高规格创新峰会后,智一科技旗下智东西联合智猩猩发起主办的第二届生成式AI行业盛会。


大会由主会场峰会+分会场研讨会/论坛+展览+榜单组成,其中主会场第一日将进行开幕式、大模型专场,第二日将进行 AI Infra 专场、AIGC 应用专场;分会场第一日下午将进行智猩猩具身智能技术研讨会,第二日上下午分别进行智猩猩 AI 智能体技术研讨会、以及中国智算中心创新论坛。【 AI 生产力创新先锋-中国生成式 AI 企业 TOP50】榜单将在大会第二日上午正式揭晓。

 

阿里云高级技术专家、阿里云异构计算AI推理团队负责人李鹏将在主会场第二日上午的AI Infra专场带来演讲,主题为《AI基础设施的演进与挑战》。

 

嘉宾介绍

 

李鹏,阿里云异构计算高级技术专家,毕业于北京航空航天大学计算机系,目前是阿里云异构计算AI推理团队负责人,负责生成式AI推理的性能优化工作,构建了AIACCDeepGPU等阿里云AI加速套件。在GPU领域深耕近10年,其中负责的自研加速框架AIACC帮助阿里云在2020年在斯坦福DAWNBench竞赛的图像识别(Image Classification on ImageNet)榜单中,包揽了训练时间、训练成本、推理延迟以及推理成本四项第一。

 

3b803e1dcb059473cee4bf1586541f5c.png

 

演讲概要

 

人工智能当前已经迈入了快速发展的阶段,尤其是大语言模型的突飞猛进正给各行各业带来了日新月异的变化。AIGC的场景对云计算AI基础设施与产品也提出了非常鲜明的发展要求。我将从产业一线的角度与大家一起探讨面向AI与大模型计算的场景下,如何构建稳定、安全、弹性的云基础设施架构,以满足云上动辄千亿规模的参数量及极大的算力需求。

 

相关文章
|
4月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3120 166
|
4月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
4月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
750 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1118 51
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1203 60
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
608 30
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
598 1
|
4月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
4月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
373 3
|
4月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
502 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?

热门文章

最新文章