AI大模型,智能汽车的下一个战场?

简介: AI大模型,智能汽车的下一个战场?

ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面。前两个月,百度、阿里、腾讯加入;进入5月份,先有网易有道,发布了基于“子曰”大模型开发的AI口语老师剧透视频,介绍其基于教育场景的类ChatGPT产品;后有科大讯飞,发布认知大模型“讯飞星火”……总之,各种大大小小的发布会,都在向外界证明自己到底有多大的想象空间。

在大模型进展如火如荼之下,其产业化也被越来越多地提及,从前炒作的“AI+”也再次站上风口。在此背景下,关于AI大模型在汽车领域的应用,也开始热度飙升。

智能汽车的“ChatGPT时刻”来了

目前来看,大模型重构各行各业虽然已经成为业界共识,但ChatGPT“上车”远比预想中的来得更快。作为继家庭和办公场所之外的“第三空间”,汽车正在变成一个新型智能终端。ChatGPT到来了之后,车机关系也受到了更多的影响。

一是ChatGPT对汽车自动驾驶的影响。业内人士分析表示,大模型具备对海量数据的处理能力以及多维度分析能力,可以提供更精准、更全面的数据分析和预测能力,持续优化模型,提高智能驾驶的准确性和可靠性。尤其是随着ChatGPT的出现,人们发现当模型的参数量,达到了一定程度之后,呈现出的效果不是“性能变好”,而是“出奇的好”。

具体到应用层面,大模型对自动驾驶的影响是:在云端,车企可以发挥模型参数量的大容量优势,通过大模型完成绝大多数的数据标注和数据挖掘工作,节省数据标注成本,还能够借助仿真场景构建赋能。在车端,它可以将分管不同子任务的小模型合并为一个大模型,节省车端推理计算时间,增加汽车安全性。最重要的是,被认为是自动驾驶算法终局的端到端感知决策一体化算法瓶颈,或许在汽车接入大模型之后可以得到有效解决,自动驾驶算法升级指日可待。

二是对汽车智能座舱的影响。车载ChatGPT语音助手,可以处理完整的对话,比如追问,并能保持对前后文的理解,形成较为良好的语音交互体验。比如,微软与梅赛德斯—奔驰探索ChatGPT的插件生态系统,为第三方服务集成开辟可能性。驾驶员未来有望通过车载系统完成预订餐厅、预订电影票等任务,进一步提升便利性和生产力,极大地丰富智能汽车与人之间的交互体验。

另外,在改变智能驾驶和智能座舱交互能力的情况下,其也对汽车的研发方式和商业模式产生全新的影响。研发方式方面,由于机器的高效标注能力,使得需要一年时间的数据标注任务,现在只需要短短数小时,研发周期大幅缩短,而且多模态(视觉、语音、手势等)的丰富数据,更可以进一步提升总体的研发效能,降低研发成本。就商业模式而言,车载AI语音交互在它具备情感智能之后,它就会从“雇佣关系”演变成“陪伴关系”,对人的喜好和习惯会更加了解,这将会衍生出全新的商业价值。

产业探索流派纷呈

或许正是意识到了这一点,现在正有越来越多的车企选择接入AI大模型。除了国外的奔驰宣布ChatGPT之外,国内理想汽车也发布了自研大模型MindGPT,百度的文心一言也被接入到了长安、吉利、岚图、红旗、零跑等众多车企之中,就连“让梦想窒息”的法拉利未来,也在新车中纳入了大模型,不难预见未来大模型在智能汽车中普及,将会是大概率事件。从整个参与的车企来看,其发展大模型的方向和侧重点并不相同。

从功能上来看其主要可以分为以下两类:一类是用于人工智能交流对话领域,多数应用在智能座舱上。比如,百度的文心一言,目前已经有东风日产、红旗、长城等近十家车企宣布接入;上海车展期间,商汤科技亮相了日日新Sensenova大模型,展示了其中文语言模型“商量SenseChat”以及“如影SenseAvatar”等与座舱的结合;此前阿里巴巴也宣布AliOS智能汽车操作系统,已接入通义千问大模型进行测试等。

另一类是聚焦智能驾驶的大模型应用。比如毫末智行发布了自动驾驶生成式大模型DriveGPT,帮助解决认知决策问题,最终实现端到端的自动驾驶。理想汽车自研大模型MindGPT,摆脱对高清地图的依赖,让汽车做到更接近人类司机的驾驶表现。蔚来、小鹏、长城、奇瑞四家车企,也已经注册申请了多个与GPT相关的商标。

从参与主体来看,也主要可以分为两类:一是车企亲自下场做的,如理想汽车、百度将自家大模型应用于自家汽车产品等;另一类是外部厂商提供大模型给车企,比如华为盘古大模型、百度文心一言等用于给其他车企使用。

相较通用大模型来说,垂直领域的大模型训练和使用成本更低,或许会成为更容易实现商业化落地的领域。业内人士分析称,汽车有着明确的交互需求,且相较于通用大模型,垂直领域的应用场景相对较小,对参数的量级要求也没有通用型AI那么大。因此,无论是传统车厂还是新势力,抑或是大模型科技厂商,普遍认为智能汽车最有可能成为率先实现大模型落地的B端场景。

大模型规模上车时机尚未成熟

目前来看,尽管ChatGPT的首发“上车”,已经拉开了智能汽车领域大模型较量的序幕。但现阶段距离大模型的真正规模上车,也还有一段距离。

首先,车企做大模型,多模态数据的收集、处理、训练本身是一个难题。自动驾驶所需传感器数据包括激光雷达、毫米波雷达、超声波雷达,以及高清摄像头、GPS等。这些数据来自不同的坐标系,带有不同的触发时间戳,且要考虑到硬件损坏等问题;同时,需要大量的场景数据,比如交通标志线、交通流、行为模型等。这让汽车大模型的研发、训练门槛变得很高。

业内人士认为,模型数据调动管理需要利用智能网联汽车以及计算技术平台、云控技术平台等诸多平台,只有做到海量数据汇聚才可以做交叉,尤其是垂直领域,这和车内的其他系统并不相同,假如基础的平台能力不能打通,其很难向更深层次发展。另外,尽管生成式AI在信息获取上获得了突破,但在决策、执行控制层面,其离真正在汽车上落地还有较大的距离。

另外,端到端的AI大模型训练,需要在智能汽车中构建全新的基于AI大模型的全新算法,这也需要一个过程,业内人士认为至少需要3—5年甚至更长的时间,来完成这一过程。

其次,受限于车载设备的硬件条件,汽车内大模型所需要的硬件配置可能会受到限制,难以有效发挥好作用。具体来说,大模型需要高规格的硬件配置,包括高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的算力资源支撑大模型运行。比如,在自然语言处理领域的GPT-3模型,就需要数万亿TOPS的计算能力。这要求芯片的算力至少要在万级TOPS以上,才能够胜任大模型的计算任务。但是在车载部署场景下,芯片的算力往往只有数百TOPS,远远达不到大型模型的要求。

在此背景下,升级汽车内的算力基础设施已成必然趋势,目前来看智算中心或许会成为未来智能汽车的“标配”。比如,特斯拉发布了独立的云端智算中心——Dojo,总计使用了1.4万个英伟达的GPU来训练AI模型。在国内,小鹏汽车与阿里云合建了智算中心“扶摇”,专门用于自动驾驶模型训练,算力可达到600PFLOPS;毫末智行与火山引擎联合打造了国内自动驾驶行业最大的智算中心“雪湖.绿洲”,每秒浮点运算可达到67亿亿次。不过,目前这些建设还处于探索应用阶段,大模型应用大规模上车的时机,还没有完全成熟。

底层技术才是未来角逐焦点

目前来看,AI大模型对汽车最本质的改变,可能在于它将进一步驱动汽车,从制造属性向科技+消费电子属性转变。在这种背景下,车厂本身的底层科技能力,将会成为未来的决胜关键。

一方面,AI大模型会重新定义“人机交互”和“服务生态”,加速汽车应用服务生态消费电子化,这将改变底层的产品定义。当前车载语音系统底层是未完全成熟的任务型对话系统,尚无法真正实现个性化、情感化、自由化的交互能力,而大模型可以通过深度学习+语音生成,迎来开放场景+自然交互的全新人机交互体验。同时,在研发设计上,随着大模型的OS化,传统的APP上车、点触功能、HMI交付的必要性和重要性值得思考,这意味着汽车“产品”的重新定义。

正如前华为自动驾驶产品部部长苏箐所言:“传统车厂看法首先我的基座是车,现在有些计算机的单点,那么我是把车作为一个基础,试图把计算机嵌进去,这是传统车厂的看法。我们的看法不一样,基础是计算机,车是计算机控制的外设,一个大计算机了事,把车挂上去。这是本质看法不一样。”事实上,在大模型上车之后,汽车的计算中心、智能化、消费电子属性将变得更加明显,其产品定义将遵循消费电子的底层逻辑迭代演变(如APP化、生态服务等)。

另一方面,AI大模型将会改变汽车的现有算法,考虑到大模型应用所需要的硬件成本以及外部环境来看,未来国内企业大模型的技术实力,将更加取决于包括AI操作系统等在内的底层技术。具体来说,原来汽车的自动驾驶算法较为依赖人工,而接入大模型之后,就需要依靠大模型驱动形成新的智能算法,而要构筑这样的算法,除了要做好产品,还要做好平台。

比如,围绕芯片、云端等在内的计算平台,需要做到低成本、可标配;有了好的产品,才能够有足够多的销量,有足够多的销量,才能增加“端到端”(云端到车端)的闭环数据;作为基础支撑的AI大算力芯片,也需要重新考虑车企自身的情况来做,回到底层来说就是谁的训练成本低,谁的转化速度快,谁就将跑到最前面。

拿英伟达的训练芯片来说,一枚芯片被炒到了10万块钱,关键是这种高成本芯片训练方案,对于车企并非最优解决办法。而且受外部制裁影响,这种“外供依赖”随时有可能被掐掉,脆弱性很大。因而从长远来看,车企想要在这一领域走到行业前列去,要么加大对底层芯片的自研力度以减少采购成本,如百度自研AI芯片,要么在AI算法、操作系统上去寻求破局,以找到最佳的应用路径。

目录
相关文章
|
13天前
|
机器学习/深度学习 人工智能 测试技术
PsycoLLM:开源的中文心理大模型,免费 AI 心理医生,支持心理健康评估与多轮对话
PsycoLLM 是合肥工业大学推出的中文心理大语言模型,基于高质量心理数据集训练,支持心理健康评估、多轮对话和情绪识别,为心理健康领域提供技术支持。
160 51
PsycoLLM:开源的中文心理大模型,免费 AI 心理医生,支持心理健康评估与多轮对话
|
6天前
|
人工智能 供应链 PyTorch
TimesFM 2.0:用 AI 预测流量、销量和金融市场等走势!谷歌开源超越统计方法的预测模型
TimesFM 2.0 是谷歌研究团队开源的时间序列预测模型,支持长达2048个时间点的单变量预测,具备零样本学习能力,适用于零售、金融、交通等多个领域。
78 23
TimesFM 2.0:用 AI 预测流量、销量和金融市场等走势!谷歌开源超越统计方法的预测模型
|
9天前
|
机器学习/深度学习 人工智能 安全
GLM-Zero:智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型,开放在线免费使用和API调用
GLM-Zero 是智谱AI推出的深度推理模型,专注于提升数理逻辑、代码编写和复杂问题解决能力,支持多模态输入与完整推理过程输出。
119 24
GLM-Zero:智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型,开放在线免费使用和API调用
|
11天前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
50 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
10天前
|
存储 人工智能 自然语言处理
|
3天前
|
弹性计算 人工智能 自然语言处理
OS Copilot——面向未来的AI大模型
阿里云的智能助手`OS Copilot`是一款基于大模型构建的操作系统智能助手,支持自然语言问答、辅助命令执行、系统运维调优等功能。
29 8
OS Copilot——面向未来的AI大模型
|
5天前
|
数据采集 人工智能 安全
1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化
在人工智能领域,大型语言模型(LLMs)的发展迅速,但如何提升其指令遵循能力仍是一大挑战。论文提出MATRIX-Gen,一个基于多智能体模拟的AI社会模拟器。MATRIX-Gen通过模拟智能体交互生成多样化的现实场景,不依赖预定义模板,从而合成高质量指令数据。它包括MATRIX模拟器和MATRIX-Gen指令生成器,能生成监督微调、偏好微调及特定领域的数据集。实验表明,使用MATRIX-Gen合成的数据集微调后的模型在多个基准测试中表现出色,显著优于现有方法。然而,该方法也面临智能体和场景规模对数据质量的影响等挑战。
49 33
|
12天前
|
人工智能 测试技术
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年
著名数学家陶哲轩联合60多位数学家推出FrontierMath基准测试,评估AI在高级数学推理方面的能力。该测试涵盖数论、实分析等多领域,采用新问题与自动化验证,结果显示最先进AI通过率仅2%。尽管存在争议,这一基准为AI数学能力发展提供了明确目标和评估工具,推动AI逐步接近人类数学家水平。
63 37
|
11天前
|
人工智能 编解码 自然语言处理
Aria-UI:港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型,整合动作历史信息实现更加准确的定位
Aria-UI 是香港大学与 Rhymes AI 联合开发的多模态模型,专为 GUI 智能交互设计,支持高分辨率图像处理,适用于自动化测试、用户交互辅助等场景。
68 11
Aria-UI:港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型,整合动作历史信息实现更加准确的定位
|
7天前
|
人工智能 自然语言处理 API
用AI Agent做一个法律咨询助手,罗老看了都直呼内行 feat.通义千问大模型&阿里云百炼平台
本视频介绍如何使用通义千问大模型和阿里云百炼平台创建一个法律咨询助手AI Agent。通过简单配置,无需编写代码或训练模型,即可快速实现智能问答功能。演示包括创建应用、配置知识库、上传民法典文档、构建知识索引等步骤。最终,用户可以通过API调用集成此AI Agent到现有系统中,提供专业的法律咨询服务。整个过程简便高效,适合快速搭建专业领域的小助手。
96 21

热门文章

最新文章