欢迎收听播客《云上云下》
今天,和大家分享一档播客节目「云上云下」。
在本期节目中,主持人永翎邀请到了阿里云智能科技研究中心主任 安筱鹏,和埃夫特软件总工 李浩来,一起聊了聊关于大模型和工业制造、工业机器人的话题。
大模型的战争的第一枪打响在搜索领域,那第二枪将会在那里打响?在对话中,安筱鹏从三个角度分析了为什么大模型未来的主战场在工业,以及要从行业和环节两个维度去理解大模型在工业场景中应用的理由。
此外,三位还一起讨论了机器人的发展趋势,现阶段机器人可以完成一项任务,但不能应对复杂的业务场景,当大模型的应用从数字空间走向物理空间,机器人也会从四肢发达演进到头脑发达,具有通用性和智能化。最后,他们一起聊了聊大模型未来的生态以及哪类公司会在这样的生态下获得优势。
当工业机器人开始使用大模型,会发生什么?
时间轴 Timeline
03:39
大模型在工业领域可能带来的变革
07:51
工业机器人未来的几个转变
15:12
大模型的应用在工业领域可能有五个重要的方向
19:12
用两个维度来理解未来工业场景
23:40
大模型的三个阶段:理论模型、工程模型、垂直行业大模型
26:20
埃夫特未来机器人的更多可能性有哪些
29:26
为什么说大模型的主战场在工业
下文为播客内容精选,有删减。
01
大模型接下来的第二枪会在哪里?
永翎:大模型的第一枪是从ChatGPT开始,以像人一样对话的方式让大家感觉到AGI的时代到来了。想问问两位,大模型接下来的第二枪和第三枪会在哪里打响?
安筱鹏:我觉得有几个观察的视角。第一是大模型本身的技术能力仍然处于快速迭代和演进的过程中;第二,有些大模型的能力随着它的功能不断完善,开始对IT领域、互联网领域、软件领域进行一些升级和改造,这种升级改造我们已经看到了一些趋势,比如对搜索引擎以及像微软等对于 Windows office GPT 的功能的优化和升级。
更大的第三类涉及到工业软件,涉及到比如我们的客户关系、管理、制造、执行系统、 PLC的底层的等等。在对软件的改造和升级之后,它会进一步应用到各种行业和场景中间,比如说石化、石油、冶金、制造等等方方面面,这个我觉得可能是一个比较大的趋势。
李浩来:对,我觉得安老师这个讲得很正确,他是从技术的角度和硬件角度做了判断。我从应用层面看,比方说在搜索领域打开来大模型,目前我们看到它比较大的一个特征是:对用户的交互性做到了极大的提升。在大模型战争里,交互性这方面可能会有更多突破。
永翎:这些工业软件如果运用了大模型,它可能会变成一个什么样的形态?它可能会对于这个工业的生产制造环节会可能有什么样的提升和改变?
安筱鹏:因为这件事情本身技术还处于快速迭代的过程中,仍然不成熟。第一是只要有软件涉及到人机交互的地方,都会带来新的创新空间。
第二,它会改变传统软件的流程,传统软件有一套固化的流程,这种固化的流程会在未来会加速形成一种新的软件的体系或者功能架构,这种功能架构是面向角色、面向场景、面向特定的应用—— AI 大模型的到来加速它的进程,并不是说之前没有,而是此前整个的软件体系,比如 SaaS化、云化也正在向这个方向演进。但是大模型的到来加速了进程。
第三,这里边有一个关键是技术的变革。因为我们讲 ChatGPT 讲的是生成小作文,生成文字内容。但是我们也知道大模型它也可以生成软件,而软件功能的生成,这种强大的能力会改变很多工业软件和工业软硬件之间、业务系统之间的交流互通、数据的连接、集成。在我看来,这种连接和集成在某些领域可能是具有非常有突破性的,特定领域可能是具有革命性的。
李浩来:对于现在的工业发布的软件,确实是一个革命性的突破。在工业制造领域,特别是在一些大型系统里,是由多个软件来组成的,这就是我们常常说的信息孤岛或者是数据孤岛的一些现象。
我觉得这一块是特别可以强调的,通过刚才安老师说的,大模型对数据处理的畅通能力,我们可以做一些自动生成出的软件,其实可以很容易把数信息误导或者数据误导的问题解决掉。
02
大模型给机器人带来哪些可能性?
永翎:在两位看来,大模型将给工业机器人带来哪些可能性?
李浩来:从现阶段来看,机器人的外形不会做太多的变化,但是它可以做的事情就特别多了。比方说我们通用的工业机器人,它可以做焊接的,也可以做喷涂,但一个机器人只能做一件事情。
如果有了大模型,比方说在飞机制造领域里,它对单个的机械的这个重复性要求不高,我们不会一次性生产很多很多台飞机,很多时候机器人完成了一台这个飞机的喷涂工作后,就会等待漫长的时间做下一个喷涂的工作。但如果说给飞机喷涂的机器人,以后可以同时给飞机做焊接,或者是做铆钉这些工作,它的通用性就适配得很高,对制造业的成本节省是比较大的突破。
安筱鹏:我觉得未来会面临几个转变。第一是大模型的应用会从数字空间的应用走到物理空间,从赛博空间走到原子、比特的世界。就是我们经常开玩笑的一句话:训练完了之后大模型开始下山了。
第二个是它对机器人意味着从四肢发达演进到头脑发达。过去机器人可能是四肢发达,头脑简单,现在可能是四肢发达,头脑也发达,因为他被大模型被武装起来了。大模型是学了人类社会几千年来所有知识的一个学霸,这个学霸他就比较聪明,他这个头脑就会被重新武装起来。
第三个转变是刚才李总所说的,机器人本身它会从专用到相对来说通用,过去只能干一件事,现在可以干两件事、三件事。
第四个转变我们把它抽象出来,是从做确定性的事情到不确定性的事情,过去我们机器人在一个生产线上,动作都是被设定好的,它要重新做一个新的动作,就需要去重新注入新的软件。但大模型进来了,它变得越来越聪明,它的能力就可以应对更复杂的业务场景。从一个做确定性的动作到做一个不确定性的动作的本质就是智能,这是智能的一个高级阶段。那就回到了我们讲的人工智能、智慧城市。
智能的本质是什么?智能的本质就是一个主体对外部环境的变化作出响应的能力,这叫智能。今天的这个主体可能是一个机器人,可能是一组机器人,可能是机器人跟其他的设备的一个联合和联动,这种联合和联动会因为大模型的出现把它的智能提高到一个新的维度上,这是从四个角度去理解它所带来的这样的一个变化。
永翎:Google 发布了 PaLM- E,你就发现了这个算法的原理,跟人的思维过程是一样的,比如说我去这个手我抓一个东西,你首先其实先是看,就是你看你的手越来越接近他了,你越来越接近的时候,然后手确实碰到了以后会有一个触觉的反馈。然后这个触觉的反馈,会跟你视觉的反馈能对齐在一起。
或者比如一个家用机器人,想找一瓶水,但视野里没看到有这个水,然后它就看到了冰箱,但是他就可能有这个推断能力说,这个冰箱里可能有水,他先去打开冰箱拿开水。我觉得这样的能力可能是说机器人就从现在看的从数字世界,然后进一步,再到物理世界其实是更再往这一步走,就更能发挥出推断跟行动的能力。
李总工觉得工业里的机器人需不需要这样的能力,或者说在哪一方面上,哪一个具体的环节上,您觉得在这方面能会发出更大的场景出来?
李浩来:比如做焊接和喷涂的机器人,需要我们对不同的加工件做处理,但加工件的多样性是一个比较难处理的一个问题。比如在客户定制化的产品上,加工件的复杂性会变得大了很多,但借助大模型,它对这个异常场景,或者是说这个位置场景的可识别的程度会非常高。这时候我们通过工业机器人的一些操作,就可以很顺利地把这些加工件都完成掉。
03
未来大模型在工业领域里的应用有哪些
永翎:想问问安院长,您觉得大模型在工业软件领域最有可能先落地的行业,或者说具体的场景有哪些?
安筱鹏:总的一个逻辑是首先改变的是软件,整个工业的软件体系会因为大模型被重构。比如说前段时间阿里也在做这样的一些研究,通义千问的工作。另一方面像西门子跟微软在做的一些合作,在今年 4 月份的汉诺维博览会上也在做这样的一些探索性的工作。
未来,大模型的应用在工业领域可能有五个重要的方向:第一是它会带来工业产品本身智能化和客户企业的升级,比如说像车载的操作系统,像无人驾驶的这个加速的迭代等,这是第一个产品本身未来有很多的 IoT 的产品,智能化的产品会因为大模型的智能化水平会提高。
第二是在工业的研发设计。产品的研发工具、研发手段的创新、能力的升级和模式的创新。比如说在仿真汽车、飞机、服装,包括手机集成电路的仿真这方面会有应用的空间。
第三种是围绕着生产过程的车间里面的人、机、采购等等这样的环节会进行新一轮的智能化升级。
第四是围绕着产品全生命周期,比如说客服、质检。
第五个是整个企业的管理层面的。这么过去讲的ERP、CRM、客户关系管理、IT的管理系统的软件作为一种新的生产力工具,会进行迭代和升级。
像阿里的钉钉,在4月18号已经发布了一些应用的场景,这种场景在工业中间也会快速的去推广普及,是作为一种新的生产力工具,已经看到了这样的一些应用。
永翎:工业领域或者工业机器人相对于 ChatGPT 的文本型态模型要更复杂,它涉及到多模态的问题。比如需要积累大量且真实的视觉数据,包括各种模态的数据如何对齐,这对工业领域来说困难吗?
安筱鹏:有两个维度去理解未来工业场景中间训练专属的行业的或者特定环节的大模型,一个维度是行业的维度,一个维度是环节的维度。
所谓行业的维度是因为每一个行业都有自己的知识,比如说化工、冶金、汽车、食品、集成电路,每一个行业在它的特定行业中间都会积累,各自领域中间都会积累一些数据,那不同的行业本身积累的数据的多少是有巨大的差异的。有些数字化技术比较好的,它已经积累了大量的数据,比如像一些能源、电力做得很好的。
另一个维度是环节的维度,不同的环节积累的数据方式是不一样的。比如说这个产品本身,你是个工程机械,你是个汽车,你是架飞机的发动机,那么这个产品本身会源源不断的产生数据,这是在产品本身的维度。同时你在设计阶段,过去已经积累了大量的 EDA的工具,集成电路的设计、飞机的设计等。在你的生产车间,就是设备运行过程中也会产生各种数据。最后你的客服服务,你的质检的大量的采集视频的数据等等。
这两个维度一个横坐标,一个纵坐标,它们交叉起来的时候,会在特定行业的特定环节会形成一些数据,那不断的去训练会解决这个行业的特定的问题,我觉得可能未来是这样一种趋势。
04
哪类公司会在这样的生态下获得优势?
永翎:刚才您说的又有行业又有环节,那我是提供底层大模型的,上面可能还有服务供应商,再上面还有企业自己本身积累的这些内容跟数据,您觉得未来会形成什么样的生态?哪类公司可能在这样的生态下获得优势?
安筱鹏:首先大模型这三个字我们要进行进一步拆解。大模型我认为它有三个类型或者三个阶段。
首先第一个是理论的大模型,就像谷歌的 Transformer 这个模型,第一个阶段这个理论模型。
第二个模型叫做工程模型。那工程模型就是你给他喂了各种各样的人类社会的知识,但是他没有进行反馈,还没有给他做些反馈,他只是学了,但是学的效果怎么样,也没有人告诉他学套日不好,这叫做工程模型。
第三类就是人们给它一些反馈,使得它成为具备了通用服务能力的一个模型。通用服务的能力模型再向前演进,就叫做垂直行业大模型。
有了这样一个大模型之后,某些传统的那些解决方案提供商,它可能有数据,它可以训练,基于行业大模型再到一个企业的时候,它可以把自己企业的一些数据可以再进一步来训练更适合自己和的这种业务场景,我觉得这是一个演进的过程,在这个过程中底层的大模型的企业数量一定是非常有限的。
那相应的行业模型可能就会有各个行业基于基础或者说工程化的模型,或者通用模型去迭代自己的,那可能会是一个百花齐放的状况。在行业模型之上可能也有更多的给各个企业提供解决方案,它未来是一个丰富的生态,靠一家公司不可能把所有的环节都做完。但这里边也不排除有些专业的小模型和开源的模型参与到服务的体系中。
永翎:也想问问李总工,在未来大模型的这个生态里,埃夫特会是一个什么样子角色跟位置?
李浩来:其实安老师讲的对,他讲的一个场景就是我们现在正在做的工作,包括我们开发了一款基于机器人应用程序编程的一个平台,然后我们就积累了比较多的这个机器人数据,就是应用程序的一些设计。然后在这上面我们做了一些这个大模型的这个翻停和调试,极大提高了应用程序开发的效率。
永翎:如果你们大模型做得非常好,那有没有可能你们的大模型会服务别的机器人?
李浩来:其实公司领导有这方面的考量,包括我们最近也投资成立了一个平台性的企业,叫工业机器人创新中心,其实就有给行业服务的内容在里面。
永翎:在机器人的领域里本身埃夫特肯定有大量的数据的积累,所以你们其实可以很快去探索尝试?
李浩来:是的,我们把这个叫做硬件标准化。像控制这一块的,以后会做成这种通用型的功能,并且这个东西随着规模变大,成本会越来越低。那真正能给客户对不同场景的适配,还是要靠软件以及这个基于大模型的场景的认知能力。
05
大模型的主战场在工业
永翎:从云的算力的角度,能以什么样方式去推动行业的发展?
安筱鹏:我想首先站在进全球产业发展的角度来看,尤其是中国跟一些其他国家在这一轮的国家和企业之间的竞争来说,它是一个立体的、持续的、长期的一种演进和竞争的态势。具备了算力、算法、场景以及这种人才优势的企业会是一个主力军。我们在讲大模型,讲AI,但实际上这个模型跟云,尤其是公有云,然后跟人才、场景的结合是非常关键的。
场景的结合指的是什么呢?比如说你最终的大模型的应用,你要形成一个商业的闭环,我经常说的一个观点是它不是一个概念车,我们今天讲的大模型它不应该是一个概念车,它应该是一个量产车,它要从前端的一个基础模型到最后的一个专属模型,形成一种商业的闭环。
当你要形成商业闭环的时候,阿里云可以在多个视角上为整个生态提供服务和价值。比如说第一提供最底层的算力,第二个阿里本身也训练出了通义千问等这样的一些模型。第三是阿里本身也搭建了一个使得更多的中小企业乃至于个人可以去训练自己模型的一个生态的一个体系,模型的部署可以大幅的降低整个社会使用的门槛。第四是阿里有很多应用的场景,为模型的应用创造了很多空间。所以它是一个多角度的、多源的去为这一轮的大模型的开发、应用产业化、商业化来做出了阿里自己的战略贡献。
永翎:回到今天聊的这个话题,为什么您认为大模型的主战场会在工业呢?
安筱鹏:因为工业是整个软件领域应用的最复杂的一种场景,而且工业领域未来面临的问题也是比较多的。从国家的战略角度来说,我们在讲数字,中国国家的十四五的规划,讲的一个关键词就叫做”数字技术与实体经济的融合”,它本来就是国家所面临的重大战略的一个问题。从技术本身来说,就像我刚才讲的工业领域面临这么多的问题,它决定了一个国家、一个企业、一个地区的经济实力。这些问题的解决需要不断的新的技术。
第二,5年前、 10 年前、 20 年前,我们去观察、去看的时候,我们会发现新的技术不断涌现的时候,工业都是一个非常重要的产品,无论是集成电路还是软件出现,那今天对于大模型来说也不例外,工业为大模型创造了巨大的市场的空间和商业化的可能性。
第三,在这段时间我们所看到的,国际的大公司,包括阿里自己的实践,我们已经看到了可能的场景和商业的价值。这个主要是我从这几个角度去观察所得出来的结论。
/ END /