对话汶生|或许你还没听过具身智能实训,但是已经有人这样做了

简介: 在汶生看来,具身智能真正的价值,在于基于现有成熟技术的可靠商业化,在于服务于成熟的市场。汽车产业、手机产业的发展路径已经验证,最终行业的领导者,不是技术领域的创新者,而是产品和商业化领域的创新者。

编者按:

2024年是具身智能领域疯狂的一年,各类创业公司如雨后春笋般涌出,大部分创业公司具有崇高的理想和目标,穷尽一切办法拿出更智能化的技术和产品。但是也有这样一家企业,他们追求前沿技术的探索,但是更追求客户价值,在商业化的路上跑出了一条差异化的创新创业之路,并拿到了一些结果。


在汶生看来,具身智能真正的价值,在于基于现有成熟技术的可靠商业化,在于服务于成熟的市场。汽车产业、手机产业的发展路径已经验证,最终行业的领导者,不是技术领域的创新者,而是产品和商业化领域的创新者。


汶生是TsingtaoAI公司的负责人,将近10年AI行业的从业经验,从行业解决方案企业到AI Infra公司,见识了各种AI企业商业化所走过的路。深知在AI领域,技术是成也萧何、败也萧何的主要因素。而真正不变的,是跳出技术思维,以客户价值和产品思维作为不断创新和发展的来源。


汶生在2023年底创办TsingtaoAI公司之前,就已经深入具身智能高校实训领域和AI人才培养方面。最近一年,汶生带领核心技术团队完成了具身智能高校实训解决方案、AI Agent应用开发实训解决方案和华为昇腾910B算力卡的大模型部署和调优实训方案。这些方案赋能与高校CS/AI专业的实训和企业IT/AI员工的内训,通过前沿技术和实训解决方案的结合,让学习者可以迅速掌握AI/具身智能/智算行业的核心和前沿技术。


以下是资深媒体记者李纯对TsingtaoAI公司负责人汶生的采访,内容略有编辑:


• 在AI/具身智能+教育实训/人才培养领域,TsingtaoAI脱颖而出的独特优势是什么?是技术、产品、服务还是团队?

汶生:这个得从中国大陆CS/AI等信息技术人才的教育和培养说起。我们都知道,在这个领域,中国工程师的工程开发能力,普遍比北美的工程师都是比较高一些的,因为开发能力,本质上你能吃苦,能坐下来努力写代码,那么工程能力就可以提升。在这方面,中国工程师做的不错。但是中国的工程师在哪方面比较弱呢?是在产品设计方面和创造力方面。我们经常看到,中国的工程师,天天加班,开发了一大个产品,产品开发的很扎实,各类功能很完备,但是产品的设计上,在产品的创造力方面,反而很弱,产品的设计不能满足市场和用户的需求,导致产品上线即高光时刻,后面就逐渐落寞无人问津。这个现象在AI领域更加突出,特别是现在最火的具身智能/Agent领域,AI驱动的产品设计和用户体验洞察,这个放到全球,都是最新的领域,你没有现成的案例和经验可以参考。只能靠着兴趣和自己的想法进行探索。这时候,一个人的创造力和探索能力就会起到更重要的作用。


从人才培养的环境来看,中国的高等教育和市场化的就业培训,同样都是存在比较明显的短板。中国的高等教育,实际的教学育人的水平,大家都懂的,咱们这里也不多说。然后社会培训这块,以前是达内,后来又有开课吧,各类培训机构,已经成为了割韭菜的代名词,其人才培养的质量,咱们也不用多说。同样的,我们看北美,北美的高等教育质量,可能早已甩我们高等教育几条街,差距还在越来越大。然后市场化的技术培训方面,北美以前有Coursera,现在有吴恩达的DeepLearning,Karpathy等技术明星也都投身AI教育培训。北美现在的现状是,更好的高等教育+更好的市场化培训。而中国大陆高等教育和市场化培训,还在原地踏步,市场化培训已经在中国污名化,真正有水平的技术大佬,对这个赛道早已望而却步。


所以从这个方面,TsingtaoAI就是以扭转这个而生。TsingtaoAI在产品开发和业务过程中,一直都是以前沿技术+PBL(项目式的实训和学习)的模式来推进。通过这样的方式来激发学习者的学习兴趣、创新力和探索精神。比如我们的具身智能高校实训解决方案,我们采用最前沿的AI大模型+机械臂结合的实训方案,整个的过程都是项目式的方式,通过将 AI 大模型与具备 3D 视觉的机器人相结合,我们为学生搭建一个实践平台,使他们能够深入理解通用具身智能的原理和应用。我们的实训方案围绕「多模态输入 -> 感知与理解 -> 行动执行 -> 反馈学习」的闭环过程展开。通过多模态数据的融合(包括听觉、视觉、触觉等),并结合大语言模型和深度学习算法,方案实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。该“具身智能高校实训解决方案-从AI大模型+机器人到通用具身智能”实训方面目前基于华为技术有限公司AI框架昇思MindSpore,完成并通过昇腾相互兼容性技术认证。这样的AI大模型+具身智能实训的解决方案,也成为国内唯二的具身智能实训创新解决方案。


TsingtaoAI公司组织的高校师资研讨会

从商业模式上,我们首先立足于ToB,我们可能很长很长的时间内,都不会涉及ToC的市场。我们希望通过不同的AI/具身智能实训的平台和解决方案,配置不同的实训项目课程,来通过B端服务最终的学习者。我们的直接客户包括:高校、企业和第三方的培训机构。立足不做toC后,就不需要太多的业务团队。其实到目前为止,我们几乎是没有销售人员的,90%的团队都是产品研发。我们对接的客户,他们的专业程度也较高,沟通和合作上会非常快速和高效,因为大家都很专业,什么样的产品和解决方案好,什么不好,大家都很清楚。合作过程遇到了什么问题,需要如何解决,大家都很快get到点。所以像现在,我们团队规模虽然小,但是我们却可以同时对接10个不同的需求,而且这10个不同的需求都可以较好的推进合作。


另外一个方面,保持团队的高水平、精练和高效非常重要,这也是我们在企业经营中会一直时刻秉持的理念。团队的整体认知要保持一个高层次。高层次的团队认知不是说有就有的,要基于团队整体的高水平的技术积累、深厚的行业实践经验,还有长期高价值业务之后形成的正确认知。


在产品和解决方案的设计方面,刚才也说了,TsingtaoAI一直信仰的就是前沿技术+PBL的模式,团队都是10年以上经验的高级研发人员和产品团队,大家以前都有成功的经历或经验,对市场的认知和发展趋势的洞察很深入,也容易达成共识。要一直在产品和业务中践行PBL理念,一个强有力的技术团队是保障核心,目前团队内有AI机器人教育领域的权威,华南师范大学的博导朱定居教授坐镇首席科学家,还有来自北京邮电大学的多模态领域的硕导和来自英特尔的高性能计算技术专家等。好的认知和趋势洞察是一方面,另外还得研究探索出来把握机会的具体实现路径,这应该是我们竞争力的核心之一。


• 技术上,咱们实训平台有哪些对手难以复制的功能或突破?

汶生:这个还是挺多方面可以谈一下的。首先刚才说的从AI大模型+机器人到通用具身智能的具身智能高校实训解决方案,这样的方案目前在高校内几乎是没有的(除了985硕士AI的实验室),因为大部分高校一是自己没有这样的技术实力,二是服务他们的产教融合机构,没有这样的产品洞察,更没有研发能力来完成这样的产品。比如说,我们拿到芮尔曼的6自由度的机械臂、奥比中光的3D相机、大象机器人的机械臂、龙族机器人的自动小车等硬件,我们很快就会以此跑通一套具身智能的最小可行应用。也就是说,我们可以为国内各个高校的实验室的各类笨拙的机器人、机械臂等,给他们安上AI大模型的能力,让传统的硬件成为智能硬件的一部分,这样他们实训的场景,就会大大的拓宽。以前这些硬件,学校可能都是实训传统的、OpenCV的算法,而经过我们的改造或配置,他们可以实训最前沿的LLM、多模态大模型的实训,在大模型基础上,以更加创造性的思维创建AI Agent。这样实训场景和技术栈拓宽后,学校的学生就可以来实训学习最前沿的大模型和Agent的技术,并且极大引导和锻炼他们自主创造和探索的能力。


• 产品如何精准满足客户需求,在市场中脱颖而出?

汶生:要回答这个问题,我们回过头再仔细盘点一下我们的客户。一个是高校,CS/AI相关专业的实验室;另一个是企业,央国企和上市公司。这两类客户是完全不同的,但又是一致的,殊途同归。因为最终买单,是为高质量的人才技能成长买单。高质量的人才成长,其实是对标最前沿企业的,比如AI大模型算法对标字节跳动、芯片对标Nvidia和华为昇腾、电商是对标阿里巴巴和京东、人形机器人对标宇树等等。所以,我们的实训产品或解决方案的设计,首先看前沿企业产业端的人才,这些人才是什么样的画像,什么样的技术栈能力,这样的技术水平是如何习得的。我们去研究这个链路,然后倒推到目标客户的需求应该如何满足。比如我们说Agent构建的能力获得,那我们就看在Coze上,最成功的案例是什么,成功的产品是怎么实现创新突破的,那我们把这样的项目拿过来,把它改造成Agent实训项目案例。


再比如说华为昇腾910B算力卡的适配,我们知道现在Nvidia禁运后,现在国家的芯片体系,特别是智算中心的算力集群,可能很大一部分都会倾斜到昇腾910B算力卡上。那现在AI大模型在910B上跑,如何进行适配调优,如何发挥算力集群更好的性能等,现在国内是大量缺少这样的人才的。我相信现在国内很多基于国产昇腾910B卡的算力集群的运维和技术支持的工程师,最头疼的就是适配问题。那这个问题,其实绝大部分的学校和市场化的培训机构,其实都意识不到这个问题的,因为他们完全没有接触到产业中的这些深层的技术问题。那我们其实在2023年年底的时候,就跟很多的大厂、包括大模型六小龙的企业聊。我们很早就知道智算产业中的痛点,所以我们设计出来了基于华为昇腾910B算力卡的大模型部署和调优的实训项目。这个实训项目的设计和实施,我们会直接在分布式的昇腾910B卡的算力集群上进行实训,然后以像DeepSeek、Qwen或Llama等最新模型作为部署对象。通过这样的实训项目,我们来培养智算产业中的高级AI Infra人才。现在像基于华为昇腾910B算力卡的大模型部署和调优这类项目,我们已经给国内多家大型智算中心实施了。


也就是说,精准满足市场需求的核心,还是得深入产业当中去,真正挖掘产业中的技能痛点和人才需求。


• 未来三年,TsingtaoAI预期盈利如何?背后的市场拓展、产品迭代、成本控制等关键因素有哪些?

汶生:TsingtaoAI的商业模式设计之初,就具备自我造血的能力。我们核心团队有一个经营理念上的共识,就是以查理芒格的经营思想作为指导。可能较长一段时间内,我们都是怀着一个朴实的经营理念在做这个事情,那就是确保团队的所有精力都是给客户创造价值,满足客户的诉求(而不是自己瞎折腾为了创新而创新),然后顺便获得养活团队的收益。所以,公司经营近一年来,团队已经可以自负盈亏。长期来看我们也会保持稳健可持续的经营策略。


在市场拓展方面,我们希望在很多学校的实验室的幕后,在很多市场化培训机构的实训项目交付的幕后,在很多央国企和上市公司IT/AI/数字化团队的幕后,充当越来越大的角色和作用。核心团队,包括我个人,在品牌和市场运营方面,有较强的实践经验。我们已经尝试成功了技术品牌+SEO的市场品牌经营模式和获客转化方式,希望以高价值内容的方式,来吸引客户,和客户建立沟通。在整个服务客户的过程中,都是价值导向的,整个的经营链条,都是以给客户提供价值为核心。


产品迭代方面,我们其实是非常迅速的,在2024年期间,我们开发了有10余款AI的产品,推出了3套实训解决方案。我们在推出产品方面,也逐渐形成了一些方法论。这些方法论指导我们可以可以更好更快的响应和满足客户的诉求,同时又可以尽量少的降低开发的成本。我们预计2025年-2026年,产品和解决方案的推出步伐还会保持高速。


• 是什么契机让您投身AI/具身智能实训领域创业?

汶生:首先,从我们核心团队来说,有的在大学任教已经是博导硕导,学术发展的空间有限了。有的已经在大厂打工,但是性价比越来越低。从22年,23年的时候,大家就已经要跃跃而试,因为平时有挺多的项目可以拿出来可以上手创业了。


直到2023年年底,我已经发现,到了不得不创业的地步了,因为之前就职的企业,虽然融资了不少,但是因为商业模式的原因,盈利预期极低。而我要推进的这个赛道,已经有很多项目在排队开始干了。也就是我,包括团队其他小伙伴,我们是被需求赶着下海了。


• 创业初期最大的挑战是什么,如何坚持下来?

汶生:其实没感觉太大的挑战或艰难,有点像开门头做生意的感觉,就是按部就班的做。真要说挑战,那就是和自己的懒惰做斗争吧,因为服务客户,就是要细心认真负责,那就需要勤快点、多思考、执行到位。管理好自己和团队的懒惰,也是一门学问。


• 成立至今,TsingtaoAI有哪些关键发展节点 ?

汶生:一个节点是决定做这个事情。

另一个节点,是2024年10月份决定做具身智能的实训。


• 团队从两人发展壮大,遇到过哪些难题,如何解决?

汶生:如何引入高水平人才的问题。个人始终觉得,高水平人才是公司发展最关键的因素。之前我有看到奇绩创坛通过活动配对的形式,来给初创团队组织合伙人。所以我们也另辟蹊径,我们有400个AI相关的行业社群,2024年10月份的时候,组织了一段话,大概意思AI具身智能教育领域的初创公司,想招募AI机器人/具身智能领域的技术合伙人,有兴趣的联系。这个的确吸引了一些人,我记得有两位清华的,还有一位在北美的。现在我们的首席科学家朱定局教授,就是这样吸引过来的。是有人看到后,把这个信息推荐给朱定局,朱定局教授看到和他的领域比较贴近,就联系了我们,最后经过多次协商,就达成了合伙的合作。


笔者为资深媒体记者:李纯,北大中文系才女,著有《我奋斗了十八年不是为了和你一起喝咖啡》《以梦为马:胡敏和新航道绝地逆袭》《古语金句》《独树一字:汉字叔叔的中国故事》等书。

相关文章
|
14天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
阿里云与企业共筑容器供应链安全
171332 12
|
17天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。
150295 32
|
25天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
201962 14
对话 | ECS如何构筑企业上云的第一道安全防线
|
3天前
|
机器学习/深度学习 自然语言处理 PyTorch
深入剖析Transformer架构中的多头注意力机制
多头注意力机制(Multi-Head Attention)是Transformer模型中的核心组件,通过并行运行多个独立的注意力机制,捕捉输入序列中不同子空间的语义关联。每个“头”独立处理Query、Key和Value矩阵,经过缩放点积注意力运算后,所有头的输出被拼接并通过线性层融合,最终生成更全面的表示。多头注意力不仅增强了模型对复杂依赖关系的理解,还在自然语言处理任务如机器翻译和阅读理解中表现出色。通过多头自注意力机制,模型在同一序列内部进行多角度的注意力计算,进一步提升了表达能力和泛化性能。
|
7天前
|
存储 人工智能 安全
对话|无影如何助力企业构建办公安全防护体系
阿里云无影助力企业构建办公安全防护体系
1253 8
|
8天前
|
人工智能 自然语言处理 程序员
通义灵码2.0全新升级,AI程序员全面开放使用
通义灵码2.0来了,成为全球首个同时上线JetBrains和VSCode的AI 程序员产品!立即下载更新最新插件使用。
1306 24
|
9天前
|
机器学习/深度学习 自然语言处理 搜索推荐
自注意力机制全解析:从原理到计算细节,一文尽览!
自注意力机制(Self-Attention)最早可追溯至20世纪70年代的神经网络研究,但直到2017年Google Brain团队提出Transformer架构后才广泛应用于深度学习。它通过计算序列内部元素间的相关性,捕捉复杂依赖关系,并支持并行化训练,显著提升了处理长文本和序列数据的能力。相比传统的RNN、LSTM和GRU,自注意力机制在自然语言处理(NLP)、计算机视觉、语音识别及推荐系统等领域展现出卓越性能。其核心步骤包括生成查询(Q)、键(K)和值(V)向量,计算缩放点积注意力得分,应用Softmax归一化,以及加权求和生成输出。自注意力机制提高了模型的表达能力,带来了更精准的服务。
|
7天前
|
消息中间件 人工智能 运维
1月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
594 23
1月更文特别场——寻找用云高手,分享云&AI实践
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
|
13天前
|
人工智能 自然语言处理 API
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。