国产AI大模型酣战,科大讯飞打响“智慧涌现”第一枪

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: AI大模型技术需求也随之水涨船高,成为科技企业重点关注的方向。

ChatGPT问世半年之久,人与AI“你问我答”的游戏热度不降反升,AI大模型技术需求也随之水涨船高,成为科技企业重点关注的方向。

在海外,OpenAI、谷歌、微软的AI大模型战争正打得火热;在国内,科大讯飞、百度、阿里、腾讯、华为等科技巨头纷纷拥抱AI大模型。它们基于自身智能技术积淀,争先发布AI大模型成果,掀起了一波AI大模型技术浪潮。

5月6日,科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并公布大模型年内三次升级时间点,称10月底将整体赶超ChatGPT,再次引发了国产AI大模型热潮。

**国产AI大模型渐入佳境,实力玩家激战正酣
**
ChatGPT爆火后,国内AI大模型领域按下了“快进键”,科技企业争分夺秒研发AI大模型,国产AI大模型市场呈现多方混战的景象。

一方面,AI大模型是科技企业的“新造梦场”,也是神仙打架现场,没有技术积淀也没有资金实力的玩家终会被淘汰,市场格局将逐渐明朗。

眼下AI大模型创业如火如荼,除了科大讯飞、百度、阿里等知名选手之外,还有一些名不见经传的跨界玩家前来凑热闹。然而AI大模型研发不是简单地堆砌数据、算力和算法,而是复杂的系统性工程,对企业技术能力、资金实力均有高要求,市场混战很快将会过滤掉“噱头玩家”。

另一方面,科技企业的起点不同,竞争分化现象会更明显,随着竞争加剧,“头部阵营”内部也会产生分化,实力更强者将从中脱颖而出。

优胜劣汰的过程没有止境,即便科大讯飞、百度、阿里等具备可研发AI大模型的能力,但企业实力不同,强者与强者之间也要分AI大模型研发速度快慢和产品质量的高低,AI大模型创业浪潮既可卷走弱者,也可锻造强者。

表面来看,科技企业角逐AI大模型是一场“追风行动”,更深层次实则是为了抢夺下一个科技时代的入场券,技术、场景、生态则成为了这场AI大模型竞争制胜的关键。

**技术大比拼
**
众所周知,AI大模型是“大数据+大算力+强算法”结合的产物,科技企业的技术底座决定了其AI大模型的应用价值,因而AI大模型入门资质是科技实力,技术比拼不可避免。

科大讯飞、阿里在AI大模型领域均有深厚技术积累,从各自发布的讯飞星火认知大模型、阿里通义大模型就可窥见其技术功底。

讯飞星火认知大模型在七个维度测评中的表现可圈可点,特别是数学、长文本生成、语义理解等三项能力媲美甚至超过ChatGPT和其他同行。

不仅能回答出“我想把40㎡的房子装修成70㎡的感觉,请给出可行的方案”此类刁钻问题,还能解答算术题“等腰三角形的顶角是底角度数的2倍,请问这个三角形的底角是多少度?”,写散文、写代码、语言翻译都信手拈来。

究其原因,和长期的技术积淀有关,科大讯飞2011 年承建语音及语言信息处理国家工程实验室,2014年开启“讯飞超脑计划”,2017年承建认知智能国家重点实验室,2022年升级“讯飞超脑2030计划”……深耕认知智能领域近十年,在AI大模型所需的数据、算力、算法和模型等方面上已经先行一步。

在数据方面,科大讯飞通过十几年AI技术研发和技术落地推广生涯,积累了超50TB的行业语料和每天超10亿人次用户交互的活跃应用。在算法和模型方面,科大讯飞专研认知智能大模型最核心的Transformer深度神经网络算法,语音识别和图文识别技术全球领先;在算力方面,科大讯飞自建4城7中心深度学习计算平台,为AI大模型构建了坚实的算力底座。

此外,科大讯飞能够屡屡交出让人眼前一亮的答卷,其背后连年剧增的研发投入和超高的研发人员占比起到了关键作用。

据科大讯飞财报数据显示,2022年研发投入为33.6亿元,同比提升14.28%,研发投入占营收的比例为17.83%,较2021年提高1.8个百分点。截至2022年末,科大讯飞研发人员达9281人,占公司总人数比例为61.68%,占比提升3.2个百分点。

无独有偶,阿里的大语言模型“通义千问”,背后的技术积累一样颇为深厚。阿里达摩院在人工智能领域布局多年,形成了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术能力,为阿里AI大模型的训练和运行提供了强大的算力、算法和数据基础。

如此看来,讯飞星火认知大模型、阿里通义大模型皆是多年技术积累的结晶,证明了大模型技术门槛并非普通科技公司可以达到。

**全场景较量
**
技术之外,场景也是AI大模型厂商的重要战场。AI大模型的演进升级需要高质量的内容数据作支撑,而有了丰富的应用场景,大量数据自然会产生,且技术始终要为场景服务,场景的重要性不言而喻。

为了积累更多内容数据,也为了给用户带来全新的体验,AI大模型厂商在探索大模型落地的道路上做了很多尝试,而落地布局逻辑大致上遵循一个思路:从自家主要业务入手,再延伸覆盖千行百业。

科大讯飞星火大模型最先应用于教育、办公、汽车驾驶、数字员工等场景,升级产品智能化功能,极大程度改善了用户体验。

在教育领域,讯飞星火大模型+学习机(科大讯飞AI习机T20),可以AI写作批改、精细批改、给优化参考,俨然成为学生的智能家庭教师。在办公领域,讯飞星火大模型+办公(讯飞听见、讯飞智能办公本X2),可以自动会议纪要、自动语篇规整、一键成稿,是职工的智能办公助理。

在汽车驾驶领域,讯飞星火大模型+智能座舱,可以提供多轮、多人、多区域、多模态智能汽车人机交互范式,强化智能座舱的科技体验感。在数字员工领域,讯飞星火大模型+数字员工,优化了数字员工语音和文本交互体验……

总之,科大讯飞围绕自身业务优势去落地AI大模型技术,不仅对学习机、办公本、智能座舱等智能产品进行全面升级,增强了产品竞争力,还加快了AI大模型规模化落地的效率,达成一个双赢的状态。

同样地,华为专注于“AI赋能产业”,华为盘古系列AI大模型(NLP大模型、CV大模型、科学计算大模型)在远程协作、自动驾驶、智慧城市等多个产业释放AI能力,助力行业降本、增效、提质。

AI大模型技术落地处于初步探索阶段,各大AI大模型厂商正积极抢占“空白场景”,而AI大模型技术发展到一定水平之后,AI大模型也将随之进入应用场景爆发阶段,届时围绕全场景的争夺会越来越激烈。

**生态位争夺
**
随着竞争升维,AI大模型将逐渐由单一的技术与场景之争,转向产业生态的竞争,这就要求科技企业持续完善AI大模型生态。为此,科大讯飞和百度不约而同的选择通过“技术开放”,与数据资源方、场景应用方建立合作关系,打造坚实的生态壁垒。

在内部,科大讯飞基于自身业务资源,加快AI大模型与垂直行业深度融合,丰富AI大模型生态。在外部,科大讯飞携手各大合作伙伴共建、完善和拓宽AI大模型生态圈。

一方面,科大讯飞多元化业务是拓展AI大模型生态的重要资源。科大讯飞的业务广而大,智慧教育、智慧城市、智慧汽车、智慧医疗、智慧金融等垂直领域的硬件产品和APP全面接入AI大模型技术,可提高AI大模型技术的落地效率和效果。

另一方面,科大讯飞持续开放AI大模型技术、连接生态合作伙伴,通过合作的方式快速扩大生态规模,做大做强AI大模型生态。比如,讯飞星火算力硬件主要由华为提供,这两大强者交流合作、经验借鉴,形成良性竞争和互补发展的局面。

据悉,讯飞开放平台新增星火认知大模型,为开发者和合作伙伴提供更具价值的AI应用,首批来自36个行业的3000余家企业开发者将接入星火大模型。此外,目前讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。

和科大讯飞一样,百度坚持技术创新及开放生态,试图通过技术赋能降低AI大模型技术开发和应用的门槛,为各行各业的数智化转型升级打造坚实的技术底座。目前,百度通过飞桨开源开放平台、百度智能云等平台,将文心大模型赋能到多个行业,并且个人、企业开发者数量超6万。

科大讯飞、百度试图通过AI大模型技术输出连接生态伙伴,构建生态壁垒,从而增强企业竞争力,以期在未来竞争中赢得有利位置。接下来,AI大模型厂商竞争的主旋律将是:找准生态位,守住生态位。

**AI星星之火,带动“智慧涌现”燎原之势
**
众所周知,当AI大模型突破某个数据规模时,性能会得到显著提升,进而呈现“智慧涌现”现象。那么,哪些科技企业有望在中国实现智慧涌现?

很明显,从技术、场景、生态等竞争维度来看,最有可能胜出的一类是以科大讯飞为代表的长期深耕AI技术的科技公司;另一类是以阿里、华为、百度等资金实力雄厚的互联网公司。

首先,这些玩家推动AI大模型深入应用于千行百业,将创造更多智慧涌现的机会。例如,科大讯飞继续推动“1+N”认知大模型专项攻关,为各行各业AI大模型技术赋能,会面临很多新挑战以及新机遇,而攻克落地难关的过程,充满智慧涌现的机会。

其次,算力、算法、数据等基础支撑能力越来越强,将大大提升AI大模型升级迭代速度,点亮智慧涌现曙光。数字经济高速发展,基础设施建设不断完善,将提高算力供给能力,驱动AI大模型汲取更多数据反复试验和学习,最终将实现算力、算法和数据规模的突破。

最后,科技巨头们的激烈博弈,无疑将进一步推动AI大模型生态的发展,加速“智慧涌现”时代的到来。

目录
相关文章
|
14天前
|
人工智能
AI大模型初体验
为了实现真正的A,需不断学习以提升能力。
46 3
AI大模型初体验
|
11天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
4天前
|
机器学习/深度学习 人工智能 UED
OpenAI o1模型:AI通用复杂推理的新篇章
OpenAI发布了其最新的AI模型——o1,这款模型以其独特的复杂推理能力和全新的训练方式,引起了业界的广泛关注。今天,我们就来深入剖析o1模型的特点、背后的原理,以及一些有趣的八卦信息。
140 73
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
【9月更文挑战第4天】赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
|
5天前
|
消息中间件 人工智能 运维
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AI人工智能大模型的架构演进
随着深度学习的发展,AI大模型(Large Language Models, LLMs)在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进,包括从Transformer的提出到GPT、BERT、T5等模型的历史演变,并探讨这些模型的技术细节及其在现代人工智能中的核心作用。
41 9
|
7天前
|
人工智能 自动驾驶 云计算
【通义】AI视界|谷歌大模型被盯上!欧盟最高隐私监管机构对PaLM2模型展开调查~
本文汇总了近24小时内科技领域的五大要闻:欧盟对谷歌PaLM2模型启动隐私合规调查;甲骨文推出Zettascale云计算集群,集成大量NVIDIA GPU强化计算力;红杉资本偏好AI应用投资而非模型构建;夸克新推智能助手CueMe,支持长达2万字内容生成;沃尔沃与NVIDIA合作,未来车型将采用后者先进芯片提升自动驾驶功能。以上内容由通义自动生成。
|
9天前
|
机器学习/深度学习 人工智能 供应链
【通义】AI视界|OpenAI的“草莓”模型预计两周内上线!像人类一样思考!
本文介绍了近期科技领域的五大亮点:OpenAI即将推出的新一代AI模型“草莓”,具备高级推理能力;亚马逊测试AI技术加速有声读物生产,通过语音克隆提高效率;Kimi API新增联网搜索功能,拓宽信息来源;顺丰发布物流行业专用大语言模型“丰语”,提升工作效率;钉钉推出“AI班级群”功能,改善家校沟通体验。更多详情,请访问[通义官网]。
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
AI战略丨物流 AI 新变化,用大模型定义
物流企业在大模型上纷纷主动探索,也在推动物流行业实现智能化加速。
|
13天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。