用行动回应“实体清单”,智谱发布了一系列新模型

简介: 1月15日,美国商务部将25个中国实体列入出口管制实体清单,其中包括智谱及其子公司。面对制裁,智谱迅速回应,表示不会影响业务,并于次日发布全新端到端模型GLM-Realtime、升级GLM-4-Air和GLM-4V-Plus模型,推出免费的Flash系列普惠模型。这些举措展示了智谱在多模态交互、视频理解、语音交互等领域的技术实力,体现了中国AI企业在自主创新和自主可控方面的坚定决心。此举不仅彰显了智谱的技术硬实力,也为中国AI产业的自立自强树立了榜样。

1月15日晚间,美国商务部工业和安全局(BIS)修订了《出口管制条例》(EAR),以安全为由在实体清单中分两批增加了25个中国实体。

其中就包括智谱及其子公司,也是国内首家被美国列入实体清单的大模型初创企业。

当天晚上,智谱官方就作出了公开回应,除了强烈反对美国的恶意打压,还特意写了这样一段话:鉴于智谱掌握全链路大模型核心技术的事实,被列入实体清单不会对公司业务产生实质影响。

到了1月16日下午,智谱正式做出行动:发布了全新的端到端模型GLM-Realtime;同步升级了GLM-4-Air和GLM-4V-Plus模型;特别设立 Flash 系列普惠模型,向全社会免费开放。

前脚刚被美国”制裁“,后脚就上新模型,颇为几分”掀桌子硬刚“的味道。

而坊间也一直流传着这样一种说法——被美国列入“实体清单”,相当于是对一家企业硬实力的认证。

正式被美国“盖章认证”的智谱,这次给出了哪些黑科技?对中国AI产业的自主自强又有哪些启示?

让我们一一揭晓。

1、会唱歌、低延迟、可以Function Call的GLM-Realtime
四个多月前,智谱清言APP上线了“视频通话”功能,成为首个可以通过文本、音频、图像和视频来进行多模态互动和实时推理的AI助手,让很多人养成了和“小智”打视频电话的习惯。

基于对多模态模型的理解与研发积累,智谱发布了全新的端到端模型GLM-Realtime,能力再次进阶。(感兴趣的小伙伴,可以观看智谱官网的视频演示,详细了解GLM-Realtime的“神奇能力”。)

视频理解与语音交互:支持长达2分钟的内容记忆能力,能够实时处理视频和语音输入。

清唱功能:创新性地实现了清唱功能,首次让大模型具备在对话中的歌唱能力,进一步增强了交互的趣味性和实用性。

Function Call 功能:支持调用外部知识和工具,扩展了模型在商业场景中的应用范围。目前Function Call 功能已经加入到GLM-Realtime API,将极大拓展技术在商业场景中的实用性。

目前GLM-Realtime API已经上线智谱开放平台bigmodel.cn,对标GPT-4o的意味十足,而且现阶段可以免费调用。

比如集成到智能眼镜、陪伴娃娃等产品中,相当于有了“嘴巴和眼睛”,将重构智能硬件的用户体验。

2、GLM-4-Air能力全面升级,且价格下降了50%
作为GLM-4 系列的高性价比版本,GLM-4-Air上线以来受到了很多开发者的青睐。

这一次,智谱发布了全面升级的GLM-4-Air-0111,带来了显著提升:通过优化训练数据和流程,在部分维度上接近 GLM-4-Plus 的性能。

与此同时, GLM-4-Air-0111模型价格降价到原来的50%,再次降低大模型应用的门槛。

3、升级版的GLM-4V-Plus,覇榜多个公开榜单
视觉理解模型GLM-4V-Plus也进行了全面升级,新版本在多个公开榜单上均展现出显著的效果提升(对比的对象不乏Gemini-2.0、GPT-4o、Claude 3.5等美国企业最新的标杆模型)。

支持变分辨率功能:适应不同尺寸的图像,显著降低小图场景下的 token 消耗。同时支持4K超清图像和极致长宽比图像的无损识别。
长视频处理能力:具备长达2小时的视频理解能力,适用于长视频分析和复杂场景的精准识别。
Case1:大模型色盲检测

Case2:看图讲故事

4、Flash 系列普惠模型全免费
致力于“大模型普惠”的智谱,为助力所有开发者更便捷地利用大模型进行创新,专门设置了针对全社会免费开放 Flash 系列普惠模型 API,涵盖语言、文生图、文生视频及图像理解等多个场景。

作为行业首个全模态的免费系列模型,开发者可以免费调用语言、多模态理解、多模态生成功能。

近期Flash系列也将全面升级,Flash全模态全家桶成员包括:语言模型 GLM-4-Flash、图像理解模型 GLM-4V-Flash、图像生成模型 CogView-3-Flash和视频生成模型 CogVideoX-Flash。

写在最后
如果是在三年前,被美国列入出口管制实体清单,可能会让不少企业诚惶诚恐,现在则要另当别论。

一方面,华为在内的企业已经证实,所谓的封锁和打压并不能阻碍中国科技的创新进程,反而会助推国内企业走向自立自强之路,构建出自主可控的技术、产品和生态体系。

另一方面,智谱自创立起就选择了自研路线,并未对美国的产品和技术形成深度依赖。被列入“实体清单”后,势必会加速智谱的内生研发进程,不断完善底层能力和产业合作。

何况,智谱的态度非常强硬,第二天就发布了一系列新模型,显然已经做好了用自主创新应对外部压力的准备。同时身体力行地提醒中国科技行业,自主创新能力永远是打破封锁的最佳武器。

2024年是大模型落地应用的元年,2025年大模型的落地进程将愈演愈烈。

美国在这个时候“制裁”智谱,可以说是阻止中国AI产业创新的又一次尝试,预示着大模型行业正在进入新的拐点。

只是就结果来看,一时的打压或封锁,无法削弱中国AI参与全球竞争的决心。智谱已经用行动给出了铿锵有力的回答:放弃幻想,开始战斗,中国AI将在自力更生的路上越走越远。

相关文章
|
5月前
|
人工智能 自然语言处理 机器人
谷歌将大模型集成在实体机器人中,能看、听、说执行57种任务
【9月更文挑战第17天】近年来,人工智能在多模态大模型领域取得显著进展。谷歌最新研发的Mobility VLA系统,将大模型与实体机器人结合,实现了视觉、语言和行动的融合,使机器人能理解并执行复杂多模态指令,如“我应该把这个放回哪里?”系统在真实环境测试中表现出色,但在计算资源、数据需求及伦理问题上仍面临挑战。相关论文发布于https://arxiv.org/abs/2407.07775。
98 9
|
9月前
|
运维 自然语言处理
【大模型】LLM 如何处理域外或无意义的提示?
【5月更文挑战第5天】【大模型】LLM 如何处理域外或无意义的提示?
|
机器学习/深度学习 自然语言处理 算法
【网安AIGC专题10.25】论文7:Chatgpt/CodeX引入会话式 APR 范例+利用验证反馈+LLM 长期上下文窗口:更智能的反馈机制、更有效的信息合并策略、更复杂的模型结构、鼓励生成多样性
【网安AIGC专题10.25】论文7:Chatgpt/CodeX引入会话式 APR 范例+利用验证反馈+LLM 长期上下文窗口:更智能的反馈机制、更有效的信息合并策略、更复杂的模型结构、鼓励生成多样性
156 0
|
算法 自然语言处理 机器学习/深度学习
中文竞技场大模型测评后续之双模型匿名对话
在中文竞技场大模型测评的延续中,我们将在双模型匿名对话技术场景中,通过趣味游戏方式对写作创作、代码相关、知识常识等领域进行全面测评
654 0
中文竞技场大模型测评后续之双模型匿名对话
|
自然语言处理 人工智能
中文竞技场大模型测评后续之模型自动对话
中文竞技场大模型测评延续中,模型自动对话场景测评
588 0
中文竞技场大模型测评后续之模型自动对话
|
数据采集 人工智能 API
调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了
调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了
651 0
|
机器学习/深度学习 数据采集 移动开发
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec(1)
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
348 0
|
数据采集 机器学习/深度学习 搜索推荐
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec(2)
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
219 0
|
SQL 人工智能 数据可视化
Prompt learning 教学案例篇:文生文案例设定汇总,你可以扮演任意角色进行专业分析
Prompt learning 教学案例篇:文生文案例设定汇总,你可以扮演任意角色进行专业分析
|
机器学习/深度学习 人工智能 自然语言处理
超精准!AI 结合邮件内容与附件的意图理解与分类!⛵
借助AI进行邮件正文与附件内容的识别,可以极大提高工作效率。本文讲解如何设计一个AI系统,完成邮件内容意图检测:架构初揽、邮件正文&附件的理解与处理、搭建多数据源混合网络、训练&评估。
1223 2
超精准!AI 结合邮件内容与附件的意图理解与分类!⛵