谷歌推出其最强大的AI模型Gemini

简介: 谷歌推出其最强大的AI模型Gemini

本文来源:企业网D1net


谷歌宣布推出其最新、最强大的AI模型Gemini,其有三种模式,谷歌的高管们表示,Gemini Pro的表现好于OpenAI的GPT-3.5,但回避了有关它如何与GPT-4抗衡的问题。


谷歌于当地时间周三发布了其认为最强大的AI模型,该公司面临着越来越大的压力,需要回答它将如何通过AI盈利。


大型语言模型Gemini将包括三种不同的套件:Gemini Ultra,其最大、功能最强大的类别,Gemini Pro,可扩展到各种任务,以及Gemini Nano,它将用于特定任务和移动设备。


目前,该公司计划通过谷歌云将Gemini授权给客户,让他们在自己的应用程序中使用。从12月13日开始,开发人员和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发者也将能够使用Gemini Nano进行构建。Gemini还将被用来支持谷歌的产品,如Bard聊天机器人和搜索生成体验,它试图用对话风格的文本回答搜索查询(SGE还没有广泛使用)。


企业可以使用它通过聊天机器人和产品推荐来进行更高级的客户服务,并为希望为产品做广告的公司识别趋势。如果一家公司想要创建营销活动或博客内容,以及想要为开发人员总结会议或生成代码的生产力应用程序,Gemini也可以用于内容创建。


该公司提供了一些例子,包括展示Gemini能够截取图表的屏幕截图,并分析数百页研究报告,然后更新图表,另一个例子是分析一个人的数学作业的照片,找出正确的答案并指出错误的答案。


Gemini Ultra是第一个在大规模多任务语言理解(MMLU)上超越人类专家的模型,该公司周三在一篇博客文章中表示,MMLU使用数学、物理、历史、法律、医学和伦理学等57门学科的组合来测试世界知识和解决问题的能力。据推测,它可以理解复杂主题中的细微差别和推理。


周三,谷歌的首席执行官桑达尔·皮查伊在一篇博文中写道:“Gemini是整个谷歌团队大规模合作的结果,包括我们在谷歌研究院的同事。它从一开始就是多模式的,这意味着它可以概括并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。”


从今天开始,谷歌的聊天机器人Bard将使用Gemini Pro帮助进行高级推理、规划、理解和其他功能。高管们周二在与记者的电话会议上表示,明年初,该公司将推出“Bard Advanced”,将使用Gemini Ultra。


此次更新是在搜索巨头谷歌首次推出Bard八个月后,以及OpenAI在GPT-3.5上推出ChatGPT一年后发布的。今年3月,这家由奥特曼领导的初创公司推出了GPT-4。高管们周二表示,Gemini Pro的表现好于GPT-3.5,但回避了有关它如何与GPT-4抗衡的问题。


然而,根据谷歌周三发布的一份白皮书,Gemini的Ultra模型在几个基准测试中的表现优于GPT-4。


当被问及谷歌是否有计划对访问Bard Advanced收费时,谷歌Bard总经理Sissie Hsiao表示,谷歌专注于创造良好的体验,目前还没有任何盈利细节。


在新闻发布会上,当被问及与当前一代的LLM相比,Gemini是否具有任何新的能力时,谷歌DeepMind产品副总裁伊莱·柯林斯回答说:“我认为是这样的”,但该公司仍在努力了解Gemini Ultraa的新能力。


据报道,谷歌推迟了Gemini的发布,因为它还没有准备好,这让人想起了该公司在今年年初艰难推出其AI工具的记忆。


多名记者询问了延迟的原因,柯林斯回答说,测试更先进的型号需要更长的时间。柯林斯说,Gemini是该公司构建的经过最严格测试的AI模型,并且它拥有谷歌所有模型中“最全面的安全评估”。


柯林斯表示,尽管是最大的模型,但Gemini Ultra的服务成本要低得多。“它不仅更有能力,而且更有效率,”他说,“我们仍然需要大量的计算机来训练Gemini,但我们训练这些模型的能力正在变得更加高效。”


柯林斯表示,该公司将于周三发布一份技术白皮书,其中包含该型号的更多细节,但表示不会公布周长计数。今年早些时候,记者发现,谷歌当时最新的AI模型——Palm 2大型语言模型,用于训练的文本数据量是其前身LLM的近五倍。


同样在周三,谷歌推出了用于训练AI模型的下一代张量处理单元。谷歌表示,Salesforce和初创公司Lightricks已经开始使用TPU v5p芯片,其性价比高于2021年宣布的TPU v4,但该公司没有提供与市场领头羊英伟达相比的业绩信息。


在谷歌10月份的第三季度收益

电话会议上,投资者向高管们询问了更多关于它将如何将AI转化为实际利润的问题。


今年8月,谷歌推出了一项名为搜索生成性体验(SGE)的早期实验,让用户看到使用搜索引擎时GenAI体验是什么样子 - 搜索仍然是该公司的一个主要利润中心,其结果是更具对话性,反映了聊天机器人的时代,然而,它仍被认为是一项实验,尚未向公众推出。


今年5月,Gemini首次在其年度开发者大会Google I/O上宣布了这项实验,自那以来,投资者一直在要求SGE的时间表,Gemini周三的声明几乎没有提到SGE,高管们对其向公众推出的计划含糊其辞,称Gemini将“在明年”并入SGE。


皮查伊在周三的博客文章中说:“这个模型的新时代代表着我们作为一家公司所做的最大的科学和工程努力之一。我真的为未来感到兴奋,也为Gemini将为世界各地的人们带来的机遇感到兴奋。”


版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。



相关文章
|
2天前
|
人工智能 搜索推荐 Docker
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
DeepSeek R1 + LobeChat + Ollama:快速本地部署模型,创建个性化 AI 助手
1594 95
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
|
3天前
|
人工智能 物联网 开发者
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
Oumi 是一个完全开源的 AI 平台,支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型,提供零样板代码开发体验。
115 43
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和多语言。
94 23
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
|
5天前
|
人工智能 编解码 语音技术
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
SpeechGPT 2.0 是复旦大学 OpenMOSS 团队推出的端到端实时语音交互模型,具备拟人口语化表达、低延迟响应和多情感控制等功能。
89 21
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
|
5天前
|
机器学习/深度学习 人工智能 API
Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术
介绍北大团队提出的 Aligner 模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差,提升大语言模型的性能。
64 28
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型,能够从未标注的视频数据中学习复杂知识,支持长期推理和规划任务。
131 8
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
|
17天前
|
人工智能 编解码 自然语言处理
CogView-3-Flash:智谱首个免费AI图像生成模型,支持多种分辨率,快速生成创意图像
CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,支持多种分辨率,快速生成高质量图像,广泛应用于广告、设计、艺术创作等领域。
51 6
CogView-3-Flash:智谱首个免费AI图像生成模型,支持多种分辨率,快速生成创意图像
|
17天前
|
人工智能 编解码
CogVideoX-Flash:智谱首个免费AI视频生成模型,支持文生视频、图生视频,分辨率最高可达4K
CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,支持文生视频、图生视频,最高支持4K分辨率,广泛应用于内容创作、教育、广告等领域。
200 5
CogVideoX-Flash:智谱首个免费AI视频生成模型,支持文生视频、图生视频,分辨率最高可达4K
|
16天前
|
机器学习/深度学习 人工智能 测试技术
登上Nature的AI芯片设计屡遭质疑,谷歌发文反击,Jeff Dean:质疑者连预训练都没做
2020年,谷歌的AlphaChip在Nature上发表并开源,其深度强化学习方法能生成超越人类水平的芯片布局,引发AI在芯片设计领域的研究热潮。然而,ISPD 2023的一篇论文对其性能提出质疑,指出未按Nature论文方法运行、计算资源不足等问题。谷歌DeepMind团队回应,强调AlphaChip已在多代TPU和Alphabet芯片中成功应用,并批驳ISPD论文的主要错误。此外,针对Igor Markov的“元分析”和无根据猜测,谷歌提供了详细的时间线和非机密部署情况,澄清事实并重申AlphaChip的开放性和透明度。
30 13
|
18天前
|
机器学习/深度学习 数据采集 人工智能
昇腾AI行业案例(七):基于 Conformer 和 Transformer 模型的中文语音识别
欢迎学习《基于 Conformer 和 Transformer 模型的中文语音识别》实验。本案例旨在帮助你深入了解如何运用深度学习模型搭建一个高效精准的语音识别系统,将中文语音信号转换成文字,并利用开源数据集对模型效果加以验证。
42 12

热门文章

最新文章