Claude 3正式发布,超越GPT-4,一口气读15万单词,OpenAI最强的大对手!

简介: Claude 3正式发布,超越GPT-4,一口气读15万单词,OpenAI最强的大对手!

多模态AI大模型Claude 3(https://www.anthropic.com/news/claude-3-family

昨天,OpenAI的主要竞争对手Anthropic发布了首个多模态AI大模型Claude 3,并升级了主要技术指标。多项基准测试显示,Claude 3最高级版本的性能均超越了目前最先进的GPT-4。

Anthropic最新发布的Claude 3的AI大模型展示了更强大的技术,其中一款最高级的Claude 3 Opus大模型在推理、数学等能力方面的表现均优于GPT-4和谷歌的Gemini 1.0 Ultra。这表现在性能最高的版本Claude 3 Opus可以总结超过15万个单词数量的长文,这相当于一本小说的长度。而GPT-4仅可总结3000个。Claude上一版本可总结约7.5万个单词。

Claude 3 的三个版本

新一代的Claude 3分为三个版本,分别为Haiku、Sonnet、Opus三款模型。从模型尺寸来看,可以理解为模型的中杯、大杯、超大杯。

虽然Anthropic并没有给出模型的具体参数,不过给出了三款模型所适用的场景:

Haiku:是相应速度最快的模型,也是成本最低的选项,在大多数纯文本任务上的表现仍然相当出色,也同时包含多模态能力(比如视觉)

Sonnet:适用于需要平衡性能和成本的场景,它在纯文本任务上的表现与后面的Opus相当,但在成本上更为经济,适合于那些需要性能稍微好点,但预算有限的企业和个人用户

Opus:具有强大的推理、数学和编码能力,接近人类的理解能力,适用于需要高度智能和复杂任务处理的场景,如企业自动化、复杂金融预测、研究和开发等。

新增功能,chatgpt没有的

Anthropic公司CEO阿莫迪称Claude 3为“AI大模型中的劳斯莱斯”。“至少从目前来看是这样的。”他表示。该公司称,Claude 3 Opus到达了“本科知识水平”以及“研究生推理水平”。

Claude 3还首次支持图像和文档表格等上传,这也是Anthropic发布的首个支持图片的“多模态大模型”。不过与GPT-4可以生成图片不同,Claude 3仅对用户上传的图片或者文字进行分析处理。这是由于在Anthropic看来,企业对于图片生成的“需求很少”,他们更对AI大模型执行认知上复杂任务的需求更大,例如准确处理复杂的财务分析。

使用成本

Anthropic已经于当日向159个国家的用户开放了Claude 3的三个版本,将通过亚马逊AWS和谷歌云平台提供。 至少目前从价格方面来看,其最高端版本Claude 3 Opus的定价显著超越了GPT-4——每100万条token收费15美元。相比之下,GPT-4 Turbo模型的每百万token的收费为10美元。不过Anthropic方面称,Claude 3的另外两个性能较低的版本Sonnet和Haiku处理相同数据的收费要比Claude 3 Opus低至少五倍。

总结

人类的方方面面都会被AI重构一遍,但是AI说到底还是人类的智慧,我们一般人虽不能开发出这么牛逼的东西,但是我们可以去更好的运用它们来为我们解决很多难题,为工作提升效率。感谢阅读

相关文章
|
1月前
|
机器学习/深度学习 测试技术 信息无障碍
VLM集体失明?视力测试惨败,GPT-4o、Claude 3.5全都不及格
【8月更文挑战第2天】新研究表明,顶尖视觉语言模型(VLMs)如GPT-4o和Claude 3.5,在看似简单的视觉任务上表现堪忧,诸如判断圆圈是否重叠或线条是否交叉等。此发现揭示了即便是在图像理解方面表现出色的VLMs也存在基本视觉认知的局限性,提示模型融合视觉信息的方式有待改进。论文详细探讨了可能的原因及未来提升方向。[@arxiv:2407.06581]
51 6
|
1月前
|
人工智能 搜索推荐 机器人
OpenAI 将向企业开放 GPT-4o 模型定制版,国内怎么使用ChatGPT?
OpenAI新推功能让企业客户能定制GPT-4o模型,通过微调技术满足特定需求和业务场景,以前所未有的方式优化AI投资回报。企业上传自有数据后,可在一到两小时内完成模型定制,如滑板公司打造专业客服聊天机器人解答详细问题,大幅提升服务针对性与客户体验。目前定制限于文本数据,但仍显著增强了企业应用AI的灵活性与效率。
60 2
OpenAI 将向企业开放 GPT-4o 模型定制版,国内怎么使用ChatGPT?
|
12天前
|
测试技术 人机交互
没有等来OpenAI开源GPT-4o,等来了开源版VITA
【9月更文挑战第9天】近日,论文《Towards Open-Source Interactive Omni Multimodal LLM》介绍了VITA,一种基于Mixtral 8×7B的新型开源多模态大语言模型,能处理视频、图像、文本和音频等多模态数据,并提供先进的人机交互体验,填补了开源模型在多模态能力上的空白。经多任务学习及指令微调,VITA在多个基准测试中表现出色,但仍存在基础能力和嘈杂音频处理等方面的局限。更多详情见论文:https://arxiv.org/pdf/2408.05211
32 3
|
23天前
|
人工智能 API Python
Openai python调用gpt测试代码
这篇文章提供了使用OpenAI的Python库调用GPT-4模型进行聊天的测试代码示例,包括如何设置API密钥、发送消息并接收AI回复。
|
1月前
|
缓存 测试技术 C++
OpenAI GPT-4 Code Interpreter测试
本文分析了OpenAI GPT-4 Beta版本中的Code Interpreter功能,测试了其处理不同文件类型(如图表PNG、长文本PDF、短代码ipynb和长代码C++)的能力,并指出了在处理超出Token Limit内容时的局限性。
28 0
OpenAI GPT-4 Code Interpreter测试
|
1月前
|
人工智能 安全 搜索推荐
OpenAI宣布为企业和消费者提供可定制的GPT
OpenAI宣布为企业和消费者提供可定制的GPT
|
1月前
|
人工智能 机器人 API
OpenAI内斗对GPT是福是祸?对人类?对微软?
OpenAI内斗对GPT是福是祸?对人类?对微软?
|
2月前
|
人工智能 自然语言处理 测试技术
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
【7月更文挑战第11天】蒙特利尔大学Yoshua Bengio团队推出多模态新基准MFE,旨在全面评估大型语言模型在处理跨模态任务时的能力。MFE包含多样化数据集、挑战性任务和严格评估指标,暴露了Claude 3.5和GPT-4o等现有模型的弱点,为多模态AI研究提供新视角和改进方向。论文链接:arxiv.org/abs/2406.06462
48 1
|
3月前
|
人工智能 机器人 API
OpenAI发布新AI模型GPT-4o和桌面版ChatGPT
OpenAI发布新AI模型GPT-4o和桌面版ChatGPT
|
3月前
|
机器学习/深度学习 人工智能 测试技术
两句话,让LLM逻辑推理瞬间崩溃!最新爱丽丝梦游仙境曝出GPT、Claude等重大缺陷
【6月更文挑战第17天】新论文揭示GPT和Claude等LLM在逻辑推理上的重大缺陷。通过《爱丽丝梦游仙境》场景,研究显示这些模型在处理简单常识问题时给出错误答案并过度自信。即使面对明显逻辑矛盾,模型仍坚持错误推理,暴露了现有评估方法的不足。[链接:https://arxiv.org/abs/2406.02061]
331 1