Anthropic以经济实惠的批处理方式挑战OpenAI

简介: Anthropic以经济实惠的批处理方式挑战OpenAI

文章来源: 企业网D1net

领先的AI公司Anthropic发布了全新的Message Batches API,能够以50%的折扣处理大批量数据,标志着AI在大规模数据处理中的成本效益显著提升,该API可以在24小时内异步处理多达10000个查询,为中型企业广泛采用AI提供了新的契机。虽然批处理带来了显著的成本节省,但它也引发了关于如何平衡实时与批处理能力的讨论,强调企业在AI战略中不仅要考虑短期成本,还需兼顾长期创新和多样化应用场景。


Anthropic公司推出新批处理API,数据处理成本降低50%。


领先的AI公司Anthropic于周二推出了全新的Message Batches API,允许企业以一半的标准API调用成本处理大量数据。


这一新产品能够在24小时内异步处理多达10000个查询,标志着在大数据处理方面,先进AI模型变得更加经济实惠,尤其适用于处理大量数据的企业。


AI的规模经济:批处理降低成本


与实时处理相比,Batch API在输入和输出代币上提供了50%的折扣,使Anthropic能够与其他AI提供商(如今年早些时候推出类似批处理功能的OpenAI)展开更加激烈的竞争。


此举标志着AI行业定价策略的重大转变。通过提供大批量处理的折扣,Anthropic有效地为AI计算创建了规模经济。


这可能会推动中型企业更广泛地采用AI,尤其是那些之前因成本过高而无法使用大规模AI应用的企业。


这种定价模式的影响不仅限于成本节省,它可能从根本上改变企业进行数据分析的方式,促使企业进行更多的全面、频繁的大规模分析,而这些分析在过去被认为成本过高或资源密集。


从实时到合适时机:重新定义AI处理需求


Anthropic已经通过其API为Claude 3.5 Sonnet、Claude 3 Opus和Claude 3 Haiku模型提供批处理API服务。Claude在Google Cloud的Vertex AI上的支持也即将推出,而通过Amazon Bedrock使用Claude的客户已经可以访问批量推理功能。


批处理功能的引入表明企业AI需求的逐渐成熟。虽然实时处理是许多AI开发的重点,但许多业务应用并不需要即时结果。通过提供较慢但更具成本效益的选项,Anthropic承认对许多应用场景来说,“合适时机”的处理比实时处理更为重要。


这一变化可能促使企业在AI实施中采取更为细致的策略。企业不再默认选择最快(通常也是最昂贵)的选项,而是可能会开始在实时处理和批处理之间战略性地平衡其AI工作负载,优化成本和速度的双重需求。


批处理的双刃剑


尽管批处理带来了显著的好处,但这种转向也引发了关于AI发展未来方向的重要问题。虽然它使现有模型变得更加易于获取,但也存在一个风险:可能会分散资源和注意力,影响实时AI能力的进步。


在技术领域,成本与速度的权衡并不新鲜,但在AI领域,这种权衡则具有更大的意义。随着企业习惯于批处理的低成本,市场上对提高实时AI处理效率和降低成本的压力可能会减少。


此外,批处理的异步性质可能限制一些依赖即时AI响应的创新应用,例如实时决策或交互式AI助手。


如何在推动批处理和实时处理能力的同时找到合适的平衡,将对AI生态系统的健康发展至关重要。


随着AI行业的不断发展,Anthropic的新Batch API既代表了一个机遇,也带来了挑战,它为企业在大规模使用AI提供了新的可能性,有望让更多企业能够接触到先进的AI能力。


与此同时,这也强调了在AI开发中采取深思熟虑的方法的重要性,不仅要考虑眼前的成本节约,还要着眼于长期创新和多样化的应用场景。这个新产品的成功可能取决于企业如何将批处理融入其现有工作流程,以及它们在AI战略中如何有效平衡成本、速度和计算能力的权衡。


版权声明:本文为企业网D1net编译,转载需在文章开头注明出处为:企业网D1net,如果不注明出处,企业网D1net将保留追究其法律责任的权利。


(来源:企业网D1net)

相关文章
|
3月前
|
人工智能 自然语言处理 算法
更快、更强、更经济!港大开源大模型RAG系统LightRAG
香港大学研究团队推出LightRAG,一款新型检索增强生成系统。LightRAG通过引入图结构优化文本索引和检索,克服了传统RAG系统在上下文感知、数据表示和更新效率方面的局限。其双级检索系统、图结构与向量表示的融合及增量更新算法,显著提升了检索准确性和效率,适用于智能客服、知识问答和智能搜索等多个领域。
145 3
|
3月前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,企业越来越关注大模型的私有化部署。本文详细探讨了硬件资源需求、数据隐私保护、模型可解释性、模型更新和维护等方面的挑战及解决方案,并提供了示例代码,帮助企业高效、安全地实现大模型的内部部署。
475 1
|
6月前
|
人工智能 弹性计算 芯片
就AI 基础设施的演进与挑战问题之AIGC场景下训练和推理的成本的问题如何解决
就AI 基础设施的演进与挑战问题之AIGC场景下训练和推理的成本的问题如何解决
|
8月前
|
人工智能 运维 搜索推荐
《百炼成金-大金融模型新篇章》––07.问题5:“杀手级通用大模型vs百花齐放专属大模型”,企业级AI应用的价值自证?
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。
142 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
AI计算在哪些方面可以提高教育模式的效率?
【5月更文挑战第19天】AI计算可以在多个方面提高教育模式的效率,具体包括: 智能教育环境:通过机器学习和自然语言处理技术,可以创建个性化的学习环境,根据学生的学习习惯和进度调整教学内容和难度,从而提高学 AI计算在哪些方面可以提高教育模式的效率?
169 1
|
9月前
|
人工智能 NoSQL atlas
加入MongoDB AI创新者计划,为您的AI初创企业获取额外支持!
MongoDB推出AI创新者计划,针对AI初创企业和各规模企业,提供专属福利和Atlas云数据库额外额度。AI初创者计划适合早期企业,包括联合营销机会和专业服务支持,优秀项目有望成为MongoDB Ventures。AI强化计划则针对不同企业,由MongoDB专家评估项目潜力,提供一对一技术指导、免费Atlas使用额度和在MongoDB生态中曝光的机会。符合条件的A轮或更早阶段的初创公司可申请,现有MongoDB for Startups成员也可加入并获取更多Atlas资源。扫描二维码即可申请,开启AI创新之旅。
3528 0
|
9月前
|
机器学习/深度学习 自然语言处理 搜索推荐
大模型技术在C端市场的三大应用场景
【1月更文挑战第15天】大模型技术在C端市场的三大应用场景
586 2
大模型技术在C端市场的三大应用场景
|
机器学习/深度学习 缓存 自然语言处理
更加灵活、经济、高效的训练——新一代搜推广稀疏大模型训练范式GBA
近日,阿里巴巴在国际顶级机器学习会议NeurIPS 2022上发表了新的自研训练模式 Gloabl Batch gradients Aggregation (GBA,论文链接:https://arxiv.org/abs/2205.11048),由阿里妈妈事业部搜索广告团队和智能引擎事业部XDL训练引擎团队联合探索和研发。GBA的提出对阿里巴巴搜推广稀疏模型的训练范式带来了架构性的跨越式升级。本文将从GBA的设计思路、收敛性分析及工程实现等方面展开介绍,欢迎阅读交流。
更加灵活、经济、高效的训练——新一代搜推广稀疏大模型训练范式GBA
|
存储 人工智能 搜索推荐
硬件预算最高直降46倍!低成本上手AIGC和千亿大模型,一行代码自动并行,Colossal-AI再升级
硬件预算最高直降46倍!低成本上手AIGC和千亿大模型,一行代码自动并行,Colossal-AI再升级
362 0
|
机器学习/深度学习 数据采集 人工智能
大模型时代,那些一起训练AI模型的企业是怎么应对数据顾虑的?
大模型时代,那些一起训练AI模型的企业是怎么应对数据顾虑的?
223 0