震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型

简介: 震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型

震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型

DeepSeek-V2 的综合能力

中文综合能力(AlignBench):开源模型中最强,与 GPT-4-Turbo、文心 4.0 等闭源模型在评测中处于同一梯队

英文综合能力(MT-Bench) :处于第一梯队 英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B

知识:知识、数学、推理、编程等榜单结果位居前列

上下文:开源模型和 API 支持 128K 上下文

性能

一些分析报告指出,DeepSeek V2 模型在训练时使用了高达8.1万亿个token,并且展示了令人难以置信的高效训练能力,其计算需求仅为Meta Llama 3 70B模型的五分之一。

换一种说法,DeepSeek-V2 在训练时所需的计算资源仅为 GPT-4 的二十分之一,但性能上却相差无几。

有外国网友对此给予了极高的评价,认为 DeepSeek V2 在仅有210亿个活跃参数的情况下,能够展现出如此强大的推理能力,实在令人震惊。

DeepSeek API 定价(价格屠夫)

作为AI技术的前沿领域,大模型更新换代之快有目共睹,再强的性能也可能在发布的下一秒就被友商反超。

因此,DeepSeek 选择“卷”价格。

目前DeepSeek-V2 API的定价为:每百万token输入1元、输出2元(32K上下文)

和友商相比,仅为 GPT-4-Turbo 的近百分之一

最后

DeepSeek 宣称,其使用8个H800 GPU的单台服务器在最佳状态下每秒能够处理超过50000个解码token。

如果只考虑按照输出 tokenAPI 计费,那么每个服务器每小时可以赚取超过50美元。

假设服务器的使用率是100%,并且每个8个 H800 GPU 的服务器每小时的成本是15美元,那么 DeepSeek 的每台服务器每小时的净收益高达35美元以上,毛利率甚至超过70%。

有专家分析认为,即便服务器的使用率没有达到最大,或者批处理速度没有达到最高性能,DeepSeek 依然拥有可观的利润空间。

总结就是,主打一个“经济实惠”,简直就是AI版“拼多多”。



相关文章
|
2月前
|
人工智能 测试技术 API
构建AI智能体:二、DeepSeek的Ollama部署FastAPI封装调用
本文介绍如何通过Ollama本地部署DeepSeek大模型,结合FastAPI实现API接口调用。涵盖Ollama安装、路径迁移、模型下载运行及REST API封装全过程,助力快速构建可扩展的AI应用服务。
689 6
|
2月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
374 121
|
2月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
293 114
|
2月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
304 120
|
2月前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
264 117
|
2月前
|
人工智能 机器人 人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
301 117
|
2月前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
1222 16
构建AI智能体:一、初识AI大模型与API调用
|
2月前
|
人工智能 算法 数据安全/隐私保护
拔俗AI多模态心理风险预警系统:用科技守护心理健康的第一道防线
AI多模态心理风险预警系统通过语音、文本、表情与行为数据,智能识别抑郁、焦虑等心理风险,实现早期干预。融合多源信息,提升准确率,广泛应用于校园、企业,助力心理健康服务从“被动响应”转向“主动预防”,为心灵筑起智能防线。(238字)

热门文章

最新文章