Deep:深的,象征“深度学习”
Seek:寻找、探索,寓意追求突破和创新。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司 ,成立于2023年,是一家创新型科技公司,专注于开发先进的大语言模型和相关技术。总部位于杭州。它因推出开源 AI 模型 DeepSeek-R1 而引起了广泛关注。
DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。与ChatGPT相比,大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。
据介绍,R1模型在技术上实现了重要突破——用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI的o1模型正式版,且训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。