今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!

简介: 本文介绍了四个最新的 AI 开源项目,涵盖多模态生成式 AI、自然语言到 SQL 转化、多模态数学推理和复杂逻辑推理等多个领域,为 AI 应用开发提供了丰富的资源和工具。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


DeepSeek-R1-Lite:深度求索推出的新一代 AI 推理模型

DeepSeek-R1-Lite.png

DeepSeek-R1-Lite 是深度求索推出的新一代 AI 推理模型,用强化学习训练,具备长思维链推理能力,能实时展示推理思考过程,性能在多个基准测试中超越 GPT-4 等模型。

模型在数学、编程和复杂逻辑推理任务上表现出色,提供媲美 OpenAI o1-preview 的推理效果。

DeepSeek-R1-Lite 拥有“深度思考”模式,专门针对复杂推理问题设计,展现出更高的效率和准确率。

目前 DeepSeek-R1-Lite 只是一个较小的基座模型,仅支持网页使用,暂不支持 API 调用。正式版 DeepSeek-R1 模型即将完全开源,并公开技术报告,支持部署 API 服务。

资源


Samsung Gauss2:三星推出的第二代多模态生成式 AI 模型

Samsung Gauss2.jpg

Samsung Gauss2 是三星公司推出的第二代多模态生成式 AI 模型,能够提升 Galaxy AI 功能的性能和效率。

Samsung Gauss2 能同时处理文本、代码和图像等多种数据类型,并分为三个版本:精简版(Compact)、均衡版(Balanced)和至尊版(Supreme),适应不同的计算环境和应用场景。

模型支持多种语言和编程语言,性能比前代提升 1.5 到 3 倍,显著减少了用户等待时间。三星已在内部广泛应用 Samsung Gauss2 提高员工的工作效率,特别是在编码辅助、文档摘要、邮件撰写和翻译等方面。

资源


XiYan-SQL:阿里推出文本到 SQL 的多生成器集成框架

XiYan-SQL.png

XiYan-SQL 是阿里巴巴推出的自然语言到 SQL(NL2SQL)框架,基于多生成器集成策略,结合提示工程和监督微调,提升 SQL 查询生成质量。

XiYan-SQL 引入 M-Schema 半结构化架构表示,增强对数据库结构的理解,包括数据类型、主键和示例值。

XiYan-SQL 基于三阶段流程生成和优化 SQL 查询,包括架构链接、基于示例学习(ICL)和 SFT 的生成器,及纠错和选择模型。

资源


AtomThink:华为诺亚方舟联合多所高校推出的多模态数学推理框架

AtomThink.png

AtomThink 是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。

框架基于构建长链的思维(CoT)引导多模态大型语言模型(MLLMs)进行复杂推理,包含自动 CoT 注释引擎、原子步骤微调和多种搜索策略。

AtomThink 基于提升原子步骤的质量,显著增强 MLLMs 在解决数学问题时的推理能力,为开发通用的慢思维模型提供新的方向。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
2月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
1761 120
|
2月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
304 120
|
2月前
|
存储 人工智能 安全
《Confidential MaaS 技术指南》发布,从 0 到 1 构建可验证 AI 推理环境
Confidential MaaS 将从前沿探索逐步成为 AI 服务的安全标准配置。
|
机器学习/深度学习 人工智能 测试技术
|
2月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
550 36
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
457 30
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
916 47
|
2月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
401 1

热门文章

最新文章