今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 本文介绍了四个最新的 AI 开源项目,涵盖多模态生成式 AI、自然语言到 SQL 转化、多模态数学推理和复杂逻辑推理等多个领域,为 AI 应用开发提供了丰富的资源和工具。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


DeepSeek-R1-Lite:深度求索推出的新一代 AI 推理模型

DeepSeek-R1-Lite.png

DeepSeek-R1-Lite 是深度求索推出的新一代 AI 推理模型,用强化学习训练,具备长思维链推理能力,能实时展示推理思考过程,性能在多个基准测试中超越 GPT-4 等模型。

模型在数学、编程和复杂逻辑推理任务上表现出色,提供媲美 OpenAI o1-preview 的推理效果。

DeepSeek-R1-Lite 拥有“深度思考”模式,专门针对复杂推理问题设计,展现出更高的效率和准确率。

目前 DeepSeek-R1-Lite 只是一个较小的基座模型,仅支持网页使用,暂不支持 API 调用。正式版 DeepSeek-R1 模型即将完全开源,并公开技术报告,支持部署 API 服务。

资源


Samsung Gauss2:三星推出的第二代多模态生成式 AI 模型

Samsung Gauss2.jpg

Samsung Gauss2 是三星公司推出的第二代多模态生成式 AI 模型,能够提升 Galaxy AI 功能的性能和效率。

Samsung Gauss2 能同时处理文本、代码和图像等多种数据类型,并分为三个版本:精简版(Compact)、均衡版(Balanced)和至尊版(Supreme),适应不同的计算环境和应用场景。

模型支持多种语言和编程语言,性能比前代提升 1.5 到 3 倍,显著减少了用户等待时间。三星已在内部广泛应用 Samsung Gauss2 提高员工的工作效率,特别是在编码辅助、文档摘要、邮件撰写和翻译等方面。

资源


XiYan-SQL:阿里推出文本到 SQL 的多生成器集成框架

XiYan-SQL.png

XiYan-SQL 是阿里巴巴推出的自然语言到 SQL(NL2SQL)框架,基于多生成器集成策略,结合提示工程和监督微调,提升 SQL 查询生成质量。

XiYan-SQL 引入 M-Schema 半结构化架构表示,增强对数据库结构的理解,包括数据类型、主键和示例值。

XiYan-SQL 基于三阶段流程生成和优化 SQL 查询,包括架构链接、基于示例学习(ICL)和 SFT 的生成器,及纠错和选择模型。

资源


AtomThink:华为诺亚方舟联合多所高校推出的多模态数学推理框架

AtomThink.png

AtomThink 是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。

框架基于构建长链的思维(CoT)引导多模态大型语言模型(MLLMs)进行复杂推理,包含自动 CoT 注释引擎、原子步骤微调和多种搜索策略。

AtomThink 基于提升原子步骤的质量,显著增强 MLLMs 在解决数学问题时的推理能力,为开发通用的慢思维模型提供新的方向。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
7月前
|
人工智能 运维 安全
英伟达发布AI Enterprise 5.0,帮助企业加速生成式AI开发
英伟达发布AI Enterprise 5.0,这是一个云端原生平台,加速生成式AI的开发与部署。该平台提供优化的数据科学流程,支持生成式AI,强调性能、安全性和灵活性。核心特性包括NVIDIA NIM和CUDA-X微服务的性能优化,严格的安全监测,多环境运行能力,及企业级支持与服务。API目录提供多种预训练模型,促进跨领域的应用创新。然而,平台可能对小企业有高技术门槛和成本挑战,且可能存在与现有系统兼容性问题。
149 1
英伟达发布AI Enterprise 5.0,帮助企业加速生成式AI开发
|
7月前
|
人工智能 自然语言处理 数据处理
英伟达推出NeMo,极大简化自定义生成式AI开发
【2月更文挑战第30天】英伟达发布NeMo平台,简化生成式AI模型开发,加速AIGC进程。平台提供NeMo Curator、Customizer和Evaluator微服务,覆盖数据准备至模型评估全周期。Curator加速数据处理,Customizer支持模型微调,Evaluator全面评估模型性能。虽有学习曲线挑战,但NeMo为AI创新与应用带来更多可能性。
127 2
英伟达推出NeMo,极大简化自定义生成式AI开发
|
2月前
|
人工智能 自然语言处理 安全
【通义】AI视界|Adobe推出文生视频AI模型,迎战OpenAI和Meta
本文精选了过去24小时内的重要科技新闻,包括微软人工智能副总裁跳槽至OpenAI、Adobe推出文本生成视频的AI模型、Meta取消高端头显转而开发超轻量设备、谷歌与核能公司合作为数据中心供电,以及英伟达股价创下新高,市值接近3.4万亿美元。这些动态展示了科技行业的快速发展和激烈竞争。点击链接或扫描二维码获取更多资讯。
|
2月前
|
人工智能 自然语言处理 安全
Gemini 人工智能:谷歌AI重磅来袭!好消息,国内可用
Gemini 是 Google 🧠 开发的革命性人工智能模型,旨在打造一个功能强大的多模态 AI 系统。
|
4月前
|
人工智能 安全 机器人
谷歌推出其最强大的AI模型Gemini
谷歌推出其最强大的AI模型Gemini
|
7月前
|
人工智能 自然语言处理 开发者
Stability AI & VAST 强强联手推出开源单图生成3D模型TripoSR
【2月更文挑战第15天】Stability AI & VAST 强强联手推出开源单图生成3D模型TripoSR
118 1
Stability AI & VAST 强强联手推出开源单图生成3D模型TripoSR
|
7月前
|
人工智能 搜索推荐 物联网
高通正式推出高通AI Hub,支持超过75款AI大模型
【2月更文挑战第9天】高通正式推出高通AI Hub,支持超过75款AI大模型
295 2
高通正式推出高通AI Hub,支持超过75款AI大模型
|
7月前
|
人工智能 搜索推荐 安全
Gemini的逼迫、ChatGPT4.5也即将发布,AI的步伐又增快了...
Gemini的逼迫、ChatGPT4.5也即将发布,AI的步伐又增快了...
376 0
|
7月前
|
编解码 人工智能 监控
OpenAI推出模型sora, 是要颠覆AI视频行业吗?
什么是OpenAI Sora? OpenAI Sora是一种结合了Diffusion模型和Transformer模型的技术。 通过将视频压缩网络将原始视频压缩到一个低维的潜在空间,并将这些表示分解为时空补丁,类似于Transformer的tokens,这样的表示使得模型能够有效地训练在不同分辨率、持续时间和宽高比的视频和图像上。
96 2
|
人工智能 Python
AI大模型升级,新特性亮相!
亲爱的家人们,大家好!我们之前有一篇公众号文章了介绍了AI大模型,今天了AI大模型也迎来一次重要的更新升级!这次升级将为大家带来一系列新特性,让我们一起来看看这些新特性都有哪些吧!
309 0
AI大模型升级,新特性亮相!

热门文章

最新文章