今日 AI 开源|共 10 项| 复合 AI 模型,融合多个开源 AI 模型组合解决复杂推理问题

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 今日 AI 简报涵盖多项技术革新,包括多模态检索增强生成框架、高保真虚拟试穿、视频生成、生成式软件开发、上下文感知记忆管理等,展示了 AI 在多个领域的广泛应用和显著进步。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


Fireworks f1:复合 AI 模型,多个开源 AI 模型组合解决复杂推理问题

Fireworks f1

Fireworks f1 是 Fireworks 公司推出的复合 AI 模型,针对复杂推理任务设计。基于在推理层融合多个开放模型,实现超越单一模型的性能和可靠性。Fireworks f1 模型支持开发者用提示的方式轻松访问复合 AI 的能力,简化构建复杂 AI 应用的过程。

资源


Perplexica:开源 AI 搜索引擎,支持多种搜索模式、实时信息更新

Perplexica

Perplexica 是开源的 AI 驱动搜索引擎,基于机器学习算法和自然语言处理技术理解用户查询,提供精确答案。Perplexica 支持多种搜索模式,包括全网搜索、写作助手、学术搜索、YouTube 搜索、Wolfram Alpha 搜索和 Reddit 搜索。Perplexica 支持本地大型语言模型,用 API 将搜索功能集成到其他应用中,集成 SearxNG 搜索技术确保获得最新的信息。

资源


OmniSearch:阿里通义推出的多模态检索增强生成框架

OmniSearch

OmniSearch 是阿里巴巴通义实验室推出的多模态检索增强生成框架,具备自适应规划能力。OmniSearch 能动态拆解复杂问题,根据检索结果和问题情境调整检索策略,模拟人类解决复杂问题的行为,提升检索效率和准确性。

资源


Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据

Documind

Documind 是开源的 AI 文档处理工具,能从 PDF 文档中提取结构化数据。Documind 具备将 PDF 转换为图像、用 OpenAI API 进行信息提取,根据用户定义的模式格式化输出结果的功能。Documind 支持在本地或云端灵活部署,适用于多种文档格式的数据处理。

资源


Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库

Memoripy

Memoripy 是一个 Python 库,为 AI 应用提供上下文感知的记忆管理。Memoripy 支持短期和长期记忆存储,兼容 OpenAI 和 Ollama API。核心功能包括记忆检索、概念提取、图基关联、层次聚类及记忆衰减和强化。基于这些功能,Memoripy 帮助 AI 系统更好地理解和响应用户交互,提升对话的连贯性和个性化体验。

资源


AgileGen:AI 生成式软件开发框架,自动生成软件代码和原型

AgileGen

AgileGen 是生成式软件开发框架,基于人与 AI 协作增强软件的创建过程。AgileGen 包含两个核心部分:终端用户决策制定和 AgileGen 智能体。框架用 Gherkin 语言设计和确认用户故事和验收标准,确保软件代码与用户需求保持一致。AgileGen 基于交互式系统收集用户决策,自动生成软件原型,支持用户反馈进行迭代改进,最终提供满足用户需求的软件产品。

资源


FitDiT:腾讯联合复旦推出的高保真虚拟试穿技术

FitDiT

FitDiT 是高保真虚拟试穿技术,是腾讯和复旦大学联合推出的。基于 Diffusion Transformers(DiT)关注高分辨率特征,提升服装细节的呈现。FitDiT 用服装纹理提取器和服装先验演化技术,增强对服装纹理如条纹、图案和文字的捕捉能力。用扩张-松弛掩码策略,优化服装尺寸适配问题。FitDiT 在定性和定量评估中表现优异,能快速生成具有真实感和复杂细节的试穿图像,推理速度快,为虚拟试穿领域带来突破。

资源


Verifier Engineering:中科院、阿里、小红书联合推出的新型后训练范式

Verifier Engineering

Verifier Engineering(验证器工程)是中国科学院、阿里巴巴和小红书联合推出的新型后训练范式,为基础模型设计,解决提供有效监督信号的挑战。Verifier Engineering 基于自动化验证器执行验证任务并向基础模型提供反馈,分为搜索、验证和反馈三个阶段,优化模型性能。基于闭环反馈机制,强化模型的泛化能力,是实现人工通用智能的重要步骤。

资源


RAG-Diffusion:南京大学推出的区域感知文本到图像生成方法

RAG-Diffusion

RAG-Diffusion 是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段,实现对图像中各个区域的精确控制和细节优化。RAG-Diffusion 支持图像重绘功能,用户在保持其他区域不变的情况下修改特定区域,无需额外的内绘模型。RAG-Diffusion 在属性绑定和对象关系方面展现出优于其他免微调方法的性能。

资源


AnimateAnything:浙江大学联合北航推出的统一可控视频生成技术

AnimateAnything

AnimateAnything 是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateAnything 能精确操作视频,包括控制相机轨迹、文本提示和用户动作注释。基于多尺度控制特征融合网络,该技术将控制信息转化为逐帧光流,指导视频生成。为减少大范围运动导致的闪烁,AnimateAnything 提出基于频率的稳定模块。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。
73 16
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
|
8天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
110 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型,能够从未标注的视频数据中学习复杂知识,支持长期推理和规划任务。
94 8
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
|
7天前
|
人工智能 测试技术 Python
VideoChat-Flash:上海AI Lab开源高效处理超长视频的多模态大模型
VideoChat-Flash 是上海人工智能实验室等机构推出的多模态大模型,通过分层压缩技术高效处理长视频,支持长达数小时的视频输入,推理速度提升5-10倍。
38 1
VideoChat-Flash:上海AI Lab开源高效处理超长视频的多模态大模型
|
5天前
|
人工智能 自然语言处理 JavaScript
微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切
微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。
106 14
|
3天前
|
人工智能 开发者 Python
Chainlit:一个开源的异步Python框架,快速构建生产级对话式 AI 应用
Chainlit 是一个开源的异步 Python 框架,帮助开发者在几分钟内构建可扩展的对话式 AI 或代理应用,支持多种工具和服务集成。
35 9
|
4天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
42 10
|
15天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
11天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
145 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
23天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
106 31

热门文章

最新文章