|
8月前
|
数据可视化 JavaScript API
|

简易Modelscope生图API可视化工具

魔搭社区大模型生图API可视化UI

218 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI Agent

本文介绍了AI Agent的概念及其在云计算3.0时代的焦点地位,强调了其与大语言模型(LLM)的紧密联系。AI Agent由控制端(Brain)、感知端(Perception)和行动端(Action)组成,能够通过LLMs实现复杂的任务分解、记忆管理及工具使用。文章探讨了单代理、多代理及人机交互的应用场景,并分析了钢铁侠中贾维斯的现实版——微软开源JARVIS项目。此外,还提及了国内外多个开源平台及Python在AI领域的核心地位,同时提出了关于智能代理发展的开放问题,如安全性、群体智能演化及代理服务化等。最后提供了丰富的参考资料以供深入研究。

1373 16
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

阶跃多模态再添一员:阶跃与 ACE Studio 联合开源音乐大模型 ACE-Step!

阶跃多模态再添一员:阶跃与 ACE Studio 联合开源音乐大模型 ACE-Step!

806 10
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

魔搭社区模型速递(4.20-4.26)

魔搭ModelScope本期社区进展:2227个模型,270个数据集,167个创新应用,10篇内容

492 4
|
10月前
|
人工智能 JSON 自然语言处理
|

让AI听懂你的建模需求!BlenderMCP:自然语言指令直接操控 Blender,一句话生成复杂3D场景

BlenderMCP通过MCP协议实现Blender与Claude AI的无缝集成,支持通过自然语言指令完成3D建模、材质调整等复杂操作,显著提升创作效率。

1248 1
来自: 自然语言处理  版块
|
10月前
|
机器学习/深度学习 人工智能 PyTorch
|

模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作

UniRig是清华大学与VAST联合研发的自动骨骼绑定框架,基于自回归模型与交叉注意力机制,支持多样化3D模型的骨骼生成与蒙皮权重预测,其创新的骨骼树标记化技术显著提升动画制作效率。

1717 27
来自: 多模态  版块
|
10月前
|
人工智能 中间件 API
|

别让创意卡在工具链!MiniMax MCP Server:MiniMax 开源 MCP 服务打通多模态生成能力,视频语音图像一键全搞定

MiniMax MCP Server 是基于模型上下文协议的多模态生成中间件,支持通过文本指令调用视频生成、图像创作、语音合成及声音克隆等能力,兼容主流客户端实现跨平台调用,采用检索增强生成技术保障内容准确性。

900 3
来自: 多模态  版块
|
10月前
|
人工智能 自然语言处理 Rust
|

【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言

Multi-SWE-bench是首个覆盖Python外7种主流编程语言的代码修复基准,包含1632个真实GitHub问题样本,通过严格筛选与人工验证确保数据质量。

986 0
来自: 自然语言处理  版块
|
10月前
|
人工智能 计算机视觉
|

漫画师福音!开源AI神器让线稿着色快如闪电!MagicColor:港科大开源多实例线稿着色框架,一键生成动画级彩图

MagicColor是香港科技大学推出的多实例线稿着色框架,基于扩散模型和自监督训练策略,实现单次前向传播完成多实例精准着色,大幅提升动画制作和数字艺术创作效率。

829 20
来自: 计算机视觉  版块
|
10月前
|
人工智能 算法 安全
|

OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互

Quasar Alpha 是 OpenRouter 推出的预发布 AI 模型,具备百万级 token 上下文处理能力,在代码生成、指令遵循和低延迟响应方面表现卓越,同时支持联网搜索和多模态交互。

857 1
来自: 多模态  版块
|
10月前
|
人工智能 API 计算机视觉
|

AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用,支持人物与服装照片智能合成,可生成多达10种试穿效果版本,并提供自定义提示词优化功能。

872 18
来自: 计算机视觉  版块
|
11月前
|
机器学习/深度学习 人工智能 编解码
|

Step-Video-TI2V:开源视频生成核弹!300亿参数+102帧电影运镜

Step-Video-TI2V 是阶跃星辰推出的开源图生视频模型,支持根据文本和图像生成高质量视频,具备动态性调节和多种镜头运动控制功能,适用于动画制作、短视频创作等场景。

770 0
来自: 计算机视觉  版块
|
11月前
|
人工智能 PyTorch API
|

Hunyuan3D 2.0:腾讯混元开源3D生成大模型!图生/文生秒建高精度模型,细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型,支持几何生成和纹理合成。

1384 5
来自: 多模态  版块
|
11月前
|
编解码 JSON 物联网
|

腾讯开源HunyuanVideo-I2V图生视频模型+LoRA训练脚本,社区部署、推理实战教程来啦!

继阿里的通义万相wan2.1模型之后,腾讯混元又出大招,重磅发布HunyuanVideo-I2V图生视频模型。

1447 9
|
11月前
|
API
|

有没有推荐的图生图大模型;自己本地部署,然后API实现传图生图

有没有推荐的图生图大模型;自己本地部署,然后API实现传图生图

756 0
|
12月前
|
人工智能 数据可视化 API
|

自动查文献+写代码+跑数据+出报告!港大开源 Auto Deep Research 搞定科研全流程

Auto-Deep-Research 是一款由香港大学开源的个人 AI 助理,基于模块化多 Agent 架构,专注于深度研究任务,兼容多种大语言模型,并提供一键启动和文件解析等强大功能。

1111 4
来自: 自然语言处理  版块
|
16天前
|
人工智能 架构师 安全
|

从架构师和产品经理角度来看 A2UI 的企业级应用

A2UI(Architect-to-UI)是面向企业级应用的AI驱动开发范式,通过ooderAgent实现架构设计到用户界面的直接转换。它 bridging 架构师与产品经理需求:保障架构一致性、提升开发效率、强化质量与安全,支持云原生、低代码及行业定制化演进。(239字)

109 1
|
27天前
|
人工智能 安全 搜索推荐
|

你的错题本里藏着金矿,但你却只把它当成了回收站——用AI给大脑做一次深度Debug

把学习比作软件开发,错题就是Bug。大多数人只改答案(打补丁),却忽略了底层的逻辑漏洞。本文分享一套"错题分析AI指令",利用Root Cause Analysis(根因分析)思维,帮助你用AI深度Debug大脑,将每一个错误转化为认知的核心资产。

163 2
|
1月前
|
数据采集 自然语言处理 算法
|

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

智元机器人发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0,基于NVIDIA Isaac Sim,实现高保真数字孪生环境,支持自然语言生成万级场景,分钟级构建与泛化。平台开源上万小时真实机器人作业数据集,覆盖200+任务,构建10万+场景评估体系,推动具身智能从研发到落地的全链路创新,助力开发者零硬件部署、高效训练与评测。

215 4
|
2月前
|
数据采集 安全 API
|

Python 实用标准库与工具函数使用指南

本文系统梳理Python高效开发三大利器:标准库(datetime、os等)、第三方库(requests、Pillow等)及自定义工具函数,结合高频场景与实操代码,助你避免重复造轮子,提升开发效率。

152 0
|
2月前
|
关系型数据库 应用服务中间件 Linux
|

Linux 项目实战入门:从 0 到 1 搭建 LNMP 网站环境

本文手把手教你从零搭建LNMP网站环境,涵盖CentOS 7虚拟机配置、Nginx+MySQL+PHP安装与联动设置,提供详细命令与排错指南,并扩展部署WordPress实战,助你快速掌握Linux Web环境核心技能。

136 0
|
2月前
|
搜索推荐 物联网 异构计算
|

一张图秒生 LoRA ? Qwen-Image-i2L 诞生记

我们发布了Qwen-Image的“图生LoRA”模型,输入一张图即可端到端生成LoRA权重。通过多阶段迭代,构建了具备细节与风格保持能力的Image-to-LoRA系统,可用于高效LoRA训练初始化,推动个性化生成技术发展。

339 0
|
2月前
|
人工智能 前端开发 测试技术
|

告别 GUI Agent 工程基建噩梦!阶跃星辰开源 4B 模型,本地轻松部署,玩转安卓应用

阶跃星辰开源GELab-Zero,首发4B GUI Agent模型及完整基建,支持一键部署,在多端性能达SOTA。同步推出真实场景评测基准AndroidDaily,推动GUI智能体规模化落地。

557 10
|
2月前
|
传感器 数据采集 算法
|

LET数据集来魔搭了!开源首批超60,000分钟全尺寸人形机器人真机数据

国内最大全尺寸人形机器人真机数据集“LET数据集”正式发布,首批开源超6万分钟高质量数据,覆盖6大真实场景,支持多模态融合与标准化应用,助力具身智能研发,已在魔搭社区开放共享。

355 1
|
4月前
|
数据采集 存储 自然语言处理
|

113_数据收集:Common Crawl过滤与高质量LLM训练数据构建

在大型语言模型(LLM)的训练过程中,数据质量直接决定了模型的性能上限。即使拥有最先进的模型架构和训练算法,如果没有高质量的训练数据,也难以训练出优秀的语言模型。Common Crawl作为目前互联网上最大的公开网络爬虫数据集之一,为LLM训练提供了宝贵的资源。然而,从原始的Common Crawl数据中提取高质量的训练素材并非易事,需要经过严格的过滤和清洗。本文将全面探讨Common Crawl数据集的特性、过滤策略的设计原则、以及2025年最新的过滤技术,为构建高质量的LLM训练语料提供系统指导。

648 0
|
4月前
|
存储 监控 安全
|

132_API部署:FastAPI与现代安全架构深度解析与LLM服务化最佳实践

在大语言模型(LLM)部署的最后一公里,API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长,如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一,凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力,已成为LLM服务化部署的首选方案。

925 3
|
5月前
|
人工智能 自然语言处理 前端开发
|

魔搭社区模型速递(8.30-9.06)

🙋魔搭ModelScope本期社区进展:3361个模型,313个数据集,73个创新应用, 8篇内容

591 1
|
6月前
|
人工智能 物联网 API
|

ModelScope魔搭25年8月发布月报

🔥 这个夏天,开源热潮比气温更燃!Qwen3、GLM4.5、混元、Wan2.2、Qwen-Image等重磅模型密集发布,MoE、多模态、Agent、生图视频全爆发,ModelScope 全程 Day0 支持,生态持续进化中!

480 0
|
6月前
|
机器人 图形学 开发者
|

腾讯混元最新开源:一张图,秒变游戏大片

有没有想过,随手拍的一张风景照,下一秒就能变成可操控的游戏开放世界?

525 3
来自: 计算机视觉  版块
|
7月前
|
人工智能 自然语言处理 物联网
|

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

近日,Jina AI 正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。

1082 2
|
10月前
|
算法 物联网 Swift
|

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

Qwen于近日发布了Qwen3系列模型,包含了各个不同规格的Dense模型和MoE模型。开源版本中,Dense模型基本沿用了之前的模型结构,差别之处在于对于Q和K两个tensor增加了RMSNorm;MoE模型去掉了公共Expert,其他结构基本与前一致。在模型大小上,涵盖了从0.6B到32B(Dense)和235B(MoE)不同的尺寸。

1501 15
|
10月前
|
人工智能
|

Open AI Model

Open AI Model is an open model for defining AI. Focused on AI rather than application, Open AI Model [OAM] brings simplest but most powerful design for modeling AI.

531 140
|
10月前
|
前端开发 机器人 API
|

答疑机器人实践:AgentScope多智能体带你玩转多源召回

答疑机器人实践:AgentScope多智能体带你玩转多源召回

443 3
|
10月前
|
人工智能 搜索推荐
|

「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为

SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。

829 2
来自: 自然语言处理  版块
|
10月前
|
人工智能 IDE API
|

白板秒变IDE,草图直接生成可运行代码!Pad.ws:白板+代码编辑器深度结合,创意到实现无缝衔接

Pad.ws是一款创新的在线开发环境,将交互式白板与完整IDE工具深度结合,支持多人实时协作和多种编程语言,无需安装即可通过浏览器访问。

586 1
来自: 自然语言处理  版块
|
10月前
|
数据采集 人工智能 安全
|

32.7K Star!Awesome MCP Servers:开源MCP资源聚合平台,覆盖20+垂直领域

Awesome MCP Servers 是一个开源项目,汇集了3000多个基于Model Context Protocol的服务器实现,支持本地和云端部署,为AI大模型提供丰富的外部数据访问和工具调用能力。

1843 2
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

PaddleSpeech:百度飞桨开源语音处理神器,识别合成翻译全搞定

PaddleSpeech是百度飞桨团队推出的开源语音处理工具包,集成语音识别、合成、翻译等核心技术,基于PaddlePaddle框架提供高性能解决方案。

1089 18
来自: 语音  版块
|
11月前
|
存储 人工智能 人机交互
|

Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务

Multi-Agent Orchestrator 是亚马逊开源的多智能体框架,能够动态分配代理、维护上下文、支持多种代理类型,适用于客户服务、智能交通、物流配送等复杂场景。

586 9
来自: 自然语言处理  版块
|
11月前
|
存储 人工智能 自然语言处理
|

YT Navigator:AI秒搜YouTube!自然语言直达视频关键帧

YT Navigator 是一款 AI 驱动的 YouTube 内容搜索工具,通过自然语言查询快速定位视频中的关键信息,支持与视频内容对话,适用于研究人员、学生和内容创作者。

643 0
来自: 自然语言处理  版块
|
11月前
|
人工智能 API 决策智能
|

还在蹲Manus的邀请码?别等了!开源版Manus为你快速创建AI工位,给AI一台电脑,然后你就玩去吧!

OpenManus 是 MetaGPT 的开源 AI 平台,支持多语言模型和工具链,执行代码、处理文件等任务,具备实时反馈。OWL 基于 CAMEL-AI,支持角色分配、任务分解和记忆功能,实现高效任务自动化。

1557 22
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 缓存
|

SepLLM:开源大模型加速神器!400万Token长文本推理提速50%,告别OOM噩梦

SepLLM 是一个用于加速大语言模型的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率,适用于长文本处理和多场景部署。

520 7
来自: 自然语言处理  版块
|
12月前
|
人工智能 Python
|

Light-A-Video:好莱坞级打光自由!上海AI Lab开源视频打光AI,无需训练秒改画面氛围,3步让阴天变夕阳

Light-A-Video 是由上海AI Lab联合交大等高校推出的无需训练的视频重照明方法,支持高质量、时间一致的光照控制,零样本生成和前景背景分离处理。

680 9
来自: 计算机视觉  版块
|
15天前
|
人工智能 资源调度 算法
|

意图的觉醒:智能体如何重构算法时代的人机主权

本文探讨智能体时代人机关系的范式革命:从“人适应机器”转向“机器延伸意志”。领航员以意图驱动替代过程管理,重掌决策主权,在效率与人性间守护“微光”,推动个体从执行者跃升为逻辑架构师。(239字)

115 2
|
23天前
|
人工智能 搜索推荐 API
|

FlashLabs 正式发布 Chroma 1.0 - 全球首个开源、端到端、实时语音到语音 AI 模型 → 支持个性化语音克隆

FlashLabs 发布全球首个开源、端到端、实时语音到语音 AI 模型 Chroma 1.0,支持低延迟(TTFT \x26lt; 150ms)、高保真语音克隆与强对话能力,旨在成为 OpenAI Realtime API 的开源替代方案。

262 3
|
26天前
|
人工智能 决策智能
|

多智能体军事协同系统:智能化防务体系中的关键技术框架

多智能体军事协同系统是智能化防务的重要理论方向,通过分布式感知、决策一致与协同控制,构建高效、鲁棒的系统协同模型。本文从概念、技术基础到发展趋势进行系统解析,探讨其在提升整体作战效能、推动系统智能演进中的理论价值,为相关研究提供参考。(238字)

151 2
|
26天前
|
JSON 人工智能 API
|

从对话到Agent:大模型工具调用能力的量化评测

大模型向Agent进化,工具调用是关键。本文介绍EvalScope评测框架,通过双重验证机制,量化评估模型“会不会用、能不能用好”工具,助力开发者打造可靠AI应用。

216 4
|
2月前
|
NoSQL 算法 Java
|

项目《天机学堂》

天机学堂是一个非学历职业技能在线培训平台,核心业务为售卖课程并提供学习辅助与交互功能。技术栈涵盖SpringBoot、Redis、RabbitMQ等。本人负责需求分析、数据库设计及通用工具封装,如基于Redisson实现分布式锁组件,支持注解式加锁、锁类型切换与限流;并参与开发高性能视频进度记录系统,通过缓存+异步持久化方案实现秒级精度回放,有效降低数据库压力。

166 0
|
2月前
|
人工智能 开发框架 自然语言处理
|

Mule Agent Builder:面向下一代 Agent 的全新构建范式

MuleRun推出Mule Agent Builder,首创“Base Agent + Skills + Knowledge”范式,通过自然语言对话即可构建高能力、可推理、会调用工具的AI Agent。它大幅降低开发门槛,实现从创意到变现的一站式闭环,助力创作者轻松打造专属Agent并快速上架盈利。现诚邀共建者参与首批内测,共同定义下一代Agent的构建与商业化未来。

260 2
|
3月前
|
开发框架 人工智能 测试技术
|

字节推出VeAgentBench + veADK,打造可评估、可复现的智能体开发新范式

字节跳动推出VeAgentBench与veADK,打造智能体“开发-评估”闭环。VeAgentBench是覆盖教育、金融、法律等四大场景的开源评估基准,veADK为高效易用的开发框架,支持工具调用、RAG与记忆管理,助力AI智能体可度量、可复现、可落地。

593 11

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互