ModelScope模型即服务-最新-第17页-阿里云开发者社区

探索云世界

|

6月前

|

搜索推荐 API Python

|

博文

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

今日发布DeepSeek-V3.1，支持混合推理架构，提升思考效率与Agent能力。编程与搜索智能体表现显著增强，API已升级并支持Anthropic格式，模型开源，上下文扩展至128K。

974 5 5

探索云世界

|

6月前

|

人工智能物联网测试技术

|

博文

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

通义千问团队开源Qwen-Image-Edit，基于20B模型，支持语义与外观双重编辑、精准中英文文字修改，具备SOTA图像编辑能力，可用于IP创作、风格迁移、文字修复等。

5965 6 6

nick6507384252

|

6月前

|

编解码人工智能文字识别

|

博文

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

DeepSeek-OCR开源即获7k+星，首创“上下文光学压缩”技术，仅用100视觉token超越传统OCR模型256token性能，压缩比达10-20倍，精度仍超97%。30亿参数实现单卡日处理20万页，显著降低大模型长文本输入成本，重新定义高效文档理解新范式。

616 2 2

来自：计算机视觉版块

modelscope

|

6月前

|

数据采集人工智能算法

|

博文

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench：揭示单模态与全模态能力的组合规律

美团LongCat团队推出一站式全模态大模型评测基准UNO-Bench，首创“组合定律”揭示多模态能力协同增益，支持中文场景，以98%跨模态问题占比和创新多步开放式题型，科学评估模型真实融合能力。

748 5 5

游客lztrts5drmmq4

|

6月前

|

异构计算并行计算 Python

|

问答

本地部署Qwen3-4B 模型，无法调用GPU

344 0 0

来自：自然语言处理版块

dt_2691532407-30455

|

6月前

|

博文

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

社区8月比赛未获奖有点失落，但发现通义灵码×蚂蚁百宝箱MCP赛事正火热进行！参赛即有机会赢取丰厚奖金，激励满满，令人眼前一亮。已跃跃欲试，搭友们快来一起冲榜夺奖吧！https://tianchi.aliyun.com/competition/entrance/532442

297 2 2

ZhangCraig

|

6月前

|

人工智能前端开发关系型数据库

|

博文

MajorRAG 概述（1/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法

321 1 1

来自：自然语言处理版块

ykanyezdnax7a

|

6月前

|

问答

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

169 0 0

来自：计算机视觉版块

ZhangCraig

|

6月前

|

存储 JSON 人工智能

|

博文

MajorRAG聊天问答系统实现分析（3/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

393 1 1

ZhangCraig

|

6月前

|

存储关系型数据库 MySQL

|

博文

MajorRAG文件内容提取实现分析（2/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

330 1 2

游客77ikadlqxugne

|

6月前

|

人工智能 JavaScript API

|

博文

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

本文对比了OpenAI、Google、Claude及开源平台如agtm 的AI Agent注册与发布方法，重点介绍AI Agent Registry API、社区和Marketplace三种方式，帮助开发者和产品经理提升智能体的可见性与分发渠道。

1247 0 0

modelscope

|

6月前

|

机器学习/深度学习数据可视化 Apache

|

博文

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

11月11日，百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型，仅3B激活参数，性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能，支持工具调用与视频分析，适用于复杂图文任务，全面开放商用。

915 17 17

robotliu0327_nwhel

|

6月前

|

索引 API

|

问答

embedding模型部署调用出现接口调用不一致

238 0 0

来自：自然语言处理版块

modelscope

|

6月前

|

自然语言处理语音技术 Apache

|

博文

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX，支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制，采用统一LLM框架，实现文本驱动音频创作。

984 88 88

blanklog

|

6月前

|

数据处理

|

问答

魔塔社区AIGC 模型训练可以上传本地的打标文件么？

248 0 0

来自：计算机视觉版块

modelscope

|

6月前

|

机器学习/深度学习算法物联网

|

博文

Mcore Bridge：迈向Megatron训练"零门槛"时代

魔搭社区推出Mcore-Bridge与Megatron-SWIFT，显著降低大模型训练门槛。支持safetensors格式、一键启动、无需权重转换，兼容MoE等架构，实现高性能与易用性统一，让Megatron训练开箱即用。

1156 10 10

modelscope

|

6月前

|

JavaScript 搜索推荐开发者

|

博文

ChatPPT+魔搭社区：MCP 2.0全面升级！

ChatPPT MCP2.0正式发布，联合魔搭ModelScope推出云端智能体服务，支持生成、编辑、演讲、动画等全链路功能，开放Streamable HTTP协议与本地Stdio双模式，已接入20+平台，服务300+开发者。

1001 11 11

小6子哥

|

6月前

|

人工智能 Cloud Native 前端开发

|

博文

详细教程 PhpStorm 2025.1 安装+ 激活中文配置，附安装包

PhpStorm 2025.1 全新升级，深度支持 PHP 8.3+/8.4，强化 AI 助手、Xdebug 调试与 .env 嵌套变量，提升全栈开发效率，打造现代化 PHP 开发利器。

1208 0 0

啦啦啦191

|

6月前

|

安全 Java 数据库连接

|

博文

如何在Java代码中处理数据库连接异常

在Java中，合理处理数据库连接异常对程序稳定性至关重要。需捕获`ClassNotFoundException`和`SQLException`等具体异常，使用`try-with-resources`自动释放资源，结合日志记录与用户友好提示，并可引入重试机制应对网络波动，提升系统容错能力。

386 1 2

MaxIt

|

6月前

|

问答

minimax接入vscode，为什么今天会不间断的出现错误

232 0 0

来自：多模态版块

小6子哥

|

6月前

|

IDE 编译器开发工具

|

博文

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

Keil C51 V9.61是一款专用于8051系列单片机的集成开发环境，支持主流厂商芯片，集编辑、编译、仿真于一体，基于μVision5平台，操作便捷。提供C编译器、汇编器、调试器等全套工具，适用于嵌入式开发。附带安装与激活教程，可实现汉化界面，提升使用体验。（237字）

9751 7 7

1504110813821446

|

6月前

|

JavaScript Shell

|

问答

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

Soul AI Lab联合西工大、上交大开源SoulX-Podcast，支持中英粤川等多语种方言及副语言生成，可稳定输出超60分钟自然流畅的多人对话音频，已在Huggingface登顶TTS趋势榜。

878 0 0

游客f4wpj4mefuj3c

|

6月前

|

问答

宜搭如何实现日期区间组件请假时段开始时间为当日8点结束时间为当日16.45得出的数值组件为8小时

274 1 0

1504110813821446

|

6月前

|

Shell

|

问答

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

411 1 0

来自：自然语言处理版块

游客obapqouyazly6

|

7月前

|

数据挖掘数据库供应链

|

问答

数据分析模型

292 0 0

来自：自然语言处理版块

modelscope

|

7月前

|

机器学习/深度学习人工智能搜索推荐

|

博文

Thinking Machines Lab最新研究结果如何复现？On-Policy Distillation让训练成本直降10倍

Thinking Machines Lab提出On-Policy Distillation技术，让小模型高效继承大模型能力。相比传统强化学习，训练成本降低90%，效率提升十倍，支持本地部署、降低成本与延迟。结合vLLM加速与独立DeepSpeed配置，MS-SWIFT框架实现开箱即用的高效蒸馏训练，助力轻量模型具备“会思考、能纠错、可进化”的智能。

1578 10 10

modelscope

|

7月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

UI-Ins：让 GUI 智能体真正“看懂”用户指令的新范式

通义实验室联合人大发布全新GUI Grounding模型UI-Ins，首创“指令即推理”范式，通过多视角动态推理实现SOTA性能，在五大基准全面领先，支持开源复现与应用。

1003 1 1

modelscope

|

7月前

|

机器学习/深度学习人工智能文字识别

|

博文

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

清华CoAI与智谱AI提出Glyph新范式，将长文本渲染为图像，通过视觉语言模型实现高效长上下文处理。3-4倍压缩比，性能媲美主流大模型，显存占用降2/3，低成本支持百万token任务，开源可商用。

992 26 27

modelscope

|

7月前

|

传感器人工智能 API

|

博文

仅100多元，他给视障人群装上AI“眼睛”

上海两名开发者为验证AI助盲实效，亲手打造百元AI眼镜，蒙眼实测过马路、识盲道，并开源项目鼓励更多人参与。技术导航，人心照亮。

1621 6 8

modelscope

|

7月前

|

编解码调度图形学

|

博文

腾讯混元世界模型1.1开源：支持多视图及视频输入，单卡部署，秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

混元世界模型1.1（WorldMirror）发布，支持多视图、视频输入，单卡秒级生成3D场景。兼容CG管线，开源可部署，实现点云、深度、相机等多任务统一预测，性能领先。

570 1 1

modelscope

|

7月前

|

人工智能程序员开发者

|

博文

「超级开发个体」在诞生：一份白皮书带你理解AI时代开发者

10月24日程序员节，魔搭社区联合知乎发布《THE NEXT WAVE：AI时代开发者生态白皮书》，揭示AI时代开发者新画像：以“超级个体”为核心，兼具技术与商业闭环能力，工具平权让个人开发者崛起。报告涵盖年龄、学历、组织分布及认知行为特征，展现开发者如何用AI提效、实现从“写代码”到“搭系统”的跃迁。点击下载完整报告。

531 0 0

Rigorous_默

|

7月前

|

人工智能

|

问答

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

820 1 0

游客3tw7lavtvady4

|

7月前

|

问答

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Qwen3-VL家族重磅推出2B与32B双版本，轻量高效与超强推理兼备，一模型通吃多模态与纯文本任务！

6921 12 17

游客4obkw77emrslo

|

7月前

|

安全 fastjson

|

问答

fastjson <= 1.2.80 反序列化任意代码执行漏洞

178 0 0

游客umldh5c6n2vvg

|

7月前

|

问答

【AI绘画】你有多久没有打开SD了？

曾几何时，Stable Diffusion的复杂参数令人崩溃，如今即梦、可灵等AI工具已让生成图片变得轻而易举。哩布哩布发布2.0升级公告，看似迈向更易用的未来，却也悄然为那个钻研模型、拼接工作流的“拓荒时代”奏响终章。技术迭代飞快，但那份对创造的热爱与探索精神，永不褪色。

994 9 9

游客fd4e6dyhbdhyy

|

7月前

|

人工智能

|

博文

新手小白一枚，想训练一个专属的题库AI模型，求大佬带

想训练一个专属的题库AI模型

482 8 8

modelscope

|

7月前

|

人工智能物联网

|

博文

Face-to-Photo 模型开源！联名麦橘MERJIC，遇见另一个你！

魔搭 DiffSynth-Studio 团队携手知名创作者麦橘MERJIC，正式开源全新 AI 图像生成模型——Face-to-Photo！该模型基于 Qwen-Image-Edit，采用 LoRA 的模型结构，专为人脸图像生成而优化，将一张普通的人脸照片转化…

951 13 13

modelscope

|

7月前

|

存储人工智能算法

|

博文

ModelScope魔搭社区发布月报 -- 25年10月

2025年10月，ModelScope密集发布多模态与大模型更新，并上线国际站、科学智能专区及AIGC工具FlowBench，加速开源生态发展。

823 9 9

h5cei4nf5lz3y

|

7月前

|

问答

如何做一款高准确率去判断中文语音是否为同一人说的软件

246 0 0

来自：语音版块

啦啦啦191

|

7月前

|

存储 Java 关系型数据库

|

博文

Spring Boot中Spring Data JPA的常用注解

Spring Data JPA通过注解简化数据库操作，实现实体与表的映射。常用注解包括：`@Entity`、`@Table`定义表结构；`@Id`、`@GeneratedValue`配置主键策略；`@Column`、`@Transient`控制字段映射；`@OneToOne`、`@OneToMany`等处理关联关系；`@Enumerated`、`@NamedQuery`支持枚举与命名查询。合理使用可提升开发效率与代码可维护性。（238字）

679 1 1

tb_4588552

|

7月前

|

Docker 容器

|

博文

创空间什么时候支持docker？

创空间目前尚未正式支持Docker，尽管界面已显示Beta选项，但暂不可用。具体上线时间请关注官方更新公告。

164 1 1

tb_4588552

|

7月前

|

容器 Docker

|

问答

创空间什么时候支持docker？

141 0 0

modelscope

|

7月前

|

机器学习/深度学习人工智能 API

|

博文

用Macbook微调Qwen3！手把手教你用微调给Qwen起一个新名字

本文介绍如何在MacBook上使用苹果MLX框架高效微调Qwen3大模型。借助MLX的高性能计算与统一内存架构，仅需2分钟即可完成训练，内存占用低至2GB，推理速度达400 Token/s，并支持快速部署为本地API服务，展现Mac轻薄本的强大AI生产力潜力。

3227 16 16

modelscope

|

7月前

|

自然语言处理物联网 vr&ar

|

博文

图像理解与生成统一模型——前沿模型架构理解

前言生成式多模态模型近年来一直是业界的研究热点。视觉语言模型（VLM）一直是多模态文本生成领域的核心路线，能够完成图像理解任务；扩散模型（Diffusion Model）则一直是图像和视频生成领域的核心方法。

1275 9 9

最新

文章

视频

问答

推荐

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench：揭示单模态与全模态能力的组合规律

本地部署Qwen3-4B 模型，无法调用GPU

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

MajorRAG 概述（1/3）

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

MajorRAG聊天问答系统实现分析（3/3）

MajorRAG文件内容提取实现分析（2/3）

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

embedding模型部署调用出现接口调用不一致

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

魔塔社区AIGC 模型训练可以上传本地的打标文件么？

Mcore Bridge：迈向Megatron训练"零门槛"时代

ChatPPT+魔搭社区：MCP 2.0全面升级！

详细教程 PhpStorm 2025.1 安装+ 激活中文配置，附安装包

如何在Java代码中处理数据库连接异常

在线模型图片生成次数限制

minimax接入vscode，为什么今天会不间断的出现错误

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

funasr使用8k模型识别电话录音返回乱码

flowbench-flowra 开源？

cursor使用魔塔API没有响应

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

宜搭如何实现日期区间组件请假时段开始时间为当日8点结束时间为当日16.45得出的数值组件为8小时

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

数据分析模型

Thinking Machines Lab最新研究结果如何复现？On-Policy Distillation让训练成本直降10倍

UI-Ins：让 GUI 智能体真正“看懂”用户指令的新范式

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

仅100多元，他给视障人群装上AI“眼睛”

腾讯混元世界模型1.1开源：支持多视图及视频输入，单卡部署，秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

「超级开发个体」在诞生：一份白皮书带你理解AI时代开发者

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

modelscope上已休眠的模型无法唤醒，要怎么办？

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

fastjson <= 1.2.80 反序列化任意代码执行漏洞

AIGC的训练器无法上传素材

【AI绘画】你有多久没有打开SD了？

新手小白一枚，想训练一个专属的题库AI模型，求大佬带

Face-to-Photo 模型开源！联名麦橘MERJIC，遇见另一个你！

ModelScope魔搭社区发布月报 -- 25年10月

如何做一款高准确率去判断中文语音是否为同一人说的软件

Spring Boot中Spring Data JPA的常用注解

创空间什么时候支持docker？

创空间什么时候支持docker？

用Macbook微调Qwen3！手把手教你用微调给Qwen起一个新名字

图像理解与生成统一模型——前沿模型架构理解

ModelScope模型即服务

活跃用户

相关产品