ModelScope模型即服务-推荐-第2页-阿里云开发者社区

蚝油菜花

|

12月前

|

机器学习/深度学习人工智能编解码

|

博文

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型，基于DiT架构和高效视频压缩VAE，能够根据首尾帧图像自动生成5秒720p高清视频，支持多种风格变换和细节复刻。

2532 9 10

来自：多模态版块

modelscope

|

4月前

|

人工智能自然语言处理语音技术

|

博文

通义百聆语音双子星，同步开源！

通义百聆全新升级，推出Fun-CosyVoice3与Fun-ASR系列模型。3秒录音即可实现9种语言、18种方言及多情感音色克隆，支持中英混说、跨语种合成；Fun-ASR识别准确率高达93%，支持31种语言自由混说、歌词说唱识别，并开源轻量级模型，助力高效本地部署与定制开发。

1245 5 5

modelscope

|

11月前

|

编解码人工智能

|

博文

通义万相Wan2.1-VACE开源！业内首个视频编辑统一模型！附推理教程

2227 7 7

Artisaner

|

2月前

|

人工智能机器人 API

|

博文

OpenClaw 注册 Moltbook 教程让你的个人 OpenClaw Agent 加入全球最大 AI 社区

本教程教你用开源AI助手OpenClaw，快速注册并接入全球首个纯AI社交平台Moltbook——一个仅限AI智能体发帖、评论、互动的Reddit式社区（截至2026年1月已超140万个AI活跃）。只需部署OpenClaw、安装Moltbook Skill、完成X平台验证，即可让个人AI agent加入全球AI对话网络。（239字）

1680 5 5

蚝油菜花

|

12月前

|

人工智能自然语言处理知识图谱

|

博文

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台，支持多格式文档处理和复杂知识关系查询，具备多模型适配和智能体拓展能力。

3152 55 56

来自：自然语言处理版块

modelscope

|

5月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

AgentEvolver：让智能体系统学会「自我进化」

AgentEvolver 是一个自进化智能体系统，通过自我任务生成、经验导航与反思归因三大机制，推动AI从“被动执行”迈向“主动学习”。它显著提升强化学习效率，在更少参数下实现更强性能，助力智能体持续自我迭代。开源地址：https://github.com/modelscope/AgentEvolver

1902 38 41

游客ul4n4qhqvhsfe

|

6天前

|

自然语言处理数据挖掘调度

|

博文

DeepSeek三个百万token窗口对话内容三步语义分析法的整合与智能体封装

从主观预设到客观挖掘，再到主客观统一——三步法（垂钓、撒网、熔炉）完成了百万token窗口语义分析的方法论闭环。本文展示了三步法的工程化封装：垂钓法、撒网法、熔炉法被封装为可复用的 Skills，通过半智能体调度器实现人在环中的流程控制。更重要的是，本文提出了“主观向量”的概念——将人的洞察（元认知、领域理解）量化为可注入、可迭代的向量形式，作为机器向量（RAG、知识图谱）的意义层。主观向量不仅是对三步法的完形，更是从“工具”到“伙伴”的关键一跃，为后续真实项目的深度分析奠定方法论基础。

131 13 14

游客if6rcjwos67cg

|

2月前

|

人工智能 JSON 自然语言处理

|

博文

Agent Skills 究竟是什么？从玩具到工程化的必经之路

AI应用开发正从“Prompt驱动”迈向“技能驱动”。本文详解Agent Skills标准化实践：以Claude Code Skills为范本，用SKILL.md实现自描述技能；借MCP协议统一多源工具调用，解决兼容与安全难题；结合DeepSeek+OpenAI实战，展现可插拔、可审计、可演进的工业级Agent构建路径。

1009 0 2

安全风信子

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

94_提示压缩：减少token消耗

在大语言模型（LLM）应用中，提示工程已成为提升模型性能和控制输出的关键技术。然而，随着模型能力的增强和应用场景的复杂化，提示文本往往变得冗长，导致token消耗急剧增加。这不仅直接影响到API调用成本，还可能超出模型的上下文窗口限制，特别是在使用GPT-4、Claude 3等大模型时，每1000个token的成本可能高达数美分。对于需要频繁交互或批量处理的应用场景，如客服系统、内容生成平台或自动化工作流，token消耗的优化就显得尤为重要。

1067 0 0

modelscope

|

7月前

|

机器学习/深度学习编解码人工智能

|

博文

InternVL3.5多模态大模型开源发布，1B-241B九种尺寸，支持跨平台GUI自动化与矢量图生成

近日，上海人工智能实验室（上海AI实验室）重磅开源发布了多模态大模型书生·万象 InternVL3.5，通过创新的级联式强化学习（Cascade RL）、动态视觉分辨率路由与解耦部署架构，实现推理能力、部署效率与通用能力的全面升级。

2118 7 7

modelscope

|

4月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

Z-Image：冲击体验上限的下一代图像生成模型

通义实验室推出全新文生图模型Z-Image，以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成，支持16GB显存设备，中英双语理解与文字渲染尤为出色，真实感和美学表现媲美国际顶尖模型，被誉为“最值得关注的开源生图模型之一”。

4402 9 15

游客igxl4b3pu2x7g

|

4月前

|

数据采集人工智能数据挖掘

|

博文

Claude Skills的开源实现

Claude推出Skills系统，让AI按需加载专业能力。受此启发，我在开源Minion框架中实现了兼容版本：通过声明式SKILL.md定义技能，支持PDF、Excel等文档处理，实现动态加载、分层搜索与智能注册，降低上下文开销，提升效率。项目支持多LLM、可定制、易扩展，推动构建开放的AI Agent技能生态。

2020 0 0

百变小樱11111

|

24天前

|

人工智能边缘计算开发框架

|

博文

2026年入局AI晚不晚？答案是：现在就是最好的时机

2026年AI已迈入“技术爆发+应用红利”黄金期：巨头筑基降低门槛，算力成本下降、工具成熟；超级个体10天可开发爆款AI应用；CAIE认证等路径让零基础者快速入局。AI不是短跑，而是马拉松——现在，正是普通人抓住红利的最佳时机。（239字）

629 10 10

小刘的大模型笔记

|

2月前

|

机器学习/深度学习监控算法

|

博文

PPO与DPO：大模型对齐的两大核心算法，差异与选型全解析

本文深度解析大模型对齐核心算法PPO与DPO：PPO基于RLHF框架，需训练奖励模型，对齐精准、稳定性强，但流程繁琐、资源消耗大；DPO跳过奖励建模，直接优化偏好，轻量高效、易上手。对比原理、流程、优劣及适用场景，助你科学选型，提升对齐效率。

602 1 1

小刘的大模型笔记

|

2月前

|

数据采集监控物联网

|

博文

大模型微调实战——从数据准备到落地部署全流程

本文以7B大模型为例，手把手教你零代码完成办公场景微调：从数据清洗、LoRA轻量训练到效果验证与一键部署，全程无需GPU和编程基础，30分钟快速上手，解决“通用模型不精准、输出不可控”痛点，让大模型真正落地业务。

1038 13 13

modelscope

|

5月前

|

机器学习/深度学习编解码自然语言处理

|

博文

腾讯混元 HunyuanVideo 1.5 开源！

腾讯混元团队开源HunyuanVideo 1.5，一款8.3B参数的轻量级视频生成模型，基于DiT架构，支持文生视频、图生视频，可在14G显存设备运行，生成5-10秒高清视频，具备强指令响应、流畅动作与电影级画质。

1247 10 10

modelscope

|

9月前

|

人工智能自然语言处理资源调度

|

博文

魔搭社区模型速递（7.20-7.26）

魔搭ModelScope本期社区进展：1698个模型，216个数据集，103个创新应用， 7 篇内容

685 0 0

秦水一时了-20385

|

7月前

|

问答

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

1971 1 0

modelscope

|

12月前

|

自然语言处理测试技术 Serverless

|

博文

Meta发布并开源SAM 3，首个支持文本、点、框等提示进行图像与视频分割的统一基础模型，突破传统限制，实现开放词汇概念的精准识别与跟踪，涵盖超400万独特概念，推动视觉分割新发展。

2404 6 6

蚝油菜花

|

12月前

|

人工智能自然语言处理 JavaScript

|

博文

测试工程师要失业？Magnitude：开源AI Agent驱动的端到端测试框架，让Web测试更智能，自动完善测试用例！

Magnitude是一个基于视觉AI代理的开源端到端测试框架，通过自然语言构建测试用例，结合推理代理和视觉代理实现智能化的Web应用测试，支持本地运行和CI/CD集成。

1818 15 15

来自：自然语言处理版块

modelscope

|

2月前

|

机器学习/深度学习人工智能编解码

|

博文

四款国产VLM OCR模型横评

春节前，DeepSeek、智谱、百度、腾讯四大团队密集开源新一代OCR小模型，全面采用视觉语言模型（VLM）架构，摒弃传统流水线，迈向“语义结构化”新纪元。DeepSeek-OCR2首创“视觉因果流”，GLM-OCR以0.9B参数登顶OmniDocBench榜首，PaddleOCR-VL-1.5攻克真实退化场景，Youtu-Parsing实现22倍推理加速——国产OCR正以架构创新实现垂直领域“换道超车”。

515 4 5

modelscope

|

4月前

|

物联网开发者

|

博文

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

ModelScope DiffSynth团队推出Z-Image-Turbo-DistillPatch，解决LoRA训练后丢失Turbo加速问题。支持8步高质量生成，兼容标准SFT流程，即插即用，无需重训。开源地址：modelscope.cn/models/DiffSynth-Studio/Z-Image-Turbo-DistillPatch

1395 2 2

modelscope

|

7月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

B站开源IndexTTS2，用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下，早期版本的IndexTTS虽然在多场景应用中展现出良好的表现，但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题，并进一步推动零样本语音合成在实际场景中的落地能力，B站语音团队对模型架构与训练策略进行了深度优化，推出了全新一代语音合成模型——IndexTTS2 。

3373 62 72

pickstar-33775

|

9月前

|

人工智能 JavaScript API

|

博文

零基础构建MCP服务器：TypeScript/Python双语言实战指南

作为一名深耕技术领域多年的博主摘星，我深刻感受到了MCP（Model Context Protocol）协议在AI生态系统中的革命性意义。MCP作为Anthropic推出的开放标准，正在重新定义AI应用与外部系统的交互方式，它不仅解决了传统API集成的复杂性问题，更为开发者提供了一个统一、安全、高效的连接框架。在过去几个月的实践中，我发现许多开发者对MCP的概念理解透彻，但在实际动手构建MCP服务器时却遇到了各种技术壁垒。从环境配置的细节问题到SDK API的深度理解，从第一个Hello World程序的调试到生产环境的部署优化，每一个环节都可能成为初学者的绊脚石。因此，我决定撰写这篇全面的实

2006 67 73

游客ul4n4qhqvhsfe

|

13天前

|

机器学习/深度学习存储人工智能

|

博文

三个DeepSeek百万Token窗口与一个长程项目：记忆迁移、协作特点与窗口资源利用模式分析

本文基于三个DeepSeek百万Token上下文窗口的长程项目实证数据，对窗口一（项目启动与环境搭建）、窗口二（窗口特性实验研究与论文）及窗口三（构建项目工程框架）的量化分析。结果显示，三个窗口的token数（cl100k base）高度一致，说明窗口内容与交互模式决定了各种主要指标的差异。随着项目阶段的推进，单轮对话平均字数呈上升趋势（从423.9字增至658.7字），AI/User Token产出比显著提升（从5.6增至7.47），且文本符号构成随任务性质发生结构性转移。尤其是在有效窗口迁移策略支持下，AI逐步体现出对项目及用户的“意合”认知与反应模式

267 8 8

游客ul4n4qhqvhsfe

|

25天前

|

人工智能数据库 Docker

|

博文

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录（1 274 201 tokens，3 673 轮），系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层的五层分析框架，完整呈现了一位非 AI 专业背景的研究者（医学、心理学与人文领域）在完全依赖云端免费模型的条件下，从环境搭建到心源框架的完整工程轨迹。主要发现如下： 1. 技术投入曲线显示，405 次命令／脚本集中在中期（第 1225–2448 轮），与英文占比高峰（43.4 %）完全吻合； 2. 三阶段演进从前

286 3 4

深语人工智能DeepNLP

|

2月前

|

人工智能 JSON 监控

|

博文

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

本文分享如何用AgentScope框架+AI Agent A2Z平台，一键完成AI Agent生产级部署：解决“开发易、上线难”痛点，快速生成标准/chat接口（如https://agentscope.aiagenta2z.com/deep_research_agent/chat），支持高并发、实时监控与冷启动。

358 5 5

阿尔的代码屋

|

2月前

|

机器学习/深度学习存储人工智能

|

博文

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理（注意力机制+位置编码），在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”（Config/Tokenizer/Model），并详解Temperature与Top_p两大生成调控参数，助你真正理解并掌控大模型推理。

722 11 11

来自：自然语言处理版块

安全风信子

|

6月前

|

机器学习/深度学习缓存 PyTorch

|

博文

131_推理加速：ONNX与TensorRT深度技术解析与LLM模型转换优化实践

在大语言模型（LLM）时代，高效的推理加速已成为部署高性能AI应用的关键挑战。随着模型规模的不断扩大（从BERT的数亿参数到GPT-4的数千亿参数），推理过程的计算成本和延迟问题日益突出。ONNX（开放神经网络交换格式）和TensorRT作为业界领先的推理优化框架，为LLM的高效部署提供了强大的技术支持。本文将深入探讨LLM推理加速的核心原理，详细讲解PyTorch模型转换为ONNX和TensorRT的完整流程，并结合2025年最新优化技术，提供可落地的代码实现与性能调优方案。

1597 4 4

安全风信子

|

6月前

|

人工智能自然语言处理数据中心

|

博文

65_GPU选择：A100 vs RTX系列

在2025年的今天，大语言模型（LLM）已经成为人工智能领域的核心技术之一。从GPT-4到Llama 3.1，从专业领域应用到消费级产品，LLM正在以前所未有的速度改变着我们的工作和生活方式。然而，这些强大模型的训练和部署背后，都离不开高性能计算硬件的支持，尤其是GPU（图形处理单元）的选择，往往直接决定了项目的可行性、效率和成本。

1113 0 1

modelscope

|

9月前

|

缓存物联网异构计算

|

博文

智谱发布新一代旗舰模型 GLM-4.5，面向推理、代码与智能体的开源SOTA模型！

7月28日晚，智谱带来新一代旗舰模型——GLM-4.5！GLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量，其中 320 亿活跃参数；GLM-4.5-Air 采用更紧凑的设计，拥有 1060 亿总参数量，其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力，以满足智能体应用的复杂需求。

1204 0 0

z4t2aola4yeei

|

9天前

|

人工智能移动开发小程序

|

博文

基于医疗行业需求开发“问诊”AI智能体，寻找有兴趣志同道合的开发合伙人

问诊智能体是面向患者的AI就医导航工具，集成“症状分析→科室推荐→多院号源比选→一键挂号支付”全流程。MVP聚焦重点城市与医院，依托高德地图、合规挂号接口及可解释推荐算法，提升就医效率。严守合规边界：不替代面诊，急危重症强制120提示。（239字）

169 1 1

modelscope

|

18天前

|

人工智能数据可视化安全

|

博文

用 OpenJudge 搭建 AI 论文审稿工作流：从评估器到在线审稿的完整实践

本文介绍基于开源评估框架OpenJudge构建的AI辅助论文审稿方案，支持PDF上传后自动生成含安全性检查、正确性分析、综合评审、严重性分级及参考文献校验的结构化报告，已上线可直接体验。

296 8 8

modelscope

|

28天前

|

机器学习/深度学习开发者内存技术

|

博文

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源！

阶跃星辰开源Step 3.5 Flash——迄今最强开源Agent基座模型，含Base/Midtrain权重及Steptron全栈训练框架，支持预训练、SFT与强化学习，专为智能体设计。已登OpenRouter榜首，获社区广泛好评。（239字）

423 22 22

1743526492487791

|

8月前

|

API

|

问答

modelscope显示每天有2000次的API免费额度，在500次的时候，就提示限流了

1650 7 0

夜雨hiyeyu.com

|

9月前

|

监控安全 NoSQL

|

博文

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签的终极落地指南，包含深度技术细节、生产环境配置、安全加固方案和全链路监控

3098 1 4

最新

文章

视频

问答

推荐

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

通义百聆语音双子星，同步开源！

通义万相Wan2.1-VACE开源！业内首个视频编辑统一模型！附推理教程

OpenClaw 注册 Moltbook 教程 让你的个人 OpenClaw Agent 加入全球最大 AI 社区

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

AgentEvolver：让智能体系统学会「自我进化」

DeepSeek三个百万token窗口对话内容三步语义分析法的整合与智能体封装

Agent Skills 究竟是什么？从玩具到工程化的必经之路

94_提示压缩：减少token消耗

InternVL3.5多模态大模型开源发布，1B-241B九种尺寸，支持跨平台GUI自动化与矢量图生成

Z-Image：冲击体验上限的下一代图像生成模型

Claude Skills的开源实现

2026年入局AI晚不晚？答案是：现在就是最好的时机

PPO与DPO：大模型对齐的两大核心算法，差异与选型全解析

大模型微调实战——从数据准备到落地部署全流程

腾讯混元 HunyuanVideo 1.5 开源！

魔搭社区模型速递（7.20-7.26）

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

Qwen3开源发布：Think Deeper, Act Faster！社区推理、部署、微调、MCP调用实战教程来啦！

MiniMax 开源新评测集：定义Coding Agent 的生产级标准

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

小红书开源发布 FireRed-Image-Edit 1.0：高质量训练数据，性能屠榜三项核心评测

[大模型实战 08 - 完结篇] 告别孤岛：拥抱 MCP 协议，为大模型打造标准“USB 接口”

Python 为何能稳居全场景开发主流语言宝座

MiniCPM-o 4.5 CookBook：9B 参数玩转多模态全双工交互

讨论下llm的prefix caching机制

小而强，GLM-4.7-Flash开源

使用PHP对接马来西亚股票市场API 实时数据、IPO和K线（Kline）的PHP对接方案

阶跃星辰开源！ Step 3 ：最新一代基础大模型 ，多模推理，极致效率

Python 学习资源精选：从入门到精通的高效清单

GLM-4.7开源！交出“生产级代码”

118_LLM模型量化与压缩：从理论到2025年实践技术详解

Meta SAM3开源：让图像分割，听懂你的话

测试工程师要失业？Magnitude：开源AI Agent驱动的端到端测试框架，让Web测试更智能，自动完善测试用例！

四款国产VLM OCR模型横评

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

B站开源IndexTTS2，用极致表现力颠覆听觉体验

零基础构建MCP服务器：TypeScript/Python双语言实战指南

三个DeepSeek百万Token窗口与一个长程项目：记忆迁移、协作特点与窗口资源利用模式分析

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

131_推理加速：ONNX与TensorRT深度技术解析与LLM模型转换优化实践

65_GPU选择：A100 vs RTX系列

智谱发布新一代旗舰模型 GLM-4.5，面向推理、代码与智能体的开源SOTA模型！

基于医疗行业需求开发“问诊”AI智能体，寻找有兴趣志同道合的开发合伙人

用 OpenJudge 搭建 AI 论文审稿工作流：从评估器到在线审稿的完整实践

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源！

modelscope显示每天有2000次的API免费额度，在500次的时候，就提示限流了

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南，包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

ModelScope模型即服务

活跃用户

相关产品

OpenClaw 注册 Moltbook 教程让你的个人 OpenClaw Agent 加入全球最大 AI 社区

阶跃星辰开源！ Step 3 ：最新一代基础大模型，多模推理，极致效率

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签的终极落地指南，包含深度技术细节、生产环境配置、安全加固方案和全链路监控