ModelScope模型即服务-推荐-第8页-阿里云开发者社区

modelscope

|

7月前

|

机器学习/深度学习数据采集人工智能

|

博文

Tongyi DeepResearch的技术报告探秘

引言阿里通义实验室悄悄（其实动静不小）发布了一个叫 Tongyi DeepResearch 的 Agent 项目。它没有开发布会，没请明星站台，甚至没发通稿——但它在 GitHub 上架当天，就登顶了“每日趋势榜”。这速度，比人类发现…

987 2 2

modelscope

|

7月前

|

机器学习/深度学习人工智能数据处理

|

博文

混元开源又+1：视频音效可以自动生成了

AI生成的视频音效，已经可以用于视频制作了。

474 18 18

modelscope

|

12月前

|

算法物联网 Swift

|

博文

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

Qwen于近日发布了Qwen3系列模型，包含了各个不同规格的Dense模型和MoE模型。开源版本中，Dense模型基本沿用了之前的模型结构，差别之处在于对于Q和K两个tensor增加了RMSNorm；MoE模型去掉了公共Expert，其他结构基本与前一致。在模型大小上，涵盖了从0.6B到32B（Dense）和235B（MoE）不同的尺寸。

1597 15 15

modelscope

|

2月前

|

存储 API 数据库

|

博文

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Zvec 是一款开源（Apache 2.0）轻量级嵌入式向量数据库，专为终端侧设计，具备开箱即用、资源可控、极致性能与完整向量能力四大优势，支持标量-向量混合查询、CRUD、崩溃恢复等生产级特性，让端侧RAG如SQLite般简单可靠。（239字）

456 7 7

游客m4p5nh4nsesoi

|

4月前

|

安全 Linux 应用服务中间件

|

博文

Linux 初学者常见 10 大误区与避坑指南

本文总结Linux初学者易犯的10大误区，涵盖误删文件、滥用root、权限混乱、路径迷失等问题，深入剖析原因并提供实用避坑方案，帮助新手建立良好操作习惯，高效安全入门Linux系统。

250 0 0

安全风信子

|

6月前

|

机器学习/深度学习存储缓存

|

博文

129_量化技术：INT8与动态量化 - 推导压缩的精度损失公式

在2025年的大语言模型(LLM)时代，随着模型规模的指数级增长，部署这些庞然大物变得越来越具有挑战性。GPT-5和Claude 3等最新模型的参数量已经达到数千亿甚至上万亿，这给计算资源和内存带来了巨大压力。模型量化作为一种有效的压缩技术，正在成为解决这一挑战的关键方案。本文将深入探讨LLM量化技术，特别是INT8和动态量化方法，推导其精度损失公式，并提供2025年最新的优化策略和实现代码。

652 4 4

安全风信子

|

6月前

|

存储边缘计算人工智能

|

博文

79_边缘设备环境：Raspberry Pi搭建

在当今人工智能快速发展的时代，大语言模型（LLM）已经成为自然语言处理领域的核心技术。然而，传统的LLM部署通常需要强大的服务器资源，这限制了其在资源受限环境中的应用。随着边缘计算的兴起，在轻量级设备上部署和运行LLM成为了新的技术趋势。树莓派（Raspberry Pi）作为一款广泛使用的单板计算机，凭借其小巧的体积、低功耗特性和不断提升的计算能力，成为了边缘部署LLM的理想选择。

870 0 0

安全风信子

|

6月前

|

缓存人工智能并行计算

|

博文

在当今快速发展的人工智能领域，大型语言模型（LLM）的应用正迅速渗透到各个行业。随着企业对AI响应速度的要求不断提高，低延迟LLM的选择与优化已成为技术团队面临的关键挑战。实时聊天机器人、智能客服、自动驾驶辅助系统等场景对响应时间提出了极高的要求，毫秒级的延迟差异可能直接影响用户体验和业务效率。2025年，随着推理优化技术的突破性进展，低延迟LLM已不再是难以企及的目标，而是成为实际生产环境中的标准配置。

473 0 0

modelscope

|

7月前

|

存储人工智能机器人

|

博文

告别 “缸中之脑”：为何 Agent Runtime 至关重要？MuleRun 如何实现突破？

TL;DR：很多 AI Agent 被困在受限且一刀切的沙箱内，而 MuleRun 是全球首个通过提供可完全自定义且持久化的 Agent Runtime 来解决这一问题的平台——即你可以定义操作系统、访问原生软件、跨会话保留状态并分配硬件资源。这让你能打造真正的“数字化工人”，而不仅仅是受限的聊天机器人。

948 9 9

modelscope

|

8月前

|

人工智能算法开发者

|

博文

开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告

762 10 10

深语人工智能DeepNLP

|

8月前

|

数据采集人工智能定位技术

|

博文

分享一个开源的MCP工具使用的AI Agent 支持常用的AI搜索/地图/金融/浏览器等工具

介绍一个开源可用的 MCP Tool Use 通用工具使用的 AI Agent (GitHub: https://github.com/AI-Agent-Hub/mcp-marketplace ，Web App https://agent.deepnlp.org/agent/mcp_tool_use，支持大模型从Open MCP Marketplace (http://deepnlp.org/store/ai-agent/mcp-server) 的1w+ 的 MCP Server的描述和 Tool Schema 里面，根据用户问题 query 和工具 Tool描述的相关性，选择出来可以满足

867 9 9

modelscope

|

9月前

|

机器学习/深度学习人工智能编解码

|

博文

智谱AI发布新版VLM开源模型GLM-4.1V-9B-Thinking，引入思考范式，性能提升8倍

视觉语言大模型（VLM）已经成为智能系统的关键基石。

1398 0 0

modelscope

|

11月前

|

机器学习/深度学习算法测试技术

|

博文

DeepSeek-R1-0528：小更新大升级

今天，DeepSeek R1 开源发布了其“小版本”升级——DeepSeek-R1-0528。

1245 23 23

蚝油菜花

|

12月前

|

人工智能算法数据可视化

|

博文

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

上海AI Lab推出的Infinite Mobility采用程序化生成技术，可高效生成22类高质量可交互物体，单个生成仅需1秒且成本低至0.01元，已应用于机器人仿真训练等领域。

739 2 2

来自：多模态版块

modelscope

|

12月前

|

机器学习/深度学习编解码人工智能

|

博文

Kimi开源MoE架构多模态推理模型，小激活参数，大能量！

最近Moonshot AI推出了 Kimi-VL，这是一个高效的开源混合专家（MoE）视觉-语言模型（VLM），它提供了先进的多模态推理、长上下文理解以及强大的代理能力——所有这些功能都只需激活其语言解码器中的2.8B参数（Kimi-VL-A3B）。

843 1 1

modelscope

|

12月前

|

机器学习/深度学习存储文字识别

|

博文

Llama 4上线魔搭社区！社区推理、微调实战教程来啦！

近期，Meta推出了Llama 4系列的首批模型： Llama 4 Scout 和 Llama 4 Maverick。

913 12 12

游客ul4n4qhqvhsfe

|

11天前

|

人工智能人机交互数据库

|

博文

三个Deepseek百万token窗口对话内容的语义学分析之一：“垂钓法”

DeepSeek百万token长上下文窗口为长程连续性工程项目提供了理想的交互容器。本研究基于三个百万token窗口、总计三百万token、四千余轮次、四百余万字的真实人机对话记录，采用语义学分析方法，对比分析三个窗口在多维度上的演化特征。研究分为三部分：第一部分（本文）采用“垂钓法”，即由研究者根据项目内容预设关键词集，统计三个窗口的词频分布，作为窗口演进的量化指标；第二部分采用“撒网法”，通过脚本工具全面统计词频，进行聚类分析与向量图谱构建；第三部分整合前两部分成果，构建RAG与知识图谱，喻为“熔炉法”。本文为第一部分报告，旨在揭示大语言模型在长程交互中的语用特征与人机协同演化规律。

117 14 14

divey

|

26天前

|

问答

《内生力量智慧集成系统》是一套专为技术人设计的“自我认知操作系统”，以系统工程思维重构个人成长：用“七力光谱”扫描内在配置，以“阻滞系数”“一致性指数”等指标动态诊断，支持从调优（1.0–2.0）到重构（3.0）、集成（4.0）乃至超越工具（5.0）的全周期演进。它不贴标签，只提供可测量、可干预、可迭代的元认知框架，助你在AI时代成为自身意识系统的架构师。（239字）

401 7 7

来自：多模态版块

modelscope

|

3月前

|

机器学习/深度学习存储人工智能

|

博文

国内首个全国产化千亿参数细粒度 MoE：开源！

TeleChat3-105B-A4.7-Thinking，国内首个全国产化千亿参数细粒度MoE大模型，开源！代码、数学、Agent等多能力比肩头部，支持高效任务拆解与代码生成。

295 2 2

modelscope

|

3月前

|

数据采集自然语言处理算法

|

博文

重塑虚实边界：智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

智元机器人发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0，基于NVIDIA Isaac Sim，实现高保真数字孪生环境，支持自然语言生成万级场景，分钟级构建与泛化。平台开源上万小时真实机器人作业数据集，覆盖200+任务，构建10万+场景评估体系，推动具身智能从研发到落地的全链路创新，助力开发者零硬件部署、高效训练与评测。

365 4 4

游客m4p5nh4nsesoi

|

4月前

|

运维监控 Python

|

博文

Python 微服务架构实践：从模块化到轻量级分布式

本文详解Python微服务落地路径：从模块化拆分、轻量框架封装，到服务通信、注册发现，再到Docker容器化部署与监控运维，系统阐述中小团队如何以低成本实现“低耦合、快迭代”的分布式架构。

370 0 0

nick7259836553-25887

|

4月前

|

SQL 分布式计算运维

|

博文

XXLJOB：超长定时任务慢节点优化实践

本文针对ODPS大宽表任务运行缓慢问题，通过定位耗时卡点、解决数据倾斜与计算堆积，提出视图落表、节点拆分、前置裁剪、中表关联等优化方案，最终将任务产出时间提前4小时以上，显著提升效率并降低回刷成本。

172 0 0

星辰归鱼

|

4月前

|

设计模式算法 Java

|

博文

Java 学习进阶书单：从基础到架构，循序渐进提升技术栈

一份涵盖Java基础、并发、JVM、算法、数据库、框架、架构等12大方向的精选书单，每本书均附精准定位与阅读建议，助力Java程序员高效进阶，少走弯路。

468 0 0

modelscope

|

4月前

|

机器学习/深度学习数据采集自然语言处理

|

博文

BOSS直聘3B超越Qwen3-32B，更多训练数据刷新小模型极限

BOSS直聘Nanbeige实验室开源Nanbeige4-3B模型，仅30亿参数却在数学、推理、代码等多领域超越320亿参数大模型。通过23万亿高质量token训练、千万级指令微调及双重蒸馏强化学习，实现小模型性能跃升，为端侧部署与低成本推理提供新范式。

702 5 6

针织衫

|

4月前

|

存储安全 Java

|

博文

认证源码分析与自定义后端认证逻辑

本文深入分析Spring Security认证流程，从UsernamePasswordAuthenticationFilter到AuthenticationManager、AbstractUserDetailsAuthenticationProvider层层源码解析，揭示认证核心机制，并结合自定义UserDetailsService实现数据库认证，完整演示认证逻辑与权限封装过程。

150 0 0

针织衫

|

4月前

|

安全数据库数据安全/隐私保护

|

博文

1.RememberMe简介及用法

RememberMe功能并非简单保存用户名密码，而是通过服务端生成令牌（Token），借助Cookie实现关闭浏览器后仍保持登录状态。勾选“记住我”后，系统在响应头设置remember-me令牌，后续请求自动携带该令牌验证身份。为提升安全性，可将Token持久化至数据库并增加二次校验机制，防止令牌泄露带来的安全风险。

169 0 0

nick6507384252

|

5月前

|

人工智能测试技术

|

博文

NeurlPS 2025！多伦多大学TIRE助力3D/4D 生成精准保留主体身份

TIRE提出“追踪-补全-重投影”三阶段方法，实现主体驱动的3D/4D生成。通过视频跟踪识别缺失区域，定制2D模型补全纹理，并重投影至3D空间，提升生成一致性与质量，推动动态场景生成新进展。

263 8 8

来自：计算机视觉版块

安全风信子

|

6月前

|

缓存监控安全

|

博文

80_离线环境搭建：无互联网LLM推理

在当今大语言模型（LLM）蓬勃发展的时代，许多组织和个人面临着一个共同的挑战：如何在无互联网连接的环境中高效部署和使用LLM？这一需求源于多方面的考量，包括数据安全、隐私保护、网络限制、极端环境作业等。2025年，随着企业对数据主权意识的增强和边缘计算的普及，离线LLM部署已成为AI应用落地的关键场景之一。

577 0 0

modelscope

|

8月前

|

编解码算法测试技术

|

博文

MiniCPM-V4.0开源，多模态能力进化，手机可用，还有最全CookBook！

今天，面壁小钢炮新一代多模态模型 MiniCPM-V 4.0 正式开源。依靠 4B 参数，取得在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩，且实现了在手机上稳定、丝滑运行。此外，官方也正式开源了推理部署工具 MiniCPM-V CookBook，帮助开发者面向不同需求、不同场景、不同设备，均可实现开箱即用的轻量、简易部署。

1087 0 0

modelscope

|

10月前

|

人工智能文字识别安全

|

博文

趣丸千音MCP首发上线魔搭社区，多重技术引擎，解锁AI语音无限可能

近日，趣丸千音（All Voice Lab）MCP正式首发上线魔搭社区。用户只需简单文本输入，即可调用视频翻译、TTS语音合成、智能变声、人声分离、多语种配音、语音转文本、字幕擦除等多项能力。

1044 32 34

modelscope

|

11月前

|

边缘计算弹性计算人工智能

|

博文

魔搭社区大模型一键部署到阿里云边缘云（ENS）

随着大模型技术的快速发展，业界的关注点正逐步从模型训练往模型推理转变。这一转变不仅反映了大模型在实际业务中的广泛应用需求，也体现了技术优化和工程化落地的趋势。

1133 7 7

modelscope

|

12月前

|

机器学习/深度学习小程序测试技术

|

博文

全新GLM模型登场：9B/32B系列模型全面开源，性能媲美顶尖选手，MIT协议商用无忧！

智谱开源 32B/9B 系列 GLM 模型，涵盖基座、推理、沉思模型，均遵循 MIT 许可协议。该系列模型现已发布魔搭社区。其中，推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型，实测推理速度可达 200 Tokens/秒。

862 3 3

modelscope

|

2月前

|

机器学习/深度学习人工智能算法

|

博文

自进化≠自我刷题，Agent 真正的突破口是「自己造环境」？——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

AI AMA首期聚焦“Agent自进化”，由魔搭等联合发起，邀请翟云鹏主持及5位顶会作者深度对谈。围绕定义、泛化能力、反馈信号、评估体系等7大议题，探讨Agent如何突破“从零开始”瓶颈，实现类人经验积累与策略优化。（239字）

246 5 5

游客2ybt27odjah3k

|

2月前

|

存储自然语言处理 Java

|

博文

OoderAgent 能力中心与能力库技术白皮书(V0.7.3)

OoderAgent平台核心由能力中心（SkillCenter）与能力库（ooder-skills）构成：前者统一管理技能生命周期、市场运营与P2P调度；后者提供40+模块化、场景驱动的多语言（Java/Node/Python）技能包，支持GitHub/Gitee一键发现安装。

152 4 4

小刘的大模型笔记

|

2月前

|

存储数据采集安全

|

博文

微调与安全隐私 —— 大模型落地的合规必修课

本文聚焦大模型微调中的安全与隐私合规风险，系统剖析数据集、训练、输出三大环节的典型隐患（如敏感信息泄露、版权侵权、模型反演等），提出“脱敏+加密+过滤”全流程防护方案，并推荐合规认证平台与实操工具，助力企业实现技术落地与法律合规双保障。（239字）

251 10 10

游客2ybt27odjah3k

|

2月前

|

人工智能自然语言处理数据可视化

|

博文

OoderAI BridgeCode 产品白皮书——全方位赋能企业编程升级

ooderAI BridgeCode 是面向企业的AI确定性代码框架解决方案，通过自学习能力生成专属代码、无缝衔接新旧系统、优化AI时代工作流，并提供128个开源可视化组件。开源无绑定、Web化易用，助力企业降本增效、灵活转型。（239字）

512 1 1

modelscope

|

3月前

|

机器学习/深度学习文字识别测试技术

|

博文

10B击败200B！阶跃星辰10B视觉语言SOTA模型开源

阶跃星辰发布开源多模态小模型Step3-VL-10B，仅10B参数却媲美百亿级大模型，在视觉感知、逻辑推理、数学竞赛等任务中达同规模SOTA，支持端侧部署，推动智能终端交互革新。

336 6 6

针织衫

|

4月前

|

SQL NoSQL 前端开发

|

博文

大厂如何解决订单幂等问题

本文介绍如何在分布式系统中实现接口幂等性，避免重复下单与ABA问题。通过预生成唯一订单号并利用数据库主键约束，防止重复创建订单；通过版本号机制，在更新时校验数据一致性，解决并发修改导致的ABA问题。结合Redis或数据库状态标记，确保支付等关键操作仅执行一次，保障系统数据正确性与用户体验。

182 0 0

游客z25ni244cd7s2

|

4月前

|

安全 Java 微服务

|

博文

SpringBoot使用汇总

本课程系统讲解Spring Boot 2.0.3核心技能，涵盖配置、MVC、持久化、安全认证、缓存等实战内容，分为基础与进阶两篇，助你快速掌握微服务开发，附真实项目架构与源码。

140 0 0

nick6507384252

|

5月前

|

机器学习/深度学习人工智能程序员

|

博文

StackOverflow已经死亡了吗

StackOverflow曾是程序员的“圣地”，但AI崛起正改变这一格局。ChatGPT等工具以高效即时的优势分流用户，使其面临流量下滑与社区文化挑战。而新兴的大模型实验室Lab4AI则融合算力、实践与协作，构建AI时代下的开发者新生态。从问答到实践，开发者社区正在进化。

356 2 2

Rigorous_默

|

6月前

|

人工智能

|

问答

676 2 2

最新

文章

视频

问答

推荐

Tongyi DeepResearch的技术报告探秘

混元开源又+1：视频音效可以自动生成了

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Linux 初学者常见 10 大误区与避坑指南

129_量化技术：INT8与动态量化 - 推导压缩的精度损失公式

79_边缘设备环境：Raspberry Pi搭建

59_实时性模型：选择低延迟LLM

告别 “缸中之脑”：为何 Agent Runtime 至关重要？MuleRun 如何实现突破？

开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告

分享一个开源的MCP工具使用的AI Agent 支持常用的AI搜索/地图/金融/浏览器等工具

智谱AI发布新版VLM开源模型GLM-4.1V-9B-Thinking，引入思考范式，性能提升8倍

DeepSeek-R1-0528：小更新大升级

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

Kimi开源MoE架构多模态推理模型，小激活参数，大能量！

Llama 4上线魔搭社区！社区推理、微调实战教程来啦！

三个Deepseek百万token窗口对话内容的语义学分析之一：“垂钓法”

模型服务部署的服务调用报错

LLaDA2.1 正式开源，可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

写了10万行代码，却毁在配色上？这套指令让后端直男秒变设计总监

工程师思维看透人心？这个“集成框架”可能颠覆了个人成长领域

国内首个全国产化千亿参数细粒度 MoE：开源！

重塑虚实边界：智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

Python 微服务架构实践：从模块化到轻量级分布式

XXLJOB：超长定时任务慢节点优化实践

Java 学习进阶书单：从基础到架构，循序渐进提升技术栈

BOSS直聘3B超越Qwen3-32B，更多训练数据刷新小模型极限

认证源码分析与自定义后端认证逻辑

1.RememberMe简介及用法

NeurlPS 2025！多伦多大学TIRE助力3D/4D 生成精准保留主体身份

80_离线环境搭建：无互联网LLM推理

MiniCPM-V4.0开源，多模态能力进化，手机可用，还有最全CookBook！

趣丸千音MCP首发上线魔搭社区，多重技术引擎，解锁AI语音无限可能

魔搭社区大模型一键部署到阿里云边缘云（ENS）

全新GLM模型登场：9B/32B系列模型全面开源，性能媲美顶尖选手，MIT协议商用无忧！

自进化≠自我刷题，Agent 真正的突破口是「自己造环境」？——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

OoderAgent 能力中心与能力库 技术白皮书(V0.7.3)

微调与安全隐私 —— 大模型落地的合规必修课

OoderAI BridgeCode 产品白皮书——全方位赋能企业编程升级

10B击败200B！阶跃星辰10B视觉语言SOTA模型开源

大厂如何解决订单幂等问题

SpringBoot使用汇总

StackOverflow已经死亡了吗

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

115_LLM基础模型架构设计：从Transformer到稀疏注意力

135_负载均衡：Redis缓存 - 提高缓存命中率的配置与最佳实践

46_LLM幻觉问题：来源与早期研究_深度解析

99_监督微调：Alpaca数据集格式与实现

91_提示注入：安全提示工程

腾讯自研 FastMTP 重磅开源：推理速度暴涨 203%，消费级显卡也能跑出无损速度翻倍！

ModelScope模型即服务

活跃用户

相关产品

OoderAgent 能力中心与能力库技术白皮书(V0.7.3)