文档备案控制台

最新

文章

视频

问答

推荐

modelscope

|

4月前

|

人工智能 API Android开发

|

博文

送给GLM Coding Plan用户和开源社区的“AI手机”

智谱推出“AI手机”新体验，通过Claude Code输入提示词，即可自动部署开源Agent模型AutoGLM。三步操作，轻松拥有专属AI设备，享受技术平权。倡导开源生态与AI协同，推动人人可用的AGI未来。

643 2 2

安全风信子

|

6月前

|

机器学习/深度学习监控 PyTorch

|

博文

126_自定义损失：多目标训练 - 设计加权损失的独特平衡策略

在2025年的大型语言模型（LLM）训练领域，多目标学习已成为提升模型综合性能的关键技术之一。传统的单一损失函数训练方法逐渐显现出局限性，尤其在处理复杂的语言理解、生成和推理任务时。多目标训练通过同时优化多个互补的学习目标，能够显著提升模型的泛化能力、知识保留和任务适应性。

343 3 3

安全风信子

|

6月前

|

边缘计算人工智能 PyTorch

|

博文

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型（LLM）的规模不断增长，部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例，其671B参数的规模即使经过INT4量化后，仍需要至少6张高端GPU才能运行，这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术，通过将大型教师模型的知识迁移到小型学生模型中，在显著降低模型复杂度的同时保留核心性能，成为解决这一问题的关键技术之一。

536 6 6

安全风信子

|

6月前

|

缓存监控安全

|

博文

80_离线环境搭建：无互联网LLM推理

在当今大语言模型（LLM）蓬勃发展的时代，许多组织和个人面临着一个共同的挑战：如何在无互联网连接的环境中高效部署和使用LLM？这一需求源于多方面的考量，包括数据安全、隐私保护、网络限制、极端环境作业等。2025年，随着企业对数据主权意识的增强和边缘计算的普及，离线LLM部署已成为AI应用落地的关键场景之一。

577 0 0

南瓜佬

|

7月前

|

Kubernetes Devops Docker

|

博文

Kubernetes 和 Docker Swarm：现代 DevOps 的理想容器编排工具

本指南深入解析 Kubernetes 与 Docker Swarm 两大主流容器编排工具，涵盖安装、架构、网络、监控等核心维度，助您根据团队能力与业务需求精准选型，把握云原生时代的技术主动权。

654 115 115

modelscope

|

7月前

|

存储人工智能机器人

|

博文

告别 “缸中之脑”：为何 Agent Runtime 至关重要？MuleRun 如何实现突破？

TL;DR：很多 AI Agent 被困在受限且一刀切的沙箱内，而 MuleRun 是全球首个通过提供可完全自定义且持久化的 Agent Runtime 来解决这一问题的平台——即你可以定义操作系统、访问原生软件、跨会话保留状态并分配硬件资源。这让你能打造真正的“数字化工人”，而不仅仅是受限的聊天机器人。

948 9 9

探索云世界

|

9月前

|

人工智能数据可视化数据处理

|

博文

10分钟，用 EvalScope 让文生图模型评估“有理有据”

AI画师们卷出新高度，人类评审却还在搬砖打分？传统文生图模型评测依赖人工标注与主观判断，周期长、成本高、易偏差。魔搭社区推出一站式模型评测框架EvalScope，支持全自动打标、多维雷达图与可视化报告，大幅提升评测效率。10分钟掌握EvalScope，轻松为文生图模型自动评分，让模型“卷”得明明白白！

719 0 0

wumingxm123

|

10月前

|

问答

如何开通dashscope服务，入口地址在哪里

225 0 0

来自：自然语言处理版块

modelscope

|

11月前

|

边缘计算弹性计算人工智能

|

博文

魔搭社区大模型一键部署到阿里云边缘云（ENS）

随着大模型技术的快速发展，业界的关注点正逐步从模型训练往模型推理转变。这一转变不仅反映了大模型在实际业务中的广泛应用需求，也体现了技术优化和工程化落地的趋势。

1133 7 7

蚝油菜花

|

12月前

|

人工智能并行计算 Linux

|

博文

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度，解决视频生成中的"遗忘"和"漂移"问题，仅需6GB显存即可在普通笔记本上实时生成高清视频。

2609 19 19

来自：多模态版块

modelscope

|

2月前

|

机器学习/深度学习并行计算算法

|

博文

LLaDA2.1 正式开源，可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

蚂蚁研究院发布LLaDA2.1，首创“可纠错编辑（ECE）”机制，突破扩散语言模型（dLLM）速度与质量瓶颈：推理达892 TPS，支持极速/质量双模式，并集成业界首个dLLM强化学习框架EBPO。开源即用，迈向真正可用的下一代大模型。

317 6 6

小刘的大模型笔记

|

2月前

|

存储安全 API

|

博文

微调与安全隐私 —— 大模型定制化过程中的风险防控指南

本文详解大模型微调中的安全隐私风险与防控策略，涵盖数据泄露、模型投毒、恶意查询等典型威胁，提出数据最小化、隐私-性能平衡、全生命周期防控三大原则，并提供脱敏处理、联邦学习、输出过滤等可落地的全流程防护方案，助力安全合规地实现模型定制化。（239字）

288 6 6

游客vd2226t73ha74

|

2月前

|

人工智能安全前端开发

|

博文

D2大会界面即推理：解读 Google A2UI 如何探索 Agent 交互新标准

Google A2UI开源项目，以声明式JSON协议让AI按需生成安全、跨平台的动态界面，破解Agent交互“最后一公里”难题。D2大会将揭秘其设计哲学、多智能体UI协作及开源路线图。

403 4 4

游客sklre6scjetw4

|

4月前

|

NoSQL Linux Shell

|

博文

2-MongoDB单机部署

本文档介绍MongoDB在Windows和Linux系统中的安装、配置与启动方法，包括下载地址、版本选择、命令行及配置文件启动方式，Shell连接、图形化工具Compass使用，并提供各环境安装包下载链接。

142 0 0

huizhudev

|

4月前

|

SQL 人工智能数据库

|

博文

你的数据库不是性能差，是你的SQL在“烧钱”：用这条指令让AI化身资深DBA

硬件升配解决不了烂SQL！本文提供一套经过验证的AI指令，将大模型转化为资深DBA，通过深度诊断、索引优化和执行计划分析，帮助开发者从根源解决慢查询问题，实现数据库性能的降本增效。

378 19 21

游客ens5uln3eivay

|

4月前

|

缓存 Java 关系型数据库

|

博文

微服务原理篇(XXLJOB-幂等-MySQL)

本课程深入讲解微服务架构下的任务调度与数据一致性方案，涵盖XXL-JOB分布式调度原理、幂等性设计、MySQL存储引擎对比、索引优化及SQL调优策略。通过实战掌握热点数据缓存预热、分片广播任务处理、避免重复执行等核心技能，提升系统性能与可靠性。（238字）

276 0 0

modelscope

|

4月前

|

数据采集存储编解码

|

博文

智源RoboCOIN重磅开源！全球本体数最多、标注最精细、使用最便捷的高质量双臂机器人真机数据集来了

北京智源研究院联合多家机构发布全球首个“本体数最多、标注最精细、使用最便捷”的双臂机器人真机数据集RoboCOIN，覆盖15类机器人、18万条轨迹、421项任务，首创“层级能力金字塔”标注体系，推动具身智能迈向真实场景应用。

581 11 11

nick6507384252

|

5月前

|

机器学习/深度学习人工智能程序员

|

博文

StackOverflow已经死亡了吗

StackOverflow曾是程序员的“圣地”，但AI崛起正改变这一格局。ChatGPT等工具以高效即时的优势分流用户，使其面临流量下滑与社区文化挑战。而新兴的大模型实验室Lab4AI则融合算力、实践与协作，构建AI时代下的开发者新生态。从问答到实践，开发者社区正在进化。

356 2 2

modelscope

|

5月前

|

机器学习/深度学习编解码 JSON

|

博文

混元OCR模型宣布开源，参数仅1B，多项核心能力SOTA

腾讯混元推出全新开源OCR模型HunyuanOCR，仅1B参数，基于原生多模态架构，实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越，支持14种小语种翻译，广泛适用于票据抽取、视频字幕识别等应用，多项指标达业界SOTA水平。

745 8 8

游客ak35f7cs4gw4c

|

5月前

|

Apache 自然语言处理

|

问答

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

255 0 0

来自：多模态版块

安全风信子

|

6月前

|

存储机器学习/深度学习 PyTorch

|

博文

119_LLM训练的高效内存管理与优化技术：从ZeRO到Flash Attention

大型语言模型（LLM）的训练面临着前所未有的计算和内存挑战。随着模型规模达到数百亿甚至数千亿参数，高效的内存管理成为训练成功的关键因素之一。2025年，LLM训练的内存优化技术已经取得了显著进展，从ZeRO优化器到Flash Attention等创新技术，为训练超大规模模型提供了可能。

702 159 159

安全风信子

|

6月前

|

机器学习/深度学习存储缓存

|

博文

115_LLM基础模型架构设计：从Transformer到稀疏注意力

大型语言模型（LLM）的架构设计是其性能的核心决定因素。从2017年Transformer架构的提出，到如今的稀疏注意力和混合专家模型，LLM架构经历了快速的演进。本文将全面探讨LLM基础架构的设计原理，深入分析Transformer的核心机制，详细介绍稀疏注意力、MoE等创新架构，并展望未来架构发展方向。通过数学推导和实践案例，为构建高效、强大的LLM提供全面指导。

937 0 0

安全风信子

|

6月前

|

Kubernetes Cloud Native 异构计算

|

博文

133_云端扩展：Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

在大语言模型（LLM）部署的时代，如何高效地管理计算资源、应对动态负载并优化成本，成为了每个AI工程师必须面对的挑战。随着LLM应用的普及，用户请求模式变得日益复杂且难以预测，传统的静态资源配置方式已无法满足需求。Kubernetes作为云原生时代的容器编排平台，其强大的自动扩展能力为LLM部署提供了理想的解决方案。

443 2 2

安全风信子

|

6月前

|

存储监控安全

|

博文

132_API部署：FastAPI与现代安全架构深度解析与LLM服务化最佳实践

在大语言模型(LLM)部署的最后一公里，API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长，如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一，凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力，已成为LLM服务化部署的首选方案。

1089 3 3

modelscope

|

7月前

|

缓存自然语言处理并行计算

|

博文

腾讯自研 FastMTP 重磅开源：推理速度暴涨 203%，消费级显卡也能跑出无损速度翻倍！

腾讯自研 FastMTP 重磅开源：推理速度暴涨 203%，消费级显卡也能跑出无损速度翻倍！

676 2 2

游客nzamowglvshz6

|

7月前

|

问答

模型服务里免费部署的模型休眠了怎么激活

294 1 0

modelscope

|

8月前

|

测试技术 Swift 开发者

|

博文

可调节推理预算，字节Seed团队开源大型语言模型 Seed-OSS 系列！

字节跳动 Seed 团队正式发布了 Seed-OSS 系列开源大型语言模型，提供强大的长上下文、推理、代理和通用功能，以及对开发者友好的多功能特性。

846 9 9

aliyun9382614085-25417

|

8月前

|

机器人人工智能

|

问答

为什么我在钉钉里面创建的机器人无法对我的问题进行回答？

232 0 0

modelscope

|

8月前

|

传感器人工智能自然语言处理

|

博文

魔搭社区模型速递（7.26-8.2）

🙋魔搭ModelScope本期社区进展：1498个模型，130个数据集，85个创新应用， 7 篇内容

818 0 0

modelscope

|

9月前

|

机器学习/深度学习人工智能安全

|

博文

AI 真会编程还是只会“背题” | Code Bench 专场直播带你洞悉代码能力的真实象限

AI 编程助手已成为开发者不可或缺的伙伴，但一个核心问题也随之而来：我们该如何衡量它们真正的代码实力？现有 Benchmark（基准测试）正面临严峻挑战——数据污染、测试用例不足等问题频出，导致模型排

463 2 2

飞询聊AI

|

10月前

|

人工智能并行计算数据可视化

|

博文

ms-swift 微调 internlm3-8b-instruct（论文分类任务）

本文介绍了使用InternLM系列模型进行论文分类任务的微调全过程，包括环境配置、数据准备、预训练与SFT（监督微调）、权重合并、模型评测及上传至魔搭社区等步骤。使用ms-swift框架和Lora训练方法，在具备40GB显存的A100 GPU环境下完成训练，并通过Swift工具进行效果评估。

1050 5 6

modelscope

|

11月前

|

人工智能数据可视化物联网

|

博文

Reasoning模型蒸馏实践：用大模型提升小模型能力

DeepSeek-R1的爆火让更多开发者注意到模型蒸馏技术——这种让小模型也能"开小灶"习得大模型知识精华的秘诀。今天我们就用Qwen2.5-1.5B小模型（相当于AI界的初中生）来进行实践！

922 5 5

蚝油菜花

|

12月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

用AI精准定位问题代码，调试时间直接砍半！LocAgent：斯坦福开源代码调试神器，多跳推理锁定问题代码

LocAgent是由斯坦福大学、耶鲁大学等顶尖机构联合开发的代码定位框架，通过将代码库转化为图结构并利用大语言模型的多跳推理能力，实现精准的问题代码定位。

1140 1 1

来自：自然语言处理版块

divey

|

26天前

|

问答

模型服务部署的服务调用报错

162 0 0

huizhudev

|

2月前

|

人工智能自然语言处理前端开发

|

博文

写了10万行代码，却毁在配色上？这套指令让后端直男秒变设计总监

这是一篇专为后端及全栈开发者定制的实用指南，旨在解决开发者“代码强但审美弱”的痛点。文章提供了一套核心AI指令，能将DeepSeek等AI变成专业UI设计顾问，快速生成符合大厂规范（Design Token）的配色体系。通过一个后台管理系统的实战案例，演示了如何用AI将“土味”界面瞬间升级为专业级UI，让开发者无需学习设计理论也能搞定高颜值配色。

299 4 4

modelscope

|

3月前

|

机器学习/深度学习存储人工智能

|

博文

国内首个全国产化千亿参数细粒度 MoE：开源！

TeleChat3-105B-A4.7-Thinking，国内首个全国产化千亿参数细粒度MoE大模型，开源！代码、数学、Agent等多能力比肩头部，支持高效任务拆解与代码生成。

295 2 2

huizhudev

|

3月前

|

人工智能机器人程序员

|

博文

去年我用一张Excel表"规划"学习，结果把自己逼进了ICU——直到我学会让AI帮我排兵布阵

本文以作者因"完美计划表"累倒入院的亲身经历切入，分享了一套让AI担任私人学习规划师的完整指令模板。通过"目标拆解""遗忘曲线复习""弹性时间"三大机制，解决目标模糊、复习逃避、计划崩溃等常见学习痛点，并提供上班族、学生、转行者三种典型场景的实战案例。

436 18 18

星辰归鱼

|

4月前

|

存储 Linux 编译器

|

博文

C 语言学习资源精选：从入门到精通的高效资源清单

本文为C语言学习者提供从入门到精通的完整资源指南，涵盖各阶段的优质视频、书籍、博客、项目及工具，助你高效掌握C语言核心技能，轻松进阶嵌入式与底层开发。

240 0 0

星辰归鱼

|

4月前

|

运维监控 Python

|

博文

Python 微服务架构实践：从模块化到轻量级分布式

本文系统讲解Python微服务落地路径：从模块化拆分、轻量框架封装，到服务通信、注册发现，再到Docker容器化部署与Prometheus监控，全方位呈现中小团队低成本构建分布式架构的实践方案。

164 0 0

安全风信子

|

6月前

|

PyTorch 算法框架/工具异构计算

|

博文

75_TPU集成：Google Cloud加速

在大型语言模型(LLM)训练和推理的竞赛中，计算硬件的选择直接决定了研发效率和成本。Google的Tensor Processing Unit(TPU)作为专为AI计算设计的专用芯片，正逐渐成为大规模LLM开发的首选平台之一。随着2025年第七代TPU架构Ironwood的发布，Google在AI计算领域再次确立了技术领先地位。

1482 0 0

安全风信子

|

6月前

|

机器学习/深度学习人工智能算法

|

博文

62_模型融合：ensemble LLM技巧

在2025年的AI生态中，大语言模型(LLM)已成为技术创新的核心引擎，但单一模型在面对复杂任务时往往表现出局限性。不同模型由于训练数据、架构设计和优化目标的差异，在各领域展现出独特优势：模型A可能擅长逻辑推理，模型B在创意写作上更出色，而模型C则在事实性问答中准确率更高。

340 0 0

安全风信子

|

6月前

|

机器学习/深度学习 PyTorch TensorFlow

|

博文

66_框架选择：PyTorch vs TensorFlow

在2025年的大语言模型（LLM）开发领域，框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂，选择一个既适合研究探索又能支持高效部署的框架变得尤为重要。PyTorch和TensorFlow作为目前市场上最主流的两大深度学习框架，各自拥有独特的优势和生态系统，也因此成为开发者面临的经典选择难题。

1215 0 0

安全风信子

|

6月前

|

人工智能监控安全

|

博文

91_提示注入：安全提示工程

随着大型语言模型（LLM）技术的快速发展和广泛应用，AI系统正以前所未有的方式改变着我们的工作和生活。然而，这种强大的技术也带来了新的安全挑战，其中提示注入（Prompt Injection）攻击已成为最具威胁性的安全问题之一。提示注入攻击通过精心构造的输入，操纵或欺骗AI系统执行非预期行为，可能导致数据泄露、权限绕过、输出不当内容等严重后果

961 0 0

modelscope

|

7月前

|

算法测试技术决策智能

|

博文

美团开源发布 LongCat-Flash-Chat：专为高效智能体任务设计，推理速度超100 tokens/s

9月1日，美团正式发布 LongCat-Flash-Chat，并同步开源。LongCat-Flash 采用创新性混合专家模型（Mixture-of-Experts, MoE）架构，总参数 560 B，激活参数 18.6B~31.3B（平均 27B），实现了计算效率与性能的双重优化。

514 1 1

modelscope

|

8月前

|

编解码人工智能小程序

|

博文

魔搭社区模型速递（8.17-8.23）

🙋魔搭ModelScope本期社区进展：📟1652个模型，📁216个数据集，🎨54个创新应用，📄 4篇内容

839 8 8

modelscope

|

10月前

|

自然语言处理数据可视化测试技术

|

博文

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

956 20 21

蚝油菜花

|

12月前

|

机器学习/深度学习人工智能算法

|

博文

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头

小米开源的MiMo推理大模型通过联动预训练与强化学习算法，在7B参数规模下实现数学推理与代码生成能力的突破性提升，技术报告显示其性能超越部分32B级模型。

1664 74 76

来自：自然语言处理版块

蚝油菜花

|

12月前

|

机器学习/深度学习人工智能算法

|

博文

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

RAGEN是一个基于StarPO框架的开源强化学习系统，通过马尔可夫决策过程形式化Agent与环境的交互，支持PPO、GRPO等多种优化算法，显著提升多轮推理训练的稳定性。

1447 5 5

来自：多模态版块

蚝油菜花

|

12月前

|

人工智能算法 API

|

博文

多模态模型卷王诞生！InternVL3：上海AI Lab开源78B多模态大模型，支持图文视频全解析！

上海人工智能实验室开源的InternVL3系列多模态大语言模型，通过原生多模态预训练方法实现文本、图像、视频的统一处理，支持从1B到78B共7种参数规模。

1612 6 6

来自：多模态版块

蚝油菜花

|

12月前

|

人工智能编解码物联网

|

博文

设计师集体破防！UNO：字节跳动创新AI图像生成框架，多个参考主体同框生成，位置/材质/光影完美对齐

UNO是字节跳动开发的AI图像生成框架，通过渐进式跨模态对齐和通用旋转位置嵌入技术，解决了多主体场景下的生成一致性问题。该框架支持单主体特征保持与多主体组合生成，在虚拟试穿、产品设计等领域展现强大泛化能力。

782 4 4

来自：多模态版块

1

...

8

9

10

...

21

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

0

今日

15213

内容

6

活动

4107

关注

你好！

登录掌握更多精彩内容

账号登录

活跃用户

游客seedivk5g3gek

给您推荐最划算最便宜的阿里云产品 https://www.aliyun.com/activity?userCode=m4a0ywsh

分享编程故事~

游客du7h357f5ns6g

相关产品

人工智能平台 PAI

文档详情产品详情

文字识别

文档详情产品详情

智能语音交互

文档详情产品详情