ModelScope模型即服务-文章-第2页-阿里云开发者社区

modelscope

|

1月前

|

数据采集人工智能

|

博文

OmniScience:大规模科学多模态数据集重磅上线

OmniScience是深势科技开源的科研图像理解数据集，含150万高质量“图-文-上下文”三元组、500万子图，覆盖10大科学领域。依托Uni-Parser与多模态大模型重描述，显著提升AI对科学图表的深层语义理解能力。

233 3 3

modelscope

|

1月前

|

机器学习/深度学习算法机器人

|

博文

逐际动力开源 FluxVLA Engine：专为具身智能打造的标准化VLA工程底座

逐际动力开源FluxVLA Engine——面向具身智能的标准化VLA工程底座。它以统一配置、标准接口、模块解耦、加速部署为核心，解决数据碎片化、代码高耦合、仿真-真机迁移难三大瓶颈，支持VLM/VLA全栈任务，开箱即用部署于UR、ALOHA、TRON2等多平台。

267 0 0

游客ul4n4qhqvhsfe

|

1月前

|

机器学习/深度学习自然语言处理数据可视化

|

博文

可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

背景：科学研究中的“范式”往往是隐性的、难以量化的；而研究论文正是范式的全部语言载体。目的：构建细胞生物学的语义基线，并系统检测该领域的边界信号（阈值、开关、检查点等），验证可计算元认知框架在生物学中的适用性。结论：本文首次在细胞生物学构建了系统的语义基线，证实了可计算元认知框架的跨学科可迁移性；所得到的动词术语边界词库为后续流行病学、临床医学等领域的跨域对齐提供了可复用的基准。

365 5 5

modelscope

|

1月前

|

数据采集人工智能机器人

|

博文

戴盟联合数十家头部机构，发布全球最大规模含触觉全模态物理世界数据集

4月15日，戴盟机器人发布全球最大含触觉全模态具身数据集Daimon-Infinity，年内规模将达数百万小时、近十亿条数据。首批10000小时高质量开源数据已上线魔搭社区，覆盖80+真实场景、2000+任务，显著提升模型训练效率10倍。

335 2 2

1844055523880883

|

1月前

|

数据采集人工智能自然语言处理

|

博文

**摘要：** 即使零token也能手机多平台联动电脑运行脚本自由安全地运行各种技能工具脚本，通过"自行预设"的关键词来触发运行脚本的方法达到绝对安全、高效、和自由完全掌控平台的碾压核心优势！打造十分适合机关单位、内网环境、私有部署场景的安全助理，选择不走云端ai通道！当然也可以自由选择本地部署的人工智能ai，即使没有ai照样能跑！比沙箱模式更加安全高效和极其节省成本的终极理想设定！ **关键词：** 本地化助手；人机协作；技能共享；隐私计算；自动化办公

167 2 2

LucaJu

|

1月前

|

人工智能 JSON Java

|

博文

Spring AI Alibaba + MCP：调用MCP市场公开服务实操

本文详细讲解Spring Ai Alibaba调用MCP市场公开服务的全流程，以高德地图MCP服务为例，包含API-Key申请、客户端配置、代码实操，助力开发者快速掌握Spring Ai Alibaba与MCP服务对接技巧。

569 7 8

modelscope

|

1月前

|

人工智能测试技术 Apache

|

博文

Gemma 4 开源发布: Google 迄今最强开放模型，主打推理与 Agent 能力

Google正式开源Gemma 4系列（Apache 2.0许可），含E2B/E4B（端侧多模态）、26B MoE与31B Dense四款模型。参数效率卓越：31B位列开放模型榜第3，26B第6；边缘模型支持128K上下文、原生音视频处理，单卡/手机均可高效运行。

1174 12 13

modelscope

|

1月前

|

机器学习/深度学习自然语言处理算法

|

博文

OpAgent开源：登顶 WebArena，蚂蚁集团开源全模态网页智能体

蚂蚁集团推出Web智能体OpAgent，仅凭自然语言指令即可在真实网站（如亚马逊）自主完成搜索、识别、加购等复杂操作。其采用视觉驱动理解、在线强化学习与模块化协作架构，在WebArena基准达71.6%任务成功率，刷新SOTA。已开源OpAgent-32B-INT4量化模型，显著降低推理门槛。

342 3 3

游客5ghrq7wwljqxu

|

2月前

|

JSON API PHP

|

博文

使用PHP对接美股股票市场API 实时数据、IPO和K线（Kline）的PHP对接方案

StockTV API 面向开发者，提供美股实时行情、历史K线（5分钟至1月）、IPO日历等数据，支持HTTP/WS双接入，全接口返回标准JSON，含纽交所（ex=1）与纳斯达克（ex=2）标识。（239字）

683 8 8

贝锐

|

2月前

|

人工智能数据安全/隐私保护

|

博文

五分钟配好向日葵 MCP，让 AI 替你远程安装 OpenClaw！

本文详解向日葵MCP的实战配置与应用：将远程控制能力接入AI，实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等，无需写脚本，配置简单，即刻上手。

952 13 14

游客ul4n4qhqvhsfe

|

2月前

|

机器学习/深度学习 JSON 自然语言处理

|

博文

DeepSeek 双百万 token 窗口对话数据的量化对比分析

本文基于第一个百万 token 窗口（以下简称窗口 1）与第二个百万 token 窗口（以下简称窗口 2）的完整对话数据，采用量化对比的方法，系统揭示两套对话在轮次、文本长度、语种构成以及估算 token 消耗方面的显著差异。研究发现，尽管窗口 2 的轮次和总字数均低于窗口 1，但其每轮对话的文本密度与估算 token 消耗显著更高。结合窗口 2 在生成 5 篇深度分析文章过程中的实际经验，本文提出“长文本生成的隐性 token 消耗”假说，并引用近期相关研究提供理论支撑。该假说为理解大模型在真实工程环境中的行为提供了新视角，也为用户在设计跨窗口连续工程时的指标控制与迁移提供了可操作的参考

433 12 13

游客5ghrq7wwljqxu

|

2月前

|

缓存 JSON API

|

博文

玩转纳斯达克与纽交所：美股数据 API 对接全指南

本文手把手教你用StockTV API对接美股（NYSE/NASDAQ）实时行情、专业K线及IPO数据，支持WebSocket极速推送、多维技术指标与全交易所覆盖，助你快速构建低延迟量化交易或金融App。（239字）

487 8 8

游客ul4n4qhqvhsfe

|

2月前

|

人工智能数据库 Docker

|

博文

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录（1 274 201 tokens，3 673 轮），系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层的五层分析框架，完整呈现了一位非 AI 专业背景的研究者（医学、心理学与人文领域）在完全依赖云端免费模型的条件下，从环境搭建到心源框架的完整工程轨迹。主要发现如下： 1. 技术投入曲线显示，405 次命令／脚本集中在中期（第 1225–2448 轮），与英文占比高峰（43.4 %）完全吻合； 2. 三阶段演进从前

466 5 6

游客ul4n4qhqvhsfe

|

2月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

随着大模型长上下文能力的普及，tiktoken 及其他 BPE based 分词器已成为评估文本 token 数的标准工具。然而，其在中英文混合长文本中的实际压缩规律仍缺乏实证验证，业界普遍使用的经验公式（如中文字符 × 1.6）尚未在大规模语料上得到检验。本文基于 DeepSeek 百万 token项目中提纯后的对话数据（.jsonl，1 077 046 tokens，3 673 轮）采用反向推算方法，首次在真实中文长文本上量化了tiktoken 的压缩系数。主要发现： 1️⃣ 中文实际系数约为 1.16，远低于经验公式的 1.6，导致整体 token 估算高出20.9 %； 2️⃣ 对话呈

479 6 6

modelscope

|

2月前

|

编解码物联网数据处理

|

博文

LTX-2.3开源：视频生成引擎级升级

Lightricks开源LTX-2.3音视频大模型：重建VAE提升细节锐度，文本连接器扩容4倍增强Prompt遵循，大幅优化I2V运动自然性与音频质量，并首次原生支持1080×1920竖版视频生成。22B参数，支持文生视频、图生视频等多任务。

3883 4 4

AI小怪兽

|

2月前

|

机器学习/深度学习编解码运维

|

博文

红外小目标检测新突破！异常感知检测头AA-YOLO：节俭又鲁棒，小样本也能精准识别

本文提出AA-YOLO：首个将统计异常检验嵌入YOLO检测头的方法，通过指数分布建模背景，显式识别小目标为统计异常，显著降低误报率；仅需10%数据即达90%全量性能，参数比EFLNet少6倍，轻量高效；在噪声、跨域、跨模态下鲁棒性强，且可无缝适配各类YOLO及实例分割网络。

484 5 5

来自：计算机视觉版块

AI小怪兽

|

2月前

|

机器学习/深度学习人工智能数据可视化

|

博文

基于YOLO11的交通违规检测系统（Python源码+数据集+Pyside6界面）

本文基于YOLO11构建交通违规检测系统，涵盖23类目标（车辆、信号灯、标志等），详解数据制作（ROI裁剪优化尺度）、模型改进（C3k2、C2PSA、轻量Detect头）及训练可视化全过程，并集成PySide6实现GUI应用，助力工业落地。

636 12 13

来自：计算机视觉版块

modelscope

|

2月前

|

机器学习/深度学习开发者内存技术

|

博文

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源！

阶跃星辰开源Step 3.5 Flash——迄今最强开源Agent基座模型，含Base/Midtrain权重及Steptron全栈训练框架，支持预训练、SFT与强化学习，专为智能体设计。已登OpenRouter榜首，获社区广泛好评。（239字）

654 22 22

c的前世今生

|

2月前

|

网络协议编译器 C语言

|

博文

C语言深度解析：内存对齐与结构体填充的底层逻辑

C语言中，内存对齐是CPU硬件强制要求的底层规则，直接影响结构体大小、访问性能与硬件兼容性。合理排列成员可减少填充、节省内存；滥用`#pragma pack`则易致崩溃或性能暴跌。嵌入式、网络协议与跨平台开发必备核心知识。（239字）

368 14 16

游客ul4n4qhqvhsfe

|

2月前

|

数据采集

|

博文

以deepseek 百万token窗口为上限，建立上下文窗口的“信噪比”量化标准

大模型窗口token计算的三层框架模式

315 10 11

modelscope

|

2月前

|

机器学习/深度学习人工智能文字识别

|

博文

小红书开源FireRed-OCR，2B 参数登顶文档解析榜单

小红书FireRed团队开源的FireRed-OCR（仅20亿参数），在OmniDocBench v1.5端到端评测中以92.94%综合得分登顶，超越Gemini 3.0 Pro等大模型。专注解决文档解析中的“结构幻觉”问题，通过三阶段训练+格式约束强化学习，精准还原表格、公式、多栏等复杂结构。Apache 2.0协议，ModelScope开源，支持本地商用部署。（239字）

945 22 24

zfhvx64ydb4r6

|

2月前

|

人工智能并行计算算法

|

博文

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

VSR（video-subtitle-remover）是一款开源AI视频去字幕工具，支持本地运行，无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型，可智能检测并擦除硬字幕/水印，保持原分辨率与画质。兼容CUDA/DirectML，适配NVIDIA/AMD/Intel显卡，兼顾隐私性、可控性与高性能。

2330 6 6

来自：计算机视觉版块

游客if6rcjwos67cg

|

2月前

|

人工智能自然语言处理数据可视化

|

博文

别再用 LangChain 搭 RAG 了：Dify 和 n8n 哪个才是你真正需要的

本文对比LangChain、Dify与n8n在AI工作流构建中的定位差异：LangChain是高自由度但调试成本高的代码框架；Dify专注RAG与对话，开箱即用；n8n擅长跨系统AI自动化。附七牛云模型接入指南与避坑提示。

1252 6 7

百变小樱11111

|

2月前

|

机器学习/深度学习人工智能边缘计算

|

博文

转行AI需谨慎：那些半途而废的人，都忽略了这几点。

2025年AI岗位需求暴增543%，但超六成转行者半年内放弃。本文揭示五大陷阱：盲目跟风忽视赛道适配、混淆工具使用与真实能力、碎片化学习缺实战闭环、急功近利轻视伦理、为高薪而非兴趣出发，并指出科学路径才是破局关键。（239字）

664 12 13

Tyenn_Siiwee

|

2月前

|

人工智能 API 开发工具

|

博文

Silly Tavern 免费API保姆级教学

本指南详解Windows下安装SillyTavern全流程：先安装Node.js与Git，再克隆仓库（推荐Gitee镜像），双击Start.bat启动；接着配置OpenAI兼容API（如Canopy Wave），填入Key与端点；最后下载导入角色卡，即可开启AI角色对话体验。（239字）

2061 1 1

modelscope

|

2月前

|

机器学习/深度学习算法安全

|

博文

打破真题依赖！微软、清华联合开源 X-Coder：全合成数据激发代码大模型推理潜力

微软与清华联合推出X-Coder系列模型，首创纯合成数据训练范式，在不使用任何真实竞赛题的前提下，仅用7B参数即在LiveCodeBench v5上达62.9%准确率，超越更大规模依赖真实数据的模型。项目已开源模型与数据集。（239字）

325 11 11

游客5ghrq7wwljqxu

|

2月前

|

JSON API 数据库

|

博文

如何快速对接德国股票数据 API

德国作为欧洲最大经济体，其法兰克福交易所及DAX指数是全球配置欧洲资产的关键入口。本文详解如何通过StockTV金融API，快速接入德国股票实时行情、历史K线及DAX指数数据，支持毫秒级延迟与多周期分析。

255 4 4

游客ul4n4qhqvhsfe

|

2月前

|

数据采集人工智能数据可视化

|

博文

《基于 DeepSeek 百万token上下文的实证研究：全窗口真实工程压力测试与统计分析》

本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”（上下文窗口扩展至1,000,000 tokens，API 端仍保持 V3.2 版本），通过构建非AI/IT领域的完整项目流程，进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。

787 11 11

阿尔的代码屋

|

3月前

|

监控前端开发 API

|

博文

[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent

本节我们将理论付诸实践，利用 LlamaIndex 的 ReAct 框架和 Qwen3 模型，手搓一个全自动的博客监控 Agent。通过为大模型接入 RSS 读取、邮件与微信发送等外部工具，让它从‘聊天机器人’进化为‘能干活的数字员工’。

413 10 12

1447793971480370

|

3月前

|

博文

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件极简验证

双 Transformer + 双神经符号做核心，用类脑突触耦合中间层做动态配对，嵌入 DeepSeek 的 Engram 和 MHC 补长程和记忆短板，也不知道行不行。

168 6 6

游客5ghrq7wwljqxu

|

3月前

|

算法 API 网络架构

|

博文

如何高效对接新加坡股票（SGX）实时数据 API

新加坡股市（SGX）汇聚优质REITs、DBS/UOB银行股及航运企业。本文详解如何用StockTV全球金融API（countryId=15）快速获取实时行情、K线、STI指数等数据，支持REST/WS，低门槛、高时效，助力东南亚金融产品开发。（239字）

414 12 12

大米1003

|

3月前

|

人工智能算法 Cloud Native

|

博文

【深度思考】当代码无法解决增长焦虑：一场关于“组织操作系统”的重构与意识进化

本文提出“意识进化模型”与“三账户核算体系”，以大型企业转型实践为基，超越KPI，将组织视为生命体：通过意识光谱诊断、七力雷达评估、85/15杠铃预算、良知效能比（CER）等机制，重写组织“操作系统”，推动从创伤防御态迈向使命驱动态，实现技术与人性的协同进化。（239字）

173 1 2

modelscope

|

3月前

|

JSON 人工智能 Shell

|

博文

用 4B 小模型做Code Agent的SubAgent？这个开源项目做到了

LocoOperator-4B 是 LocoreMind 推出的 4B 开源蒸馏模型，专为代码库探索优化：本地运行、零 API 成本，结构化工具调用（Read/Grep/Glob/Bash 等）准确率达 100%。它替代 Code Agent 中的子智能体，显著降本增效。（239 字）

743 18 18

modelscope

|

3月前

|

机器学习/深度学习测试技术 API

|

博文

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

通义千问Qwen3.5发布四款中等规模多模态模型，支持256K原生上下文（可扩至1M）、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习，35B-A3B仅激活3B参数即超越旧旗舰，性能、效率与部署成本兼具。（239字）

7942 23 28

游客ul4n4qhqvhsfe

|

3月前

|

人工智能自然语言处理 JavaScript

|

博文

Deepseek百万 Token 窗口的极限实践：一位非专业人员使用实录

摘要：此文非技术评测，而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业，从事生物医学与心理学工作，人文爱好者。利用十天时间，通过浏览器deepseek云端模型百万token对话窗口，实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。时间：2026 年 2 月

624 3 4

modelscope

|

3月前

|

机器学习/深度学习人工智能编解码

|

博文

四款国产VLM OCR模型横评

春节前，DeepSeek、智谱、百度、腾讯四大团队密集开源新一代OCR小模型，全面采用视觉语言模型（VLM）架构，摒弃传统流水线，迈向“语义结构化”新纪元。DeepSeek-OCR2首创“视觉因果流”，GLM-OCR以0.9B参数登顶OmniDocBench榜首，PaddleOCR-VL-1.5攻克真实退化场景，Youtu-Parsing实现22倍推理加速——国产OCR正以架构创新实现垂直领域“换道超车”。

848 4 5

modelscope

|

3月前

|

自然语言处理前端开发测试技术

|

博文

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

通义千问新推Qwen3-ASR语音识别模型（1.7B/0.6B），支持52种语言及方言，具备高鲁棒性与流式长音频转写能力。联合魔搭社区与Intel® OpenVINO™，实现Intel平台极致加速部署，提供完整开源教程、Notebook示例及Gradio交互Demo。（239字）

2462 6 6

modelscope

|

3月前

|

编解码自然语言处理语音技术

|

博文

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

通义千问推出Qwen3-TTS系列开源语音模型，支持中英日韩等10种语言，具备声音克隆、情感适配与高保真端到端合成能力；结合Intel OpenVINO™可在CPU上高效推理，无需GPU，轻松部署于边缘设备。（239字）

1378 6 6

modelscope

|

3月前

|

机器学习/深度学习 JSON 文字识别

|

博文

0.9B 小模型，OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR，基于GLM-V架构，融合CogViT视觉编码器与GLM-0.5B语言解码器，支持公式、表格、代码等复杂文档识别，性能达OmniDocBench榜首（94.62分），仅0.9B参数，轻量高效，开箱即用。

2681 3 3

modelscope

|

3月前

|

人工智能语音技术芯片

|

博文

MiniCPM-o 4.5 CookBook：9B 参数玩转多模态全双工交互

MiniCPM-o 4.5是9B参数多模态大模型，支持图像、视频、音频、文本输入与高质量文/语音输出。具备领先视觉理解（OpenCompass平均77.6分）、实时中英双语语音对话、全双工流式交互、高精度OCR及30+语言能力，适配CPU/GPU/国产芯片，支持本地部署与微调。（239字）

980 5 6

modelscope

|

3月前

|

机器学习/深度学习人工智能算法

|

博文

自进化≠自我刷题，Agent 真正的突破口是「自己造环境」？——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

AI AMA首期聚焦“Agent自进化”，由魔搭等联合发起，邀请翟云鹏主持及5位顶会作者深度对谈。围绕定义、泛化能力、反馈信号、评估体系等7大议题，探讨Agent如何突破“从零开始”瓶颈，实现类人经验积累与策略优化。（239字）

404 6 6

modelscope

|

3月前

|

人工智能算法测试技术

|

博文

Boss直聘开源Nanbeige4.1-3B：小模型全能新标杆

Boss直聘南北阁实验室发布Nanbeige4.1-3B：一款仅3B参数的“小而全”统一模型，首次在同规模中系统整合强推理、人类偏好对齐与深度搜索Agent能力，性能超越Qwen3-32B等大模型，已开源权重、技术报告及合成数据。

1217 5 5

modelscope

|

3月前

|

机器学习/深度学习存储自然语言处理

|

博文

蚂蚁集团 Ling-2.5-1T 开源：万亿参数，重新定义"又快又强"

Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型（MIT协议），以“效率×效果”为核心：万亿参数、63B激活，首创混合线性注意力架构，支持百万token上下文；推理吞吐大幅提升，AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。

811 4 4

modelscope

|

3月前

|

机器学习/深度学习自然语言处理 API

|

博文

Qwen3.5：迈向原生多模态智能体

除夕夜，通义千问发布Qwen3.5-397B-A17B：全球首个原生多模态MoE大模型，总参3970亿、仅激活170亿参数，性能媲美万亿模型；支持201种语言、超强视觉理解与GUI智能体能力，已开源至GitHub与ModelScope。

4408 4 7

modelscope

|

3月前

|

自然语言处理测试技术 Python

|

博文

小红书开源发布 FireRed-Image-Edit 1.0：高质量训练数据，性能屠榜三项核心评测

2月14日，小红书FireRedTeam开源FireRed-Image-Edit-1.0图像编辑模型。该模型在ImgEdit、GEdit等基准测试中全面超越现有开源方案，风格迁移（4.97分）等维度甚至优于Nano-Banana、Seedream4.0等闭源模型，支持文本保留、老照片修复、多图虚拟试衣等能力。

1270 6 6

modelscope

|

3月前

|

缓存架构师前端开发

|

博文

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

2月13日，MiniMax发布M2.5大模型，108天内三连更！编程（SWE-Bench 80.2%）、搜索（BrowseComp 76.3%）、办公场景全面领先，开源权重已上线ModelScope，支持API调用、本地部署及工具调用。

3790 7 9

modelscope

|

3月前

|

机器学习/深度学习编解码 JSON

|

博文

FantasyWorld 正式开源！一次前向传播，同时生成视频与 3D 几何——视频世界模型的新范

高德地图发布「FantasyWorld」——新一代几何一致世界模型，单次前向即可生成高质量视频与3D场景（深度图、点云、相机轨迹），无需后处理或逐场景优化。ICLR 2026录用，WorldScore榜首，已开源代码与模型。

840 6 6

modelscope

|

3月前

|

机器学习/深度学习人工智能资源调度

|

博文

万亿参数、混合线性架构、开源免费——Ring-2.5-1T 来了，思考模型卷到新高度

蚂蚁inclusionAI发布开源万亿参数思考模型Ring-2.5-1T，首创混合线性注意力架构，实现“快、深、长”三大突破：推理吞吐提升3倍+，IMO/CMO达金牌水平，可在Claude Code中连续2小时开发可运行的迷你操作系统。MIT协议完全开源。

569 21 21

modelscope

|

3月前

|

数据采集机器学习/深度学习人工智能

|

博文

全球Top下载中文开源数据集更新｜OpenCSG持续打造中文高质量数据集开源底座

OpenCSG正式发布Fineweb-Edu-Chinese V2.2数据集：覆盖预训练（1.5T tokens，质量分层）与SFT微调（143.7万条DeepSeek V3.2蒸馏问答对）全流程，严格事实锚定、支持溯源，是当前少有的高质量中文教育全栈数据解决方案。

319 13 14

modelscope

|

3月前

|

机器学习/深度学习人工智能算法

|

博文

GLM-5开源：迈向Agentic Engineering新范式，社区Day0 部署、推理实战来了！

智谱发布GLM-5：开源SOTA大模型，Coding与Agent能力双强，真实编程体验媲美Claude Opus 4.5；全球AI榜单排名第四、开源第一；MIT协议开源，支持复杂系统工程与长程Agent任务。

2864 5 5

最新

文章

视频

问答

推荐

OmniScience:大规模科学多模态数据集重磅上线

逐际动力开源 FluxVLA Engine：专为具身智能打造的标准化VLA工程底座

可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

戴盟联合数十家头部机构，发布全球最大规模含触觉全模态物理世界数据集

人机共享技能库为基础的可控本地安全助理平台

Spring AI Alibaba + MCP：调用MCP市场公开服务实操

Gemma 4 开源发布: Google 迄今最强开放模型，主打推理与 Agent 能力

OpAgent开源：登顶 WebArena，蚂蚁集团开源全模态网页智能体

使用PHP对接美股股票市场API 实时数据、IPO和K线（Kline）的PHP对接方案

五分钟配好向日葵 MCP，让 AI 替你远程安装 OpenClaw！

DeepSeek 双百万 token 窗口对话数据的量化对比分析

玩转纳斯达克与纽交所：美股数据 API 对接全指南

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

LTX-2.3开源： 视频生成引擎级升级

红外小目标检测新突破！异常感知检测头AA-YOLO：节俭又鲁棒，小样本也能精准识别

基于YOLO11的交通违规检测系统（Python源码+数据集+Pyside6界面）

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源！

C语言深度解析：内存对齐与结构体填充的底层逻辑

以deepseek 百万token窗口为上限，建立上下文窗口的“信噪比”量化标准

小红书开源FireRed-OCR，2B 参数登顶文档解析榜单

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

别再用 LangChain 搭 RAG 了：Dify 和 n8n 哪个才是你真正需要的

转行AI需谨慎：那些半途而废的人，都忽略了这几点。

Silly Tavern 免费API保姆级教学

打破真题依赖！微软、清华联合开源 X-Coder：全合成数据激发代码大模型推理潜力

如何快速对接德国股票数据 API

《基于 DeepSeek 百万token上下文的实证研究：全窗口真实工程压力测试与统计分析》

[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件 极简验证

如何高效对接新加坡股票（SGX）实时数据 API

【深度思考】当代码无法解决增长焦虑：一场关于“组织操作系统”的重构与意识进化

用 4B 小模型做Code Agent的SubAgent？这个开源项目做到了

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

Deepseek百万 Token 窗口的极限实践：一位非专业人员使用实录

四款国产VLM OCR模型横评

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

0.9B 小模型，OCR 大能力——GLM-OCR 模型实战教程

MiniCPM-o 4.5 CookBook：9B 参数玩转多模态全双工交互

自进化≠自我刷题，Agent 真正的突破口是「自己造环境」？——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

Boss直聘开源Nanbeige4.1-3B：小模型全能新标杆

蚂蚁集团 Ling-2.5-1T 开源：万亿参数，重新定义"又快又强"

Qwen3.5：迈向原生多模态智能体

小红书开源发布 FireRed-Image-Edit 1.0：高质量训练数据，性能屠榜三项核心评测

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

FantasyWorld 正式开源！一次前向传播，同时生成视频与 3D 几何——视频世界模型的新范

万亿参数、混合线性架构、开源免费——Ring-2.5-1T 来了，思考模型卷到新高度

全球Top下载中文开源数据集更新｜OpenCSG持续打造中文高质量数据集开源底座

GLM-5开源：迈向Agentic Engineering新范式，社区Day0 部署、推理实战来了！

ModelScope模型即服务

活跃用户

相关产品

DeepSeek 双百万 token 窗口对话数据的量化对比分析

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

LTX-2.3开源：视频生成引擎级升级

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件极简验证