|
2月前
|
人工智能 Serverless 开发工具
|

Git提交信息全是"update"?用这条指令让AI帮你重写"代码履历"

面对杂乱无章的Git提交记录,团队协作往往陷入"代码考古"的困境。本文介绍了一套基于大模型的Git提交信息标准化指令,通过消除认知阻断、统一技术方言和提升追溯精度,帮助开发者将碎片化的变更描述转化为架构级的版本记录,让代码维护不再困难。

249 11
|
2月前
|

VTP:MiniMax海螺视频团队,首次开源!

MiniMax视频团队推出首个开源工作VTP,首次将视觉tokenizer作为scaling主角,通过融合通用表征学习,实现生成性能随参数、算力、数据规模持续提升,展现tokenizer在视觉生成系统中的核心潜力。

221 3
|
2月前
|
人工智能 物联网 测试技术
|

ModelScope魔搭社区发布月报 -- 25年12月

魔搭社区12月重磅更新DeepSeek 3.2、Mistral-3等模型,Z-Image-Turbo引领文生图生态,平台全面升级加速开源模型落地。

368 8
|
3月前
|
数据采集 文字识别 算法
|

腾讯混元&清华开源15M高质量多模态训练数据,全面开放MLLM迎来质变时刻

腾讯混元与清华推出Bee项目,首创“以数据为中心”的全栈开源方案,通过Honey-Data-15M高质量数据集、HoneyPipe数据增强管线及Bee-8B模型,显著提升全开源多模态大模型性能,缩小与闭源模型差距。

498 4
|
3月前
|
人工智能 自然语言处理 语音技术
|

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast,已登顶Hugging Face TTS趋势榜!

Soul AI Lab联合西工大、上交大开源SoulX-Podcast,支持中英粤川等多语种方言及副语言生成,可稳定输出超60分钟自然流畅的多人对话音频,已在Huggingface登顶TTS趋势榜。

661 0
|
4月前
|
存储 数据采集 数据管理
|

116_大规模预训练数据管理与质量控制机制

在2025年的大语言模型(LLM)训练领域,数据管理和质量控制已成为决定模型性能上限的关键因素。随着模型规模的不断扩大(从早期的数十亿参数到如今的数千亿参数),对训练数据的数量、多样性和质量要求也呈指数级增长。一个高效的数据管理系统和严格的质量控制机制,不仅能够确保训练过程的稳定性,还能显著提升最终模型的性能和安全性。

448 2
|
4月前
|
数据采集 存储 人工智能
|

141_模型更新:在线学习策略 - 焦点在增量微调的独特无中断部署

在大语言模型(LLM)的实际生产环境中,模型更新是维持服务质量和持续改进的关键环节。随着业务需求的演变、数据分布的变化以及模型能力的提升,如何高效、安全地更新已部署的LLM成为技术团队面临的重要挑战。传统的全量模型替换方法往往伴随着服务中断风险、资源消耗大以及可能的性能波动等问题。为此,增量微调技术作为一种轻量级的模型更新策略,正逐渐成为2025年LLM部署领域的主流选择。

457 9
|
4月前
|
缓存 自然语言处理 PyTorch
|

114_预训练:Masked LM优化与动态掩码效率深度解析

在大型语言模型(LLM)的预训练阶段,训练目标函数的设计直接影响模型的学习效率和最终性能。Masked Language Modeling(MLM)作为BERT等模型采用的核心预训练任务,通过随机掩盖文本中的部分token并让模型预测这些被掩盖的token,有效地训练了模型的双向表示能力。然而,传统的静态掩码策略存在重复率高、训练效率低等问题。动态掩码技术的引入显著提升了预训练效率和模型性能。本文将全面探讨MLM优化策略,深入推导动态掩码的效率提升原理,并介绍2025年最新的MLM优化技术,为高效预训练LLM提供理论和实践指导。

573 0
|
4月前
|
数据采集 人工智能 自然语言处理
|

52_领域模型:BioBERT与FinBERT

在大语言模型(LLM)快速发展的今天,通用模型如GPT-4、Claude 3和Gemini虽然在广泛任务上表现出色,但在专业领域如医疗、金融和法律等场景中,往往难以达到专业人员的期待精度。2025年的研究表明,领域特定的预训练模型在垂直领域任务中能够显著超越通用模型,为专业应用提供更可靠的支持。本文将深入剖析BioBERT、FinBERT等代表性领域模型的技术原理、训练方法、性能评估及实际应用案例,探讨垂直领域预训练的独特优势与未来发展趋势。

806 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

53_多模态LLM:图像理解的新范式

在人工智能技术快速发展的今天,单一模态的语言模型已经无法满足日益复杂的应用需求。2025年,多模态大型语言模型(MLLM)的崛起标志着AI技术进入了一个新的发展阶段,特别是在图像理解与文本生成的结合方面取得了突破性进展。本文将深入剖析多模态LLM的技术原理、架构设计、性能评估及实际应用案例,探讨视觉-语言融合技术如何重塑AI应用的边界,以及在未来发展中面临的挑战与机遇。

644 0
|
5月前
|
人工智能
|

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

269 8
|
5月前
|
监控 Devops 持续交付
|

从 DevOps 文化到以平台为中心的交付

DevOps 工程师与平台工程师在软件交付中各司其职。DevOps 强调开发与运维协作,推动自动化与文化变革;平台工程则聚焦构建自助式内部开发者平台,提升开发效率与一致性。两者相辅相成,共同加速高质量软件交付。

251 1
|
6月前
|
数据采集 人工智能 定位技术
|

分享一个开源的MCP工具使用的AI Agent 支持常用的AI搜索/地图/金融/浏览器等工具

介绍一个开源可用的 MCP Tool Use 通用工具使用的 AI Agent (GitHub: https://github.com/AI-Agent-Hub/mcp-marketplace ,Web App https://agent.deepnlp.org/agent/mcp_tool_use,支持大模型从Open MCP Marketplace (http://deepnlp.org/store/ai-agent/mcp-server) 的1w+ 的 MCP Server的描述和 Tool Schema 里面,根据用户问题 query 和 工具 Tool描述的 相关性,选择出来可以满足

755 9
|
6月前
|
人工智能 自然语言处理 物联网
|

魔搭社区模型速递(8.10-8.16)

🙋魔搭ModelScope本期社区进展:📟5285个模型,📁497个数据集,🎨59个创新应用,📄 9篇内容

468 0
|
7月前
|
人工智能 数据可视化 数据处理
|

10分钟,用 EvalScope 让文生图模型评估“有理有据”

AI画师们卷出新高度,人类评审却还在搬砖打分?传统文生图模型评测依赖人工标注与主观判断,周期长、成本高、易偏差。魔搭社区推出一站式模型评测框架EvalScope,支持全自动打标、多维雷达图与可视化报告,大幅提升评测效率。10分钟掌握EvalScope,轻松为文生图模型自动评分,让模型“卷”得明明白白!

622 0
|
7月前
|
API 调度 决策智能
|

全新平台级 ModelScope MCP 实验场重磅上线!

还在为快速验证MCP在对话中的效果而烦恼? 希望更灵活地组合魔搭开源模型API-Inference与Hosted MCP服务?

435 2
|
8月前
|
人工智能 开发者
|

2025魔搭开发者大会!来了!

2025魔搭开发者大会!来了!

1058 1
|
9月前
|
开发框架 人工智能 安全
|

ModelScope魔搭25年5月发布月报

不知不觉间,日历已经翻过了立夏,而开源模型的世界中似乎并没有春夏秋冬。在刚刚过去的四月份,见证了开源社区又一次蓬勃发展的浪潮。以Qwen3家族为代表,一系列新模型的开源为整个生态注入了新的活力。通过全面覆盖多种规格的 dense 与 MoE 模型架构,Qwen3 首次在开源模型中引入“快思考与慢思考” 双模式的支持,获得了广大开发者的热烈欢迎,成为新一代开源大模型的标杆之作。

346 10
|
10月前
|
API 开发者 异构计算
|

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

917 10
|
10月前
|
前端开发 机器人 API
|

答疑机器人实践:AgentScope多智能体带你玩转多源召回

答疑机器人实践:AgentScope多智能体带你玩转多源召回

443 3
|
10月前
|
人工智能 搜索推荐
|

「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为

SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。

829 2
来自: 自然语言处理  版块
|
10月前
|
存储 人工智能 JSON
|

传统OCR集体阵亡!Versatile-OCR-Program:开源多语言OCR工具,精准解析表格和数学公式等复杂结构

本文解析开源OCR工具Versatile-OCR-Program的技术实现,其基于多模态融合架构实现90%以上识别准确率,支持数学公式与图表的结构化输出,为教育资料数字化提供高效解决方案。

1236 5
来自: 多模态  版块
|
10月前
|
机器学习/深度学习 人工智能 文件存储
|

Llama Nemotron:英伟达开源基于Llama架构优化的推理模型,253B参数持平DeepSeek R1!

NVIDIA推出的Llama Nemotron系列推理模型,基于Llama架构优化,包含Nano/Super/Ultra三款,在数学推理、编程和工具调用等任务中展现卓越性能。

404 5
来自: 自然语言处理  版块
|
10月前
|
机器学习/深度学习 人工智能 计算机视觉
|

AI图像质感还原堪比专业摄影!Miracle F1:美图WHEE全新AI图像生成模型,支持超写实与多风格生成

美图WHEE推出的Miracle F1采用扩散模型技术,通过精准语义理解和多风格生成能力,可产出具有真实光影质感的专业级图像作品。

492 5
来自: 多模态  版块
|
10月前
|
人工智能 测试技术 API
|

PaperBench:OpenAI开源AI智能体评测基准,8316节点精准考核复现能力

PaperBench是OpenAI推出的开源评测框架,通过8316个评分节点系统评估AI智能体复现学术论文的能力,涵盖理论理解、代码实现到实验执行全流程。

743 30
来自: 自然语言处理  版块
|
10月前
|
人工智能 测试技术 定位技术
|

WorldScore:斯坦福开源世界生成模型评估新标杆:3000样本+九维指标,视频/4D/3D模型一网打尽

WorldScore是斯坦福大学提出的首个统一评估世界生成模型的基准测试,通过基于相机轨迹的布局规范和3000个多样化样本,全面评测生成内容的可控性、质量与动态性。

670 46
来自: 计算机视觉  版块
|
11月前
|
机器学习/深度学习 人工智能
|

ObjectMover:港大联合Adobe打造图像编辑黑科技,移动物体光影自动匹配

香港大学与Adobe联合研发的ObjectMover模型,通过视频生成先验迁移技术,实现图像中物体的自然移动、删除和插入,自动保持光影一致性。

325 21
来自: 计算机视觉  版块
|
11月前
|
人工智能 自然语言处理 搜索推荐
|

WritingBench:阿里最新大模型写作能力多维测评工具,开源32B深度思考写作模型

近日,阿里研究团队联合中国人民大学和上海交通大学共同开源了WritingBench ——该评估基准覆盖6大领域、100个细分场景,共包含1239条评测数据,以期为生成式写作提供全面的评估。团队进一步发现,凭借思维链技术和动态评估体系的加持,基于Qwen开发的32B创作模型在创意型任务上表现接近顶尖模型R1,为高效能创作开辟了新路径。

1123 5
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Qwen2.5-VL-32B:阿里开源多模态核弹!32B模型吊打自家72B,数学推理封神

阿里巴巴最新开源的Qwen2.5-VL-32B多模态模型,在数学推理、视觉问答等任务中超越前代72B版本,支持图像细粒度理解和复杂逻辑分析,已在HuggingFace开源。

1519 0
来自: 多模态  版块
|
11月前
|
人工智能 自然语言处理 机器人
|

今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok

由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架,可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力,通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题,研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集,涵盖多样化的场景和相机运动。

579 2
|
11月前
|
人工智能 安全 测试技术
|

本周 AI Benchmark 方向论文推荐

由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench,是一个专为评估大型语言模型(LLMs)在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例,专注于新功能的实现。研究表明,即使是先进的 LLMs 在此任务中的表现仍远低于预期,揭示了仓库级代码开发的重大挑战。

611 0
|
11月前
|
机器学习/深度学习 数据格式
|

R1-Omni开源!多模态模型+RLVR,让各模态作用清晰可见

随着 DeepSeek R1 的推出,强化学习在大模型领域的潜力被进一步挖掘。Reinforcement Learning with Verifiable Reward (RLVR) 方法的出现,为多模态任务提供了全新的优化思路,无论是几何推理、视觉计数,还是经典图像分类和物体检测任务,RLVR 都展现出了显著优于传统监督微调(SFT)的效果。

769 12
|
11月前
|
物联网 异构计算
|

高效部署通义万相Wan2.1:使用Gradio搭建WebUI体验实战

随着通义万相Wan2.1 在社区的热度持续上涨,魔搭创空间的体验Demo(https://modelscope.cn/studios/Wan-AI/Wan-2.1)已经排起长队。

2150 12
|
12月前
|
机器学习/深度学习 人工智能 PyTorch
|

DeepSeek开源周第四弹之一!DualPipe:训练V3/R1的双向流水线并行技术,计算与训练完全重叠,训练效率提升200%

DeepSeek 开源的 DualPipe 技术通过双向流水线并行设计,显著提升大规模深度学习模型的训练效率,优化计算与通信重叠,降低内存峰值需求,适用于推理加速、多模态数据处理等场景。

867 1
来自: 科学计算  版块
|
24天前
|
存储 人工智能 缓存
|

别再把大脑当成 /dev/null 了!用这套AI指令给记忆装个 "Redis 缓存层"

本文将大脑记忆比作数据库存储,指出传统记忆的"无索引"缺陷。通过一套"记忆架构师AI指令",利用数据预处理、建立索引和持久化策略(遗忘曲线),帮助开发者构建高效、稳固的知识记忆系统,实现认知的"架构升级"。

415 4
|
26天前
|
人工智能 决策智能
|

多智能体军事协同系统:智能化防务体系中的关键技术框架

多智能体军事协同系统是智能化防务的重要理论方向,通过分布式感知、决策一致与协同控制,构建高效、鲁棒的系统协同模型。本文从概念、技术基础到发展趋势进行系统解析,探讨其在提升整体作战效能、推动系统智能演进中的理论价值,为相关研究提供参考。(238字)

151 2
|
26天前
|
JSON 人工智能 API
|

从对话到Agent:大模型工具调用能力的量化评测

大模型向Agent进化,工具调用是关键。本文介绍EvalScope评测框架,通过双重验证机制,量化评估模型“会不会用、能不能用好”工具,助力开发者打造可靠AI应用。

217 4
|
2月前
|
存储 Linux 编译器
|

C 语言学习资源精选:从入门到精通的高效资源清单

本文为C语言学习者提供从入门到精通的完整资源指南,涵盖各阶段优质视频、书籍、博客、开源项目及学习社区,并结合高效学习方法,帮助初学者摆脱资源焦虑,系统掌握语法、指针、内存管理等核心知识,进阶嵌入式与底层开发,稳步提升编程能力。

160 0
|
2月前
|
关系型数据库 MySQL 数据库
|

用 Python 实现 MySQL 数据库定时自动备份

本文介绍如何用Python脚本实现MySQL数据库的自动化备份。通过`subprocess`调用`mysqldump`,结合时间戳命名、文件压缩与crontab定时任务,可高效完成无人值守备份,提升数据安全性与运维效率。

108 0
|
2月前
|
存储 安全 C语言
|

C 语言实用标准库与工具函数使用指南:提升开发效率的核心技巧

本文系统梳理C语言开发中10类常用工具函数,涵盖标准库(stdio.h、string.h、stdlib.h等)核心函数与自定义工具,结合代码案例详解输入输出、字符串处理、内存管理、文件操作等场景的用法与注意事项,帮助开发者提升效率、避免常见错误。

176 0
|
2月前
|
数据采集 数据可视化 数据挖掘
|

Python 高效学习指南:从入门到全场景的科学路径

Python学习应避免贪多求全,遵循“筑基→深化→定向→实战”四阶段路径:先掌握核心语法与编程思维,再深入面向对象与代码质量,随后聚焦Web、数据或自动化方向,最后通过项目整合技能。强调实践闭环与工程化思维,助力从入门迈向实用开发。

170 0
|
2月前
|
数据采集 人工智能 分布式计算
|

只靠国产算力与开源数据,端侧模型预训练行不行?我们做到了全流程开源

鹏城实验室与清华联合发布全流程开源大模型“开元-2B”,基于国产算力实现高效端侧训练。涵盖数据、代码、训练框架与技术报告,推动开放AI生态发展。

214 1
|
2月前
|
人工智能 安全
|

一年输送旅客数千万次,浦东国际机场的效率秘密藏在这个智能体里

秋冬旅游高峰,浦东机场迎百万客流挑战。蚂蚁百宝箱推出“浦东国际机场”智能体,集成航班查询、停车导航、交通路线、餐饮酒店等一站式服务,实现“出发—到港”全链路智慧出行,提升旅客体验与机场运营效率。

195 2
来自: 自然语言处理  版块
|
3月前
|
机器学习/深度学习 数据可视化 Apache
|

仅3B激活参数,更强的多模态理解与推理能力,百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源!

11月11日,百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型,仅3B激活参数,性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能,支持工具调用与视频分析,适用于复杂图文任务,全面开放商用。

548 17

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互