|
7月前
|
机器学习/深度学习 弹性计算 测试技术
|

Kimi Playground与ModelScope MCP合作,共建更智能的Agent

月之暗面发布开源模型Kimi K2,参数总量达1T,激活参数32B,基于MoE架构,具备强大的代码能力与通用Agent任务处理能力。在多项基准测试中取得SOTA成绩,并已开源。ModelScope与Kimi Playground集成,支持一键同步MCP服务,方便开发者使用。

486 0
|
7月前
|
机器学习/深度学习 自然语言处理 API
|

RM-Gallery: 一站式奖励模型平台

近年来,大型语言模型(LLMs)发展迅速,比如 ChatGPT、Qwen、Claude、 Llama。这些模型最初的能力来自预训练规模的扩展(pre-training scaling),即通过 “next-token prediction” 的任务,在海量语料上训练,从而获得通用能力。但是面对具体场景,由于场景任务目标不一定和通用能力匹配(比如对齐场景),所以预训练模型表现会有一些不足。为了在预训练之后进一步优化大型语言模型,近年来的研究开始转向训练后和测试时的规模扩展,其中奖励模型起着关键作用。

406 2
|
8月前
|
人工智能 缓存 搜索推荐
|

手把手基于ModelScope MCP协议实现AI短视频创作:零代码自动化工作流

本文介绍了基于ModelScope MCP协议的AI视频生成解决方案,涵盖核心机制解析、零代码工作流搭建、性能优化策略及全链路异常处理。通过统一上下文描述符抽象异构AI服务,实现图像生成、语音合成与视频剪辑的自动化编排。结合缓存优化与错误重试机制,大幅提升生成效率(如5分镜视频从91.7s降至22.4s)。最后展示《夏日海滩》生成案例,并探讨个性化风格迁移与商业场景集成等进阶方向,揭示零代码本质为服务、流程与资源的三层抽象。

1167 18
|
8月前
|
安全 搜索推荐 数据安全/隐私保护
|

无缝体验设计、一键直达的奥秘

Apptrace 是一款强大的工具,支持传参安装与一键拉起功能,优化用户体验。本文通过四个实战案例展示其应用:1) 电商深度链接营销,实现商品页直达;2) 游戏邀请系统,追踪来源并自动奖励;3) 新闻个性化内容推送,提升打开速度;4) 企业应用无缝登录,保障安全高效。同时总结最佳实践,包括优雅降级、参数加密、统计分析等,助力企业提升用户转化率与体验流畅度。

422 1
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

魔搭社区模型速递(4.27-5.10)

🙋魔搭ModelScope本期社区进展:📟2341个模型,206个数据集,🎨224个创新应用,📄 15篇内容

641 20
|
10月前
|
数据采集 分布式计算 监控
|

智能数据建设与治理 Dataphin:阿里云的一站式数据治理利器

阿里云Dataphin是一款企业级数据治理与智能建设平台,专注于解决数据孤岛、质量低下和开发效率低等问题。它提供从数据集成、规范建模、智能开发到质量监控及资产管理的全生命周期解决方案,特别适用于中大型企业构建数据中台或推进数字化转型。Dataphin通过自动化生成代码、内置质量规则模板和全局血缘追踪等功能,显著提升数据开发效率与跨团队协作能力。尽管学习曲线较陡峭且资源消耗较高,但其深度集成阿里云生态的优势,使其成为追求规范化数据治理企业的理想选择。推荐已采用阿里云技术栈并具备一定数据团队规模的企业使用。

626 1
|
10月前
|
SQL 人工智能 Devops
|

MCP的蝴蝶效应:生产力还没实质提升的当下,与生产关系改变带来的大模型应用无限未来

从 LangChain 创始人Twitter激辩 MCP,到 Manus 项目火爆出圈,以及OpenAI & Google纷纷下场兼容MCP,这场由Anthropic发起的技术变革正引发全球科技圈的关注。作为国内首批接入MCP生态的企业级平台和开源社区,阿里云百炼与ModelScope社区深度拥抱MCP全套生态工具并提供大量深度应用实践,并收获到大家的热烈反馈。在各类宣传稿中,MCP似乎无所不能,那么它真的是技术上的万能灵药么?我们将从技术祛魅与生态重构的双重视角,和大家深度讨论下MCP的现状与对未来的展望。

628 1
|
10月前
|
人工智能 调度 UED
|

这个AI能把PSD变视频!人物/场景/道具任意组合!SkyReels-A2:昆仑万维推出的可控多元素视频生成框架

SkyReels-A2是昆仑万维推出的创新视频生成框架,通过扩散模型和图像-文本联合嵌入技术,实现多元素精准组合与高质量视频输出。

516 25
来自: 多模态  版块
|
10月前
|
机器学习/深度学习 人工智能 前端开发
|

SWEET-RL:8B小模型暴打GPT-4?Meta开源强化学习黑科技,多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制,使Llama-3.1-8B模型在协作推理任务中的表现提升6%,性能达到顶尖大模型水平。

541 33
来自: 自然语言处理  版块
|
11月前
|
人工智能 数据可视化 C++
|

Math24o:SuperCLUE开源的高中奥数推理测评基准,85.71分屠榜

Math24o是首个针对高中奥林匹克数学竞赛的中文大模型测评基准,采用2024年预赛真题实现自动化评估,为模型数学推理能力提供客观衡量标准。

376 48
来自: 科学计算  版块
|
11月前
|
人工智能 搜索推荐 图形学
|

ChatAnyone:阿里通义黑科技!实时风格化肖像视频生成框架震撼发布

阿里巴巴通义实验室推出的ChatAnyone框架,通过高效分层运动扩散模型和混合控制融合技术,实现高保真度、自然度的实时肖像视频生成。

431 13
来自: 计算机视觉  版块
|
11月前
|
存储 人工智能 编解码
|

TripoSF:3D建模内存暴降80%!VAST AI新一代模型细节狂飙82%

TripoSF 是 VAST AI 推出的新一代 3D 基础模型,采用创新的 SparseFlex 表示方法,支持 1024³ 高分辨率建模,内存占用降低 82%,在细节捕捉和复杂结构处理上表现优异。

364 10
来自: 计算机视觉  版块
|
11月前
|
存储 机器学习/深度学习 人工智能
|

TaoAvatar:手机拍出电影级虚拟人!阿里3D高斯黑科技让动捕设备下岗

阿里巴巴最新推出的TaoAvatar技术,通过3D高斯溅射实现照片级虚拟人实时渲染,支持多信号驱动与90FPS流畅运行,将彻底改变电商直播与远程会议体验。

717 8
来自: 计算机视觉  版块
|
11月前
|
前端开发 测试技术 API
|

DeepSeek-V3小版本升级,非推理模型王者归来

今天,DeepSeek低调地在魔搭社区开源 DeepSeek-V3-0324 模型,虽然官方低调称之为小版本升级,但能力提升一点也不小。

423 5
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Reve Image:设计师失业警告!AI秒出海报级神图,排版自动搞定

Reve Image 是 Reve 推出的全新 AI 图像生成模型,专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视觉作品。

640 29
来自: 计算机视觉  版块
|
11月前
|
机器学习/深度学习 人工智能 机器人
|

上周多模态论文推荐:MAPS、MapGlue、OmniGeo、OThink-MR1

由西安交通大学、新加坡国立大学和南洋理工大学联合提出,该工作推出了MAPS框架,利用基于Big Seven人格理论的七个智能体和苏格拉底式引导,解决多模态科学问题(MSPs)。通过四阶段求解策略和批判性反思智能体,MAPS在EMMA、Olympiad和MathVista数据集上超越当前最佳模型15.84%,展现了卓越的多模态推理与泛化能力。

512 1
|
11月前
|
数据采集 数据可视化 搜索推荐
|

Quick BI 评测报告

本文详细记录了一名项目经理对阿里云Quick BI的全面评测过程。从申请试用账号到数据上传、数据集创建,再到可视化分析与智能功能体验,作者深入探讨了Quick BI的各项功能。文中提到Quick BI具备强大的数据处理能力和友好的用户界面,尤其在可视化和智能化方面表现出色。但同时也指出了数据清洗功能不足、图表配置有限及智能助手能力需提升等问题。整体而言,Quick BI是一款适合项目经理高效分析数据的工具,未来若能优化上述问题,将更具竞争力。

423 72
|
11月前
|
人工智能 缓存 自然语言处理
|

TokenSwift:90分钟生成10万Token!文本生成提速3倍,无损加速黑科技

TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,速度提升3倍,生成质量无损,支持多种模型架构。

349 16
来自: 自然语言处理  版块
|
11月前
|
人工智能 搜索推荐 开发者
|

Kiss3DGen:基于图像扩散模型的3D资产生成框架

Kiss3DGen是一个创新的3D资产生成框架,通过重新利用预训练的2D图像扩散模型,高效生成、编辑和增强3D对象,支持文本到3D、图像到3D等多种生成任务。

448 5
来自: 多模态  版块
|
11月前
|
人工智能 数据库 决策智能
|

Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体

Archon 是一个开源的 AI 智能体框架,能够自主生成代码并优化智能体性能,支持多智能体协作、领域知识集成和文档爬取等功能,适用于企业、教育、智能家居等多个领域。

1067 10
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 机器人
|

阿里通义开源推理模型新王者!QwQ-32B:性能直逼671B的DeepSeek-R1

QwQ-32B 是阿里巴巴开源的新型推理模型,基于强化学习训练,具备强大的数学推理和编程能力,性能媲美更大参数量的模型。

1017 8
来自: 自然语言处理  版块
|
11月前
|
人工智能 自然语言处理 算法
|

打造跨语言智能工具与应用,“万卷·丝路”专项课题开放申请

随着共建“一带一路”进入高质量发展阶段,全球开发者对于多语言模型训练的需求不断增长,上海AI实验室联合大模型语料数据联盟成员发布了“万卷·丝路”多语言预训练语料库,为多语言大模型训练提供高质量数据支撑,助力全球开发者构建跨语言智能工具与应用。

244 4
|
12月前
|
机器学习/深度学习 存储 文字识别
|

阿里国际Ovis2系列模型开源:多模态大语言模型的新突破

Ovis是阿里巴巴国际化团队提出的新型多模态大模型架构,通过巧妙地将视觉和文本嵌入进行结构化对齐,为解决模态间嵌入策略差异这一局限性提供了方案。

853 2
|
12月前
|
人工智能 自然语言处理 数据可视化
|

AutoAgents:比LangChain更激进的AI开发神器!自然语言生成AI智能体军团,1句话搞定复杂任务

AutoAgents 是基于大型语言模型的自动智能体生成框架,能够根据用户设定的目标自动生成多个专家角色的智能体,通过协作完成复杂任务。支持动态生成智能体、任务规划与执行、多智能体协作等功能。

1728 91
来自: 自然语言处理  版块
|
12月前
|
数据可视化 API 开发者
|

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用,越来越多的开发者开始尝试复现类似的模型,以提升其推理能力。

1022 2
|
12月前
|
人工智能 编解码 自然语言处理
|

Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐

Zonos 是 ZyphraAI 推出的开源多语言 TTS 模型,支持语音克隆、情感控制和多种语言,适用于有声读物、虚拟助手等场景。

914 18
来自: 语音  版块
|
24天前
|
JavaScript 前端开发
|

前端新手练习纯js原生做轮播图的感悟

做轮播的要点

108 4
|
26天前
|
人工智能 开发框架 安全
|

LLM驱使智能体:从概念、原理到落地实践的完整技术科普指南

随着大语言模型发展,AI正从被动响应迈向主动执行。LLM驱使智能体以大模型为核心决策引擎,通过“推理—行动—反馈”闭环,实现目标导向的自主任务执行,具备动态决策、持续运行与复杂环境适应能力。其在办公自动化、软件开发、知识工作等场景广泛应用,正成为连接大模型能力与现实任务的关键桥梁,推动智能系统向更高阶形态演进。

161 5
|
2月前
|
存储 SQL 数据库
|

C 语言持久层开发:从文件操作到轻量级数据库的实践

C语言无内置数据库支持,持久化需依赖文件操作或轻量级库。本文详解文本/二进制文件与SQLite的实现原理及选型:文件适配资源受限场景,SQLite支持复杂查询,二者结合可构建高效、可靠的嵌入式持久化方案。

136 0
|
2月前
|
缓存 JavaScript 前端开发
|

Vue高效学习指南:从入门到实战的科学路径

本文系统梳理Vue从入门到进阶的学习路径,提出“基础夯实-核心深化-项目实战-生态拓展”四阶段模型,结合实践案例、避坑指南与优质资源,帮助初学者摆脱碎片化学习,科学高效地掌握Vue开发技能,成长为能独立完成项目的前端开发者。

172 0
|
2月前
|
缓存 前端开发 JavaScript
|

Vue开发进阶:从初级到前端架构师的能力提升路径

Vue开发者需突破“只会写组件”瓶颈,系统构建组件设计、状态管理、性能优化与工程化能力。从初级到架构师,分三阶段实现思维跃迁:夯实工程化基础、掌握复杂场景优化、具备全链路架构设计与团队赋能能力,最终以技术驱动业务发展。

143 0
|
2月前
|
边缘计算 分布式计算 安全
|

Linux 为何能稳居服务器领域主流操作系统宝座

自1991年诞生以来,Linux凭借开源、稳定、高效和完善的生态,成为服务器、云计算、嵌入式等领域的主导操作系统。其低成本、高安全性与极致资源利用,支撑着阿里云、特斯拉、谷歌等全球科技巨头,未来仍将是数字世界的基石。

159 0
|
2月前
|
人工智能 机器人 开发者
|

北京人形 XR-1 模型开源,推动具身智能迈入“全自主、更好用”新阶段

12月18日,北京人形机器人创新中心开源国内首个通过具身智能国标测试的VLA大模型XR-1及RoboMIND 2.0、ArtVIP等数据平台,推动机器人实现“能干活、会干活”。XR-1具备视觉-动作一体化本能反应能力,支持多本体、多场景任务,结合海量训练数据与高保真仿真资产,助力具身智能迈向全自主新阶段。

113 0
|
3月前
|
人工智能 自然语言处理 搜索推荐
|

贝聿铭的 “数字续作”:蚂蚁百宝箱 × 苏州博物馆,用 AI 重构文化地标

苏州博物馆携手蚂蚁百宝箱推出AI助手“小苏苏”,集成展讯、导览、文创推荐等功能,打造“咨询—导览—消费”闭环,以智能服务提升参观体验,助力文博场馆数字化升级。

318 3
来自: 自然语言处理  版块
|
3月前
|
人工智能 文字识别 物联网
|

ModelScope魔搭社区发布月报 -- 25年11月

魔搭ModelScope三周年庆!见证开源大模型从追赶到领跑,11月硬核更新不断:Qwen3-VL、MiniMax-M2等新模态齐发,AIGC生态爆发,OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会,不见不散!

569 4
|
4月前
|
机器学习/深度学习 存储 人工智能
|

106_模型合并:Task Arithmetic

在大语言模型(LLM)时代,模型合并技术正在成为高效整合不同模型能力的关键方法。随着开源模型的爆发式增长,如何在不进行昂贵的重新训练的情况下,将多个专用模型的知识整合到一个统一模型中,成为了研究和工业界的重要课题。Task Arithmetic作为一种新兴的模型合并方法,通过向量操作实现权重融合,为这一挑战提供了创新解决方案。

362 24
|
4月前
|
存储 机器学习/深度学习 自然语言处理
|

108_连续微调:链式任务适应

在大模型时代,如何让预训练模型高效地适应多个相关任务,同时保持知识的连贯性和完整性,成为了一个重要的研究方向。连续微调(Continual Fine-tuning)作为一种新兴的微调范式,通过链式任务适应(Sequential Task Adaptation)机制,实现了模型在顺序学习多个任务时的知识保留和迁移。本文将深入探讨连续微调的核心原理、实现方法、关键技术挑战以及2025年的最新研究进展,为读者提供全面的技术指导和实践指南。

189 1
|
4月前
|
Kubernetes Cloud Native 异构计算
|

133_云端扩展:Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

在大语言模型(LLM)部署的时代,如何高效地管理计算资源、应对动态负载并优化成本,成为了每个AI工程师必须面对的挑战。随着LLM应用的普及,用户请求模式变得日益复杂且难以预测,传统的静态资源配置方式已无法满足需求。Kubernetes作为云原生时代的容器编排平台,其强大的自动扩展能力为LLM部署提供了理想的解决方案。

381 2
|
4月前
|
边缘计算 人工智能 PyTorch
|

130_知识蒸馏技术:温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型(LLM)的规模不断增长,部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例,其671B参数的规模即使经过INT4量化后,仍需要至少6张高端GPU才能运行,这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术,通过将大型教师模型的知识迁移到小型学生模型中,在显著降低模型复杂度的同时保留核心性能,成为解决这一问题的关键技术之一。

458 6
|
4月前
|
数据采集 人工智能 自然语言处理
|

63_模型定制:领域微调技术

在2025年的AI生态系统中,通用大语言模型(LLM)如ChatGPT、LLaMA 3、Claude 3等已经展现出惊人的通用能力。然而,当面对特定行业或场景的专业需求时,通用模型往往表现出局限性:术语理解不准确、领域知识不足、任务适配性差等问题。这正是模型定制与微调技术应运而生的背景。

296 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互