图像识别的搜索结果_文章_第4页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

重定义数字人交互！OmniTalker：阿里推出实时多模态说话头像生成框架，音视频实现唇语级同步

阿里巴巴推出的OmniTalker框架通过Thinker-Talker架构实现文本驱动的实时说话头像生成，创新性采用TMRoPE技术确保音视频同步，支持流式多模态输入处理。

# 虚拟数字人 # 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # 机器人 # 语音技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

OmniCam：浙大联合上海交大推出多模态视频生成框架，虚拟导演打造百万级影视运镜

OmniCam是由浙江大学与上海交通大学联合研发的多模态视频生成框架，通过LLM与视频扩散模型结合实现高质量视频生成，支持文本、轨迹和图像等多种输入模态。

# 图像识别 # 机器学习/深度学习 # 人工智能

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

音乐人狂喜！AbletonMCP：让AI帮你写歌，一句话生成专业编曲，Demo级作品秒出

AbletonMCP 是一个开源项目，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现 AI 辅助音乐制作，支持创建、修改 MIDI 和音频轨道等操作。

# 图像识别 # 人工智能 # JSON # 网络协议 # 数据格式 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

AutoGLM沉思是由智谱AI推出的一款开创性AI智能体，它突破性地将深度研究能力与实际操作能力融为一体，实现了AI从被动响应到主动执行的跨越式发展。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 搜索推荐 # 数据可视化

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

QVQ-Max：阿里通义新一代视觉推理模型！再造多模态「全能眼」秒解图文难题

QVQ-Max是阿里通义推出的新一代视觉推理模型，不仅能解析图像视频内容，还能进行深度推理和创意生成，在数学解题、数据分析、穿搭建议等场景展现强大能力。

# 图像识别 # 人工智能 # 数据可视化 # 数据挖掘 # 计算机视觉

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Cosmos-Reason1：物理常识觉醒！NVIDIA 56B模型让AI懂重力+时空法则

Cosmos-Reason1是NVIDIA推出的多模态大语言模型系列，具备物理常识理解和具身推理能力，支持视频输入和长链思考，可应用于机器人、自动驾驶等场景。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 自动驾驶 # 机器人

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Mureka V6：10语种AI音乐工厂！昆仑万维「声场黑科技」颠覆作曲

昆仑万维推出的Mureka V6 AI音乐创作基座模型，支持10种语言歌词生成和纯音乐创作，通过自研ICL技术实现声场优化，覆盖爵士/电子/流行等多元风格，为音乐爱好者和专业创作者提供高效工具。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 数据库 # 决策智能 # Swift

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL-32B：阿里开源多模态核弹！32B模型吊打自家72B，数学推理封神

阿里巴巴最新开源的Qwen2.5-VL-32B多模态模型，在数学推理、视觉问答等任务中超越前代72B版本，支持图像细粒度理解和复杂逻辑分析，已在HuggingFace开源。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 计算机视觉

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

StarVector：图像秒变矢量代码！开源多模态模型让SVG生成告别手绘

StarVector是由ServiceNow Research等机构联合开发的开源多模态视觉语言模型，能够将图像和文本转换为可编辑的SVG矢量图形，支持1B和8B两种规模，在SVG生成任务中表现出色。

# 图像识别 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Second Me：硅基生命或成现实？如何用AI克隆自己，打造你的AI数字身份！

Second Me 是一个开源AI身份系统，允许用户创建完全私有的个性化AI代理，代表用户的真实自我，支持本地训练和部署，保护用户隐私和数据安全。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 搜索推荐 # 算法 # 数据安全/隐私保护

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别