图像识别的搜索结果_第10页-阿里云开发者社区

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

LLaVA-Med：微软推出专为临床放射学优化和报告生成的多模态模型

LLaVA-Med是微软推出的小型多模态模型，专注于高效生成高质量的胸部X光放射学报告，支持快速临床部署。

# 图像识别 # 人工智能 # 计算机视觉 # 异构计算

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Agno：18.7K Star！快速构建多模态智能体的轻量级框架，运行速度比LangGraph快5000倍！

Agno 是一个用于构建多模态智能体的轻量级框架，支持文本、图像、音频和视频等多种数据模态，能够快速创建智能体并实现高效协作。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 图像识别 # 存储 # 人工智能 # 数据库 # 决策智能 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Ola：清华联合腾讯等推出的全模态语言模型！实现对文本、图像、视频和音频的全面理解

Ola 是由清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型，支持文本、图像、视频和音频输入，并具备实时流式解码功能。

# 图像识别 # 人工智能 # 测试技术

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

AnythingLLM 是一个全栈应用程序，能够将文档、资源转换为上下文，支持多种大语言模型和向量数据库，提供智能聊天功能。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 图像识别 # 人工智能 # 资源调度 # API # Docker # 容器

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用，支持多模态交互、多种主流模型选择、离线运行及性能优化。

# 图像识别 # 机器学习/深度学习 # 存储 # 人工智能 # 自然语言处理 # Android开发

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

OCRmyPDF：16.5K Star！快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具

OCRmyPDF 是一款开源命令行工具，专为将扫描的 PDF 文件转换为可搜索、可复制的文档。支持多语言、图像优化和多核处理。

# 图像识别 # 人工智能 # 编解码 # 文字识别 # iOS开发 # MacOS

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Oumi：开源的AI模型一站式开发平台，涵盖训练、评估和部署模型的综合性平台

Oumi 是一个完全开源的 AI 平台，支持从 1000 万到 4050 亿参数的模型训练，涵盖文本和多模态模型，提供零样板代码开发体验。

# GPU云服务器 # 图像识别 # 人工智能 # 物联网 # 开发者 # 异构计算

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

VARGPT：将视觉理解与生成统一在一个模型中，北大推出支持混合模态输入与输出的多模态统一模型

VARGPT是北京大学推出的多模态大语言模型，专注于视觉理解和生成任务，支持混合模态输入和高质量图像生成。

# 图像识别 # 人工智能 # 测试技术

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

YuE：开源AI音乐生成模型，能够将歌词转化为完整的歌曲，支持多种语言和多种音乐风格

YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型，能够将歌词转化为完整的歌曲，支持多种音乐风格和多语言。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 内存技术

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Janus-Pro：DeepSeek 开源的多模态模型，支持图像理解和生成

Janus-Pro是DeepSeek推出的一款开源多模态AI模型，支持图像理解和生成，提供1B和7B两种规模，适配多元应用场景。通过改进的训练策略、扩展的数据集和更大规模的模型，显著提升了文本到图像的生成能力和指令跟随性能。

# 图像识别 # 人工智能 # 自然语言处理 # 计算机视觉 # 开发者 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别