图像识别的搜索结果_热门_第2页-阿里云开发者社区

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Agno：18.7K Star！快速构建多模态智能体的轻量级框架，运行速度比LangGraph快5000倍！

Agno 是一个用于构建多模态智能体的轻量级框架，支持文本、图像、音频和视频等多种数据模态，能够快速创建智能体并实现高效协作。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 图像识别 # 存储 # 人工智能 # 数据库 # 决策智能 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

VideoCaptioner：北大推出视频字幕处理神器，AI自动生成+断句+翻译，1小时工作量5分钟搞定

VideoCaptioner 是一款基于大语言模型的智能视频字幕处理工具，支持语音识别、字幕断句、优化、翻译全流程处理，并提供多种字幕样式和格式导出。

# 图像识别 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

OpenUtau是一款开源的歌声合成工具，兼容UTAU音源库和重采样器，支持多语言界面及预渲染功能，让音乐创作更加高效便捷。

# 图像识别 # 人工智能 # Linux # iOS开发 # MacOS # Windows

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

MarkItDown：微软开源的多格式转Markdown工具，支持将PDF、Word、图像和音频等文件转换为Markdown格式

MarkItDown 是微软开源的多功能文档转换工具，支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式，具备 OCR 文字识别、语音转文字和元数据提取等功能。

# 图像识别 # 智能语音交互 # 人工智能 # 文字识别 # 数据挖掘 # API # 开发者

羽林小王子

|

博文

|

来自：视觉智能

图像识别算法汇总

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 传感器 # 人工智能 # 监控 # 算法 # 安全 # 固态存储 # 数据库 # 计算机视觉

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

用自然语言控制电脑，字节跳动开源 UI-TARS 的桌面版应用！内附详细的安装和配置教程

UI-TARS Desktop 是一款基于视觉语言模型的 GUI 代理应用，支持通过自然语言控制电脑操作，提供跨平台支持、实时反馈和精准的鼠标键盘控制。

# 自然语言处理 # 图像识别 # 人工智能 # 自然语言处理 # API # iOS开发 # MacOS

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

AutoGLM沉思是由智谱AI推出的一款开创性AI智能体，它突破性地将深度研究能力与实际操作能力融为一体，实现了AI从被动响应到主动执行的跨越式发展。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 搜索推荐 # 数据可视化

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

PC Agent：开源 AI 电脑智能体，自动收集人机交互数据，模拟认知过程实现办公自动化

PC Agent 是上海交通大学与 GAIR 实验室联合推出的智能 AI 系统，能够模拟人类认知过程，自动化执行复杂的数字任务，如组织研究材料、起草报告等，展现了卓越的数据效率和实际应用潜力。

# 图像识别 # 存储 # 人工智能 # 人机交互 # 决策智能

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Trae 接入 Claude 3.7：AI 编程工具界的“卷王”，完全免费使用！

Trae 是一款完全免费的AI编程工具，现已接入 Claude 3.7 模型，提供代码生成、调试等强大功能，支持多模态输入和上下文理解，用户可享受24小时高速服务，无需担心付费限制。Trae 支持多平台，安装简便，适合开发者快速上手。

# 图像识别 # 人工智能 # 自然语言处理 # IDE # 开发工具 # C++

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

Open Notebook：开源 AI 笔记工具，支持多种文件格式，自动转播客和生成总结，集成搜索引擎等功能

Open Notebook 是一款开源的 AI 笔记工具，支持多格式笔记管理，并能自动将笔记转换为博客或播客，适用于学术研究、教育、企业知识管理等多个场景。

# 图像识别 # 自然语言处理 # 人工智能 # 自然语言处理 # 搜索推荐 # API # UED

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别