图像识别的搜索结果_热门_第13页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

月之暗面开源16B轻量级多模态视觉语言模型！Kimi-VL：推理仅需激活2.8B，支持128K上下文与高分辨率输入

月之暗面开源的Kimi-VL采用混合专家架构，总参数量16B推理时仅激活2.8B，支持128K上下文窗口与高分辨率视觉输入，通过长链推理微调和强化学习实现复杂任务处理能力。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # 网络架构 # 异构计算

董董灿是个攻城狮

|

博文

|

来自：视觉智能

Resnet图像识别入门——Softmax分类是如何工作的

softmax作为一个分类器，它只是把重要的信息变得更重要了而已。

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 算法

以山向海

|

博文

人工智能中的图像识别

# 图像识别 # 机器学习/深度学习 # 人工智能 # 监控 # 算法 # 计算机视觉

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

OmAgent：轻松构建在终端设备上运行的 AI 应用，赋能手机、穿戴设备、摄像头等多种设备

OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架，支持多设备连接、高效模型集成，助力开发者快速构建复杂的多模态代理应用。

# 图像识别 # 人工智能 # 算法 # 前端开发 # NoSQL # 开发者

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL-32B：阿里开源多模态核弹！32B模型吊打自家72B，数学推理封神

阿里巴巴最新开源的Qwen2.5-VL-32B多模态模型，在数学推理、视觉问答等任务中超越前代72B版本，支持图像细粒度理解和复杂逻辑分析，已在HuggingFace开源。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 计算机视觉

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Amazon Nova Act：网页操作全自动！亚马逊黑科技把浏览器变AI机器人，请假/订餐/写邮件一键搞定

Amazon Nova Act是亚马逊AGI实验室推出的通用AI代理系统，通过原子化分解网页操作任务并配合Playwright实现高可靠性浏览器自动化，其配套SDK支持开发者快速构建智能体应用原型。

# 图像识别 # 人工智能 # 机器人 # 开发工具 # 决策智能 # 开发者

fundroid

|

博文

使用 Google MLKit 进行图像识别

MLKit 是 Google 提供的移动端机器学习库。工程师仅通过少量代码就能在 Andorid 或 iOS 上实现各种 AI 能力，例如图像、文字、人脸识别等等

# 图像识别 # 机器学习/深度学习 # 人工智能 # 前端开发 # API # TensorFlow # 算法框架/工具 # Android开发 # 计算机视觉 # iOS开发

TechLead

|

博文

支持向量机SVM：从数学原理到实际应用

# 图像识别 # 机器学习/深度学习 # 数据采集 # 算法 # PyTorch # 算法框架/工具

颜淡慕潇

|

博文

|

来自：通义大模型

【大模型】大型模型飞跃升级—文档图像识别领域迎来技术巨变

通过对GPT-4V和文档识别领域的深入分析和思考，为OCR文档识别领域的研究开辟了新的方向。需求不断增长的背景下，提高识别精度和处理效率成为了迫切需要满足的新应用标准。在这一背景下，出现了：素级OCR统一模型、OCR大一统模型、文档识别分析+LLM（LanguageModel）等应用的新方向。下面来详细看一下。

# 图像识别 # 自然语言处理 # 文字识别 # 机器学习/深度学习 # 文字识别 # 自然语言处理 # 算法 # 图形学

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Gemini 2.0：谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型

谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型，以Agent技术为核心，支持多种数据类型的输入与输出，具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。

# 图像识别 # 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # 测试技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别