计算机视觉的搜索结果_文章_第5页-阿里云开发者社区

蚝油菜花

|

8天前

|

博文

|

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型，旨在解决SAM 2模型在移动设备上部署时的高计算复杂度问题。该模型采用非层次化Vision Transformer（ViT）作为图像编码器，并引入高效记忆模块，以降低计算复杂度，同时保持高质量的分割结果。EfficientTAM在多个视频分割基准测试中表现出与SAM 2相当的性能，具有更快的处理速度和更少的参数，特别适用于移动设备上的视频对象分割应用。

# 视觉智能开放平台 # 机器学习/深度学习 # 存储 # 人工智能 # 测试技术 # 计算机视觉

楠竹11

|

8天前

|

博文

田渊栋团队新作祭出Agent-as-a-Judge！AI智能体自我审判，成本暴跌97%

田渊栋团队提出Agent-as-a-Judge框架，利用智能体自身评估其他智能体的性能，不仅关注最终结果，还能提供中间反馈，更全面准确地反映智能体的真实能力。该框架在DevAI基准测试中表现出色，成本效益显著，为智能体的自我改进提供了有力支持。

# 人工智能 # 自然语言处理 # 数据挖掘 # 测试技术 # 计算机视觉

技术员阿伟

|

8天前

|

博文

《以 C++为笔，绘就手势识别人机交互新画卷》

在科技发展的浪潮中，手势识别技术正引领人机交互进入一个更为自然、智能的新阶段。C++语言以其卓越的性能和强大的功能，成为手势识别系统开发的中流砥柱，通过高效的数据处理、精准的硬件控制和丰富的库支持，推动了手势识别技术的广泛应用，从智能家居到虚拟现实，再到智能驾驶，C++都在不断为手势识别人机交互系统的发展贡献力量。

# 算法 # 人机交互 # vr&ar # C++ # 计算机视觉

蚝油菜花

|

9天前

|

博文

|

来自： ModelScope模型即服务

Magic Copy：开源的 AI 抠图工具，在浏览器中自动识别图像进行抠图

Magic Copy 是一款开源的 AI 抠图工具，支持 Chrome 浏览器扩展。它基于 Meta 的 Segment Anything Model 技术，能够自动识别图像中的前景对象并提取出来，简化用户从图片中提取特定元素的过程，提高工作效率。

# 视觉智能开放平台 # Web App开发 # 机器学习/深度学习 # 人工智能 # 计算机视觉 # 开发者

konodome

|

9天前

|

博文

深度学习在图像识别中的革命性进展###

近年来，深度学习技术在图像识别领域取得了显著成就，极大地推动了人工智能的发展。本文探讨了深度学习模型如何通过模拟人类视觉系统来提高图像识别的准确性和效率，并分析了几种主流的深度学习架构及其在实际应用中的表现。此外，还讨论了当前面临的挑战及未来可能的发展方向。 ###

# 机器学习/深度学习 # 人工智能 # 编解码 # 算法 # 计算机视觉

LuckiBit

|

10天前

|

博文

【C语言】移位操作详解 - 《凌波微步 ! 》

移位操作符是C语言中非常重要的工具，提供了高效的位级操作方法。理解和正确使用移位操作符，对于编写高性能和高效能的程序至关重要。本文详细介绍了左移和右移操作符的使用方法、应用场景及注意事项，希望对您理解和使用C语言移位操作有所帮助。

# C语言 # 计算机视觉

jiashufen

|

10天前

|

博文

探索深度学习在图像识别中的应用与挑战

本文深入探讨了深度学习技术在图像识别领域的应用，分析了其背后的原理、当前的成就以及面临的主要挑战。通过具体案例分析，揭示了深度学习模型如何从复杂的图像数据中学习到有效的特征表示，以及这些技术进步如何推动计算机视觉领域的发展。同时，文章也讨论了深度学习模型训练过程中的数据依赖性、过拟合问题、计算资源需求等挑战，并提出了未来研究的可能方向。

# 机器学习/深度学习 # 存储 # 自动驾驶 # 算法 # 计算机视觉

1778908750453455

|

10天前

|

博文

政府部门文档管理革新：实现90%自动内容抽取与智能标签化处理！

本文介绍了多模态数据处理技术，涵盖自然语言处理（NLP）、光学字符识别（OCR）和图像识别的技术原理，以及智能分类、标签化处理、系统集成与国产化适配、安全与合规、算法优化等方面的内容。通过这些技术的应用，实现了文档管理的全流程智能化，为用户提供高效、可靠的解决方案。

# 机器学习/深度学习 # 自然语言处理 # 算法 # 数据安全/隐私保护 # 计算机视觉

楠竹11

|

10天前

|

博文

OpenAI发布sCM提升50倍效率，扩散模型重大技术突破！

OpenAI近期发布了Simplified Consistency Models (sCM) 技术，这是在扩散模型基础上的重大改进，实现了50倍效率提升。sCM通过简化和稳定连续时间一致性模型的训练过程，解决了传统模型中的离散化误差和训练不稳定性问题，显著提升了生成模型的性能和效率。在多个数据集上的测试结果表明，sCM不仅超越了现有模型，还在生成模型的实际应用中展现了巨大潜力。论文地址：https://arxiv.org/abs/2410.11081

# 人工智能 # 自然语言处理 # 计算机视觉 # 网络架构

zhugedongming-28079

|

10天前

|

博文

|

来自：通义大模型

【项目实战】通过LLaMaFactory+Qwen2-VL-2B微调一个多模态医疗大模型

本文介绍了一个基于多模态大模型的医疗图像诊断项目。项目旨在通过训练一个医疗领域的多模态大模型，提高医生处理医学图像的效率，辅助诊断和治疗。作者以家中老人的脑部CT为例，展示了如何利用MedTrinity-25M数据集训练模型，经过数据准备、环境搭建、模型训练及微调、最终验证等步骤，成功使模型能够识别CT图像并给出具体的诊断意见，与专业医生的诊断结果高度吻合。

# 数据采集 # 前端开发 # 物联网 # 数据格式 # 计算机视觉

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

计算机视觉