计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26111内容
|
7天前
|
openEuler操作系统环境:目标检测软件开发实操与性能评估
本文系统研究了在openEuler 22.03 LTS SP3上基于YOLOv8实现鸟类目标检测的全流程,涵盖环境搭建、模型训练、性能优化与容器化部署。实验表明,openEuler凭借内核优化与异构计算支持,在GPU加速下推理速度达142 FPS,资源占用降低18%以上,展现出卓越的AI任务处理能力。
NeurIPS 2025 Spotlight!跨模态重识别革命!东北大学等 MDReID 图像信息智能匹配
东北大学等提出MDReID,获NeurIPS 2025 Spotlight!该方法实现跨模态行人重识别,创新性地将图像特征解耦为通用与专用特征,支持RGB、NIR、TIR等任意模态自由匹配,显著提升异源图像检索精度,推动安防、监控等领域智能化发展。
|
15天前
|
一键搞定人脸识别、语音识别、车牌识别本地化!离线跑模型不装框架!!!
SmartJavaAI 是专为 Java 开发者打造的离线 AI 工具箱,集成人脸识别、OCR、语音识别、机器翻译等 20+ 主流模型,基于 DJL + JNI 封装,支持 Maven 一键引入,两行代码调用,让 Java 工程师无需掌握 Python/C++ 即可轻松接入 AI 能力,高效落地各类智能场景。
|
16天前
|
用Qoder自动生成开源项目的说明书(wiki),新人爱看,老人爱用
程序员晚枫分享AI编程新利器Qoder:一键自动生成中文项目Wiki,解决文档维护难题。支持代码同步更新,降低学习成本,助力开源项目发展。12月第二周将在重庆阿里中心分享实战经验,欢迎交流!
|
19天前
|
Pixeltable:一张表搞定embeddings、LLM、向量搜索,多模态开发不再拼凑工具
Pixeltable 是一个开源多模态 AI 基础设施框架,统一管理文档、图像、视频、embedding 和 LLM 输出,通过“一切皆表”理念,将数据存储、计算与 pipeline 自动化集成于一体,简化 RAG、目标检测、相似性检索等应用开发,告别拼凑式架构,提升开发效率与可维护性。
|
19天前
|
2025年最佳AIGC视频服务商推荐!
2025年权威发布:聚焦快消行业,深度测评TOP5 AIGC视频服务商。从集之互动的私有化部署与全栈赋能,到可灵、即梦、梦影、讯视在内容生成、创意互动与数据驱动上的突破,全面助力品牌实现高效创作、精准传播与用户共创,引领AI营销新趋势。
|
19天前
|
Java 跳出多层循环
本文详解Java中如何使用带标签的`break`语句跳出多层循环。通过实例展示其语法与应用场景,如图像黑屏检测,并对比传统方法与Stream API,帮助开发者在性能与可读性间做出权衡,提升代码效率与质量。(238字)
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
|
20天前
|
停车场空车位检测数据集(3000张图片已划分)[目标检测]
在城市交通管理与智慧停车建设快速发展的当下,如何高效、精准地识别停车场空车位已成为智慧城市重要课题。为了支持研究者和工程团队训练高性能停车检测模型,我们构建了停车场空车位检测数据集,专为目标检测任务优化设计。
|
21天前
|
[数据集]作弊行为检测数据集(1100张图片已划分)[目标检测]
基于视觉 AI 的作弊行为检测正逐渐走向成熟,从简单的屏幕监控、人工复查逐步迈向自动化、实时化与精准识别。本数据集的构建,旨在为研究者与开发者提供一套轻量但高价值的训练数据,使智能监考系统能更好地识别作弊动作,尤其是使用手机等严重违规行为。
免费试用