电脑识别图像的极限在何处?

简介:

电脑一直都很擅长视觉识别。有时它们识别一系列图像中某个个体的能力能够与人类相媲美。但相似的结果是否说明了电脑能够模拟人类的视觉系统呢?回答这个问题或许可能会发现电脑系统比不上人类的地方。


《美国科学院院刊》发表了一篇论文提到了电脑和人类视觉系统的不同。


最大的差别可以总结为电脑没有人脑灵活,这同样也是语言识别系统所面临的问题:人类可以通过支离破碎的单词推测出一句话或者一段话的意思而电脑不能。同样在图像识别方面:人类可以可以破碎的线索拼凑出模糊的图像,而电脑却不行。


论文的作者使用一组模糊、复杂的图像来确定计算机视觉模块与人类大脑的差异。他们使用的图像被称为“最小识别结构”(MIRCs)都是太小或者分辨率较低的图像再缩小一点人们都无法识别出来。


他们将这一系大小逐渐减小分辨率逐渐降低的图片呈现给Amazon Mechanical Turk上成千上万的人,确定出能够被人识别出来的最后一个等级的图片。最后一个等级的图片被称为MIRC,比它等级更低的无法识别出来的被称为sub-MIRC。


人和计算机最开始以及最明显的比较是MIRCs和sub-MIRCs的识别。为了测试这一点,研究人员识别出了65%的MIRCs图片,而sub-MIRCs的正确识别率则低于20%。电脑模块的表现则不是很好,它们可以正确的分类出7%的MIRCs和2%的sub-MIRCs。这次的胜利属于人类。


人和电脑在失败开始时的方式也是十分不同的。对于人来说,MIRCs的识别在某个特定的水平上呈现悬崖式的跌落。最后识别出来的图像能被93%的人正确识别,仅仅在一个细小的改变之后,sub-MIRC的图像只能被3%的人识别出来。


而电脑没有显示出这种急剧式的下跌。作者写到:“没有哪一个模块完全复制出人类识别过程中的急剧下跌。”


在经过专业训练后,计算机在识别MIRCs方面表现的更好些,但准确性比人类相比还是较低。关于原因作者说道,这是因为电脑无法识别出图像中的独立部分,但人类可以。例如,在一张模糊的图像中有鹰的头和翅膀,人们可以通过模糊的图像指认出眼睛、嘴或翅膀。作者提到,这种识别是“超过目前神经网络模块的能力”。


总的来说,电脑在图像识别上能做的很好,但并不是十分接近人类处理相同任务时的过程。它们无法使用图像中的独立部分进行信息识别,利用最少信息识别图像上它们不如人类。


为了让计算机模块更好的工作可能需要了解我们的大脑。人类在进行图像识别时,可能先猜测图像是什么,然后再寻找特性验证或反驳最初的想法。如果是这样的话,这与计算机模块的工作程序完全不同。


转自|煎蛋(www.jiandan.com)


往期精彩文章推荐,点击图片可阅读


眼动追踪技术,揭秘男女看点差异


机器视觉与深度神经网络—洗去浮华,一窥珠玑


原文发布时间为:2016-02-27

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
微信文件传输助手文件夹在哪?一起来找找
  微信文件传输助手是微信电脑版与手机微信之间相互传输图片等文件的好工具,但很多童鞋都找不到微信文件传输助手文件夹在哪,就让我们一起找找吧   1.先说说手机微信文件传输助手文件夹在哪吧   文件夹路径为/Tencent/MicroMsg/Download/     2.
4456 0
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
阿里云瑶池在2024云栖大会上重磅发布由Data+AI驱动的多模数据管理平台DMS:OneMeta+OneOps,通过统一、开放、多模的元数据服务实现跨环境、跨引擎、跨实例的统一治理,可支持高达40+种数据源,实现自建、他云数据源的无缝对接,助力业务决策效率提升10倍。
|
安全 网络安全 网络架构
私有IP地址详解:概念、分类与应用
私有IP地址详解:概念、分类与应用
1488 0
|
关系型数据库 OLAP OLTP
深入剖析 OALP 与 OLTP:概念、区别、技术、场景
本文深入剖析了OLTP(在线事务处理)与OLAP(在线分析处理)的概念、区别、技术及应用场景。OLTP专注于实时业务操作,确保数据一致性和高效性,适用于金融、电商等行业;OLAP则侧重于历史数据分析,支持复杂查询和多维分析,助力企业决策。两者在数据特点、系统设计、用户类型及数据库设计上存在显著差异。合理结合OLTP和OLAP,可提升企业的运营效率和决策水平。
2243 15
|
机器学习/深度学习 并行计算 PyTorch
安装PyTorch详细步骤
安装PyTorch时,选择CPU或GPU版本。有Nvidia显卡需装CUDA和cuDNN,可从NVIDIA官网下载CUDA 11.8和对应版本cuDNN。无Nvidia显卡则安装CPU版。安装PyTorch通过conda或pip,GPU版指定`cu118`或`rocm5.4.2`镜像源。验证安装成功使用`torch._version_`和`torch.cuda.is_available()`。
|
Python
解决办法:RuntimeWarning: numpy.dtype size changed, may indicate binary incompatibility. Expected 96
解决办法:RuntimeWarning: numpy.dtype size changed, may indicate binary incompatibility. Expected 96
323 0
|
算法 Oracle 关系型数据库
minus的用法简介
minus的用法简介          “minus”直接翻译为中文是“减”的意思,在Oracle中也是用来做减法操作的,只不过它不是传统意义上对数字的减法,而是对查询结果集的减法。A minus B就意味着将结果集A去除结果集B中所包含的所有记录后的结果,即在A中存在,而在B中不存在的记录。
1729 0
|
19天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
32159 117
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
9天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
4713 4