计算机在识别图像时“看到”了什么?

简介: 计算机在识别图像时“看到”了什么?

图像识别技术近来进步飞速。去年,微软和谷歌展示了能比人类更准确地识别图像的系统。


这些进步得益于一个叫做深度学习的技术,它涉及将数据通过模拟神经元的网络,以培养该网络在未来过滤数据(更多信息见“Teaching Machines to Understand Us”)。深度学习就是你可以使用关键字搜索存储在谷歌的照片(更多信息),Facebook 能识别你照片中你朋友的原因。 在图像识别上使用深度学习也使得机器人和自动驾驶汽车更有可行性,它甚至可以彻底改变医学(更多信息)。

DDDDDDDDDD.jpg

图像识别技术的能力和灵活性来自于, 当人工神经网络收到很多图像和图像类别的信息时,它可以自动计算出来重要的视觉特征。在深度学习中使用的神经网络被布置成不同的层,数据一层一层根据顺序通过。在训练过程中,在神经网络中的不同的层成为专门识别不同类型的视觉特征的网络层。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。


“这些神经网络相比传统的计算机视觉方法,是一个巨大的飞跃,因为它们直接从数据中得出结果。”马修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在内的公司组织和搜索照片和视频的服务) 的 CEO 说。程序员们曾经需要写出寻找视觉特征所需的数学程序,然而这些程序并不能创造出很多有用的产品。


当蔡勒还是一个研究生的时候, 他在纽约大学与罗博·宏泰合作开发了一种可视化神经网络运作的方法。在这个链接中的幻灯片中的图像将带你来到这个深度学习网络的内部,这个用了130万张照片训练过,打败了人类的图像识别神经网络。该网络识别了 1000 个截然不同的物件,包括蚊帐和蚊子,而幻灯片上显示了每个图像中最强烈的激活神经元网络的一个网络层的视觉特征。

相关文章
经验大分享:QML动态标注线
经验大分享:QML动态标注线
142 0
|
存储 数据安全/隐私保护 Docker
开源网盘程序,自建网盘指南
ShowTa是一款开源的个人和企业网盘程序,提供简洁界面和多种功能,如预览文件、在线播放视频、设置文件夹密码等。它支持Docker部署、WebDAV协议,可将网盘映射到本地磁盘,并能挂载阿里云盘。通过WebDAV,用户可在电视上观看阿里云盘内容。了解更多信息,请访问[GitHub](https://github.com/bosnzt/showta)和[演示地址](https://www.showta.cc)。
|
机器学习/深度学习 传感器 人工智能
图像识别算法汇总
图像识别算法汇总
2221 0
|
小程序 开发者
钉钉应用上架流程
钉钉应用上架流程
986 3
|
机器学习/深度学习 传感器 安全
【刚度计算】基于石川公式法齿轮时变啮合刚度计算附matlab代码
【刚度计算】基于石川公式法齿轮时变啮合刚度计算附matlab代码
|
存储
修改nuget包默认存放路径,避免增加C盘的负担
修改nuget包默认存放路径,避免增加C盘的负担
558 0
修改nuget包默认存放路径,避免增加C盘的负担
|
前端开发 JavaScript Java
简单介绍、Tomcat配置与使用
Tomcat 服务器是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP 程序的首选。
简单介绍、Tomcat配置与使用
|
XML 存储 SQL
Google Architecture Components应用框架初探
Google Architecture Components应用框架初探
471 0
Google Architecture Components应用框架初探
|
自然语言处理 数据可视化 BI
Python大佬分析了15万歌词,告诉你民谣歌手们到底在唱什么
前几天小编写了两篇利用Python采集网易云歌词和利用Python采集网易云音乐歌曲文章,相信小伙伴们经过实践之后都能够顺利的采集到自己想要听的歌曲。下面的歌词是小编采集的民谣歌词,经过统计,歌词量达到将近15万。 心血来潮,想利用Python来分析一下民谣歌手们到底在唱些什么鬼~~
325 0
Python大佬分析了15万歌词,告诉你民谣歌手们到底在唱什么