大多数人懒得给照片加标签。如果你属于这一类(大概率事件),那么你一定知道搜索某张照片有多辛苦。 但这很有可能即将成为过去。
本周,Facebook 披露了其机器学习平台 Lumos 的更多信息: Lumos 将使用户们利用相片内容进行搜索,而不是图片名称或是标签。
Facebook 应用机器学习负责人 Joaquin Quiñonero Candela 解释说:
“换句话说,搜索‘黑衬衫照片‘时,系统能识别出每张照片里是否有黑衬衫,并据此搜索;即便照片并没有被添加标签也没有关系。”
Lumos 利用了计算机视觉技术来识别照片中的人、动物和一系列其他物体。但它远不止于此,而是更进一大步,能识别出照片中发生的“事”。所以在识别某相片中有某个人之外,它还能够判断该人是在行走、骑马、弹琴还是在做其他的事情。雷锋网按,Facebook 并没有提供一张 Lumos 所能识别的人物行为列表,因此目前并不清楚它究竟神通广大到了何种地步,以及识别的正确率如何,会不会犯下“妖精打架”那样的错误。假使正确率尚在接受范围以内,相比目前各照片管理软件还停留于人脸识别的层次(除了 Google Photos),便是极大的进步,其技术可能成为 Google Photos 的直接竞争对手。
Lumos,一个计算机视觉平台
介绍 Lumos,就不得不提 FBLearner Flow。Facebook 使用了它的 FBLearner Flow 平台来开发 Lumos。前者是一个通用型的机器学习流水线(pipeline),开发它的初衷是让 Facebook 工程师们能同时执行多个 AI 项目,而不需要每次都借助必要的硬件。据 Facebook 透露,现在每月有超过 120 万个 AI 实验在 FBLearner Flow 上运行。包括 Lumos 在内的这些项目,能够获取社交网络和 app 上永不停歇的数据流。
雷锋网获知,一开始,FBLearner Flow 平台只是 Facebook AI 研究部门(FAIR)的一个小研究项目。但当它达到量产规模后,它和开发团队被转移到了应用机器学习团队。现在,FBLearner Flow 已是 Facebook 计算机视觉团队的引擎。
建立在 FBLearner Flow 基础上的 Lumos,是一个 Facebook 为处理图像和视频理解任务而开发的平台。Facebook 的工程师并不需要接受过深度学习或者计算机视觉培训,就能使用 Lumos 训练、布置新模型。 Lumos 平台在不断改进,这主要有两种途径:
导入新添加标记的数据;
利用 Facebook 应用中有注解的数据。
深度学习的进步使得开发者在图像分类上取得巨大进展——类似于“图片中有什么”、“东西在哪?”这样的问题被系统以前所未有的精确度回答出来。 Facebook 表示,通过设计出能对给定图片中的物体进行检测、分离的新技术,他们大幅推动了在该领域的研究。
当 Facebook 应用这些技术时,相片会穿过一个深度学习引擎,后者能分离图像、识别物体和场景、向照片加入更多含义。这产生出任何 Facebook 产品、服务都能使用的丰富数据。
前景
Joaquin Quiñonero Candela 还表示,Lumos 涵盖的技术有一系列广阔的应用场景,远不止于单纯地优化图像搜索。他进一步解释:
“出于‘争议内容检测,反垃圾信息和自动图像抓取’等目的,已经有超过 200 个视觉模型被十几只不同团队训练出来,并布置于 Lumos。它们的应用领域十分广,从我们的 Connectivity Labs (互联实验室)到搜索团队,再到 Accessibility (可达性)团队,大家都在用 Lumos 的技术。”
虽然 Facebook 在 Lumos 上取得可喜进展,但它还称不上是独步天下。谷歌一直在开发图像扫描 AI 来提高图像搜索。去年,谷歌声称它的 Inception v3 AI 能够以 93.9% 的精确度抓取图片内容。雷锋网(公众号:雷锋网)消息,最近 Inception v3 又有突破:在它基础之上将开发能预警皮肤癌的新 AI。
via facebook,siliconangle
相关文章:
IBM Watson 视觉识别新高度,采用 GPUs 分布式网络看懂图片内涵
本文作者:三川
本文转自雷锋网禁止二次转载,原文链接