实习博士访谈:我终于拥有了在大学实验室梦寐以求的算力

简介: 正在谷歌实习的慕尼黑工业大学博士在读生 Philip Haeusser 的研究领域是计算机视觉。在这篇访谈中,他谈到了自己在谷歌的实习项目、经历、收获以及如何处理实习和自己博士研究课题的关系。 给我们介绍一下你自己,还有你的博士研究课题吧。


image

正在谷歌实习的慕尼黑工业大学博士在读生 Philip Haeusser 的研究领域是计算机视觉。在这篇访谈中,他谈到了自己在谷歌的实习项目、经历、收获以及如何处理实习和自己博士研究课题的关系。

给我们介绍一下你自己,还有你的博士研究课题吧。

我是 Philip,慕尼黑工业大学博士研究生三年级在读,师从 Daniel Cremers。我的研究领域为计算机视觉,即教计算机理解图像及视频的学科。对于计算机而言,图像及视频只不过是巨大数量的无意义数字的组合。如果把它们以色彩表现出来,人类则很容易分辨图片中的内容。

image
Philip Haeusser

为了教会计算机做同样的事情,我训练神经网络,即一组可以被理解为是“迷你视觉皮层”的模型。目的是为了将组成图像的数字赋予某种意义,如“猫”这样的标签。神经网络在这方面表现惊人。我研究的问题包括光流(从视频的一帧是如何切换到下一帧的)以及域适配(如何使用将一种域的标签,如手写体的图像,运用到另一种域,如谷歌街景里的门牌号)等。

研究以外的时间,我会在我自己的 YouTube 频道“Phil’s Physics”上演示一些实验和分享一些科学知识。

你是如何进入这个领域的呢?

我于2014年在加州大学圣克鲁兹分校获得物理专业硕士学位。当时我在一个跨学科研究小组里参与盲人视网膜移植的项目。我们所做的实验之一需要处理大量的数据,这些数据都非常昂贵,但还无法全部被我们所使用,因为我们的数据处理程序不够复杂。我就是在那时起开始涉猎机器学习和神经网络。我立即被深深吸引并开始联系相关领域的教授。我非常荣幸向 Daniel Cremers 展示了我的工作,并在之后开始读他的博士。

你为什么要来谷歌实习,你的导师是否支持?

深度学习领域发展速度迅猛。几乎每周都有一篇有关神经网络或训练技巧的突破性的新论文发表,而论文作者多来自谷歌,这就使得我对于谷歌在这一领域所做的工作充满了兴趣。在一次夏校的课程里我遇到了 Oliver Bousquet,他对谷歌大脑团队的描述令人惊叹。他也提到了谷歌的实习项目,我立即就申请了。我的导师对此非常支持,能够获取不同的见解,认识更多的人,进行更多的交流总是好的,尤其是在深度学习这样一个全新的领域。此外,在许多大学里计算力无法达到的实验在谷歌都可以获得相关资源并得以完成。

你的实习项目是什么?

我有幸与 DeepDream 创始人之一 Alexander Mordvintsev一起工作。所做的项目涉及用未标记数据和半监督学习训练神经网络的新方法。

我们开发了一种我们称之为“关联学习”的新方法。这有点儿类似“关联游戏”,你听到一个词并马上说出你想到的第一个与之有关联的词。几次“迭代”之后得到的“关联链条”通常出人意料。

我们做的事情非常类似:我们训练一个神经网络来产生允许关联的表征(神经激活模式),关联指标记数据及未标记数据之间的关联。想象从标记数据组中的一个样本到未标记数据组中的另一个样本之间建立一条关联链条;之后,从未标记组到标记组中再建立一条关联,这就形成了一个关联循环。我们就可以将最后得到的样本标签与循环开始时的样本标签做对比。我们的目标在于建立连续一致的关联循环,意指标签是一致的。我们将其表达为成本函数,并证明了该技术对于使用少量标签数据来练分类网络非常有效。

你在谷歌实习期间有发表论文吗?

有的,我完成了一篇论文并提交了 CVPR,在2017年 CVPR 大会上还发表了这篇论文。谷歌资助了我参会的费用。所以在谷歌的实习不仅大幅增长了我在产业里的阅历,还帮助我产出了一篇我自己引以为傲的论文。

你的实习经历与你的博士研究课题相关性如何?

实习之初我们探寻了很多课题,后来从事的这一个与我的博士研究课题非常契合。事实上,我认为即便是参与一个与博士课题并非直接相关的实习项目也会受益良多,例如在编程及项目管理等方面得到的能力训练。

你自己写代码吗?

多亏代码复查,我得以提高了编码水平以及对代码风格及可拓展性有更多考量。谷歌也支持我将自己的代码开源,这也是研究领域惯常的做法。我因此得以继续我的工作,以及同时与全球的研究者分享代码。我还完成了一篇后续论文,关于“关联域适应”,这篇论文也刚被 ICCV 所接受。

这是你第二次在谷歌实习。为什么又回到谷歌苏黎世办公室?

谷歌有太多吸引人的研究项目了,一次实习完全不够,哈哈!说正经的,Sylvain Gelly 的小组邀我参与一个非常有趣的项目。我在去年见过他本人及他的团队,他们都是非常牛的人,我一定不会错过与他们共事的机会。

你在谷歌实习期间获取的最重要的技能是什么?

我认为我的编码能力提高了很多。在谷歌,你有机会向很多超一流的程序员学习,他们的编码质量高,速度快,他们还会帮你提高。与此同时,我还得以与很多不同背景的不同研究小组的成员交流。我遇到的一个产品经理在如何设计成功的产品方面给我很大启发。我还与他们一起参与了 YouTube 新特性的工作。我还在谷歌的健身中心里与 Tough Mudder 的成员一起锻炼了耐力。

实习经历对你的博士研究有何影响?

回顾过去的实习经历,这是我读博经历中重要的里程碑。我当初申请实习也并不是想获得学业的巨大转折或者怎样,不过我返回学校时确实已经收获了非常多的想法和灵感。

回顾过去的经历:博士在读生为什么要申请谷歌的实习?有任何建言吗?

攻读博士期间,有时你会感到困在原地,想要接触不同的东西;有时你想做的实验需要 1000 个GPU;有时你觉得自己已经无所不知,想要挑战自己;有时你想象自己读完博士后的生活,非常想体会狂写代码和对别人产生巨大影响是种什么感觉。理由太多了。谷歌是个允许自我尝试的地方,也许等你回家时,你已经完成了一篇很棒的论文,结交了一群好友,带着一大堆新点子,甚至获得了宝贵的工作机会。

原文发布时间为:2017-08-31
作者:Philip Haeusser
编译:熊笑
本文来自云栖社区合作伙伴“新智元”,了解相关信息可以关注“新智元”微信公众号
原文链接

相关文章
|
人工智能 自动驾驶 机器人
ICLR 2024:模型选择驱动的鲁棒多模态模型推理
【2月更文挑战第24天】ICLR 2024:模型选择驱动的鲁棒多模态模型推理
327 1
ICLR 2024:模型选择驱动的鲁棒多模态模型推理
|
算法
蓝桥杯算法竞赛第一周题型总结
蓝桥杯算法竞赛第一周题型总结
244 0
|
存储 SQL Oracle
Oracle数据库批量删除表、视图、序列、存储过程、函数脚本
Oracle数据库批量删除表、视图、序列、存储过程、函数脚本
411 0
|
Windows
Window winget 包管理工具安装踩坑记录
Window winget 包管理工具安装踩坑记录
1111 0
|
安全 前端开发 Windows
EACCES: permission denied,mkdir … npm install 安装依赖问题解决
可是我们看到上面的提示发现,报的是permission denied,这就很奇怪,为什么我是root用户了,还会没有权限呢?
EACCES: permission denied,mkdir … npm install 安装依赖问题解决
基于若依ruoyi-nbcio支持flowable流程增加自定义业务表单(三)
基于若依ruoyi-nbcio支持flowable流程增加自定义业务表单(三)
771 1
|
5月前
|
人工智能
1688新灯塔体系全面升级!深度解析三大巨变与商家应对策略
11月7日,1688平台正式发布了“新灯塔”服务体系的全新升级公告。此次升级并非微调,而是从指标模型、权重分配到考核精度的一次系统性重构,旨在更精准地衡量与驱动商家服务能力的提升。本文将为您深度剖析此次升级的核心变化,并为企业提供切实可行的运营建议。
|
8月前
|
负载均衡 Java Nacos
微服务架构中的服务注册与发现流程
本内容介绍了微服务架构中的服务注册与发现流程,包括服务注册中心(如Nacos)、服务提供者和调用者的角色分工。服务启动时自动注册信息至注册中心,调用者通过客户端负载均衡(如Spring Cloud Loadbalancer)选取服务实例进行远程调用。同时,内容还讲解了OpenFeign的工作原理,其作为HTTP客户端集成负载均衡,通过接口定义、代理生成、请求发送与结果解析,实现服务间的高效通信。
|
8月前
|
Linux iOS开发 开发者
Linux桌面版,又被喷了!
罗马不是一天建成的,想要拥有更多的大众用户,在市场份额突破个位数,就需要虚心倾听他们的声音,学习赛道中的优秀者。
|
Ubuntu Java Linux
如何检查 Java 版本是否兼容
要检查Java版本是否兼容,可在命令行输入“java -version”查看当前安装的Java版本,然后对比目标应用所需的Java版本,确保其满足要求。
1120 1