上个月,阿里巴巴发布2018年博士后招聘启事,针对机器智能、机器学习、数据挖掘、机器人、高性能计算、通信技术、人机交互、物联网等研究方向,邀请海内外博士加入阿里博士后科研工作站。
阿里博士后工作站的优势在于真实丰富的业务场景和数据,这对技术研究至关重要,却为高校和科研院所欠缺。因此,打通学术界和工业界就很有必要。这正是阿里这些年努力的方向。
阿里巴巴博士后“企业导师”名单
早在2008年,阿里就建立了博士后工作站。2017年10月,立足基础科学、颠覆性技术和应用技术研究,“致力于探索科技未知”的阿里巴巴达摩院成立。得益于此,阿里可以为工作站提供顶尖科学家组成的“明星导师团”:世界顶级量子科学家施尧耘、美国密歇根州立大学前终身教授金榕、亚马逊前最高级别华人科学家任小枫、新加坡南洋理工大学终身教授王刚……在阿里,可以担任企业博士后导师的海内外学术带头人、研发管理人才已有百余人。
针对人才,阿里也开出了丰厚的条件。除了提供“具有市场竞争力的薪酬福利”,协助申请国家级、省级和市级多种科研经费之外,阿里还将协助博士后解决北京或杭州户口。
阿里博士后工作站是阿里博士人才引进和培养的重要平台。现有北京站和杭州站,并与中国科学院、清华大学、浙江大学、上海交通大学、新加坡南洋理工大学等顶尖高校达成了联合培养计划。目前阿里技术团队拥有数百名博士。未来3年博士后工作站计划引入200位青年科学家。
那么,在阿里做博士后究竟是一种怎样的体验?两位阿里博士后和我们聊了聊他们的故事。
做真正影响用户的技术和产品
—— 薛少飞
(阿里北京站第一批出站博士后)
我是去年11月份出站的,现在的Title是阿里达摩院机器智能技术实验室算法专家,主要负责语音识别的技术创新和产品落地。我在这个领域已经做了快十年——本科是中国科学技术大学电子信息专业,大三就进了实验室,后来保送硕博连读,在中科大一直读完博士。
薛少飞(左一)参加ICASSP2017国际学术会议
我不完全是个技术男。我喜欢文学、历史,会看很多人文的书,我相信技术能够解决很多的问题:比如可以用规则和统计建模方法解决的问题,技术很大程度上都能够解决。但我觉得技术的作用并不是要取代人类,而是将人类从重复性劳动中解放出来。读了研究生之后,我开始想自己到底要做什么样的工作。过程中也经历了很多尝试,最后我给自己的定位是——做能真正影响用户的技术和产品。
到阿里做博士后,我看重的是阿里这个平台。它有很多的应用场景,有很多的数据。我们做语音识别需要大数据以及资源、平台,阿里都具备,而且我在进入之前就对我们团队有所了解,这是一群能够做出事情的人。
我是阿里北京站第一批博士后,2015年9月进站。刚到阿里做的第一个项目就很有成就感。那是一个智能客服的项目,在用户咨询人工客服之前,先去分析用户的行为,猜测他遇到了哪些问题,推荐给用户一些解决方案。这在当年的“双11”就体现了价值。做项目过程中跟支付宝团队有很多协作,会和他们一块儿头脑风暴。这个过程非常有自我价值实现的感觉,一个做技术的人最希望的就是自己做的东西能够体现出它的价值。
2016年阿里云年会上,我们做的语音识别系统和金牌速记员去做了一个PK,在识别准确率上以微弱优势战胜了人类速记员。我们在业界首个采用了LC-BLSTM声学模型。在当时这个语音识别模型很前沿,在学术研究上也是正在进行当中的。我们首先需要从学术的角度去判断这个东西会不会比现有的模型有一个明显的提升,然后你要迅速地去实现和证明,并进行落地。后来这套模型也用到了其他的产品里面。
LC-BLSTM声学模型相关的技术干货:
为提升在线语音识别效率,他创造了两种升级版算法模型
薛少飞(左九)与他所在的机器智能技术实验室团队
现在我的工作与博后期间的研究是有延续的。这两年我做了好几个远场语音识别的项目,最近在云栖大会上亮相的“阿里AI收银员”、“上海地铁语音购票机”都是我参与的项目,我负责其中的远场语音识别部分。上海地铁站的环境非常嘈杂,在那种环境下作出一个非常准确的识别,其实非常难。而且真正的用户行为可能和我们想象的很不一样。比如开始我们会设想很多正常交互的场景,但实际上用户可能很随意,比如只说了地铁站名字,或者中间带许多语气词和停顿。这个过程中我们踩了很多坑。
这是一个根据用户反馈不断迭代的过程。在大学里不会有这些机会。在学校里进行研究的时候,通常你是在做某一个点,其他的都是fix(固定)的——在这种情况下进行这个点的创新。在阿里你会跳出来,跳到一个系统的层面去考虑问题。这个可能涉及学术创新、工程创新、方法创新……它会更全面地要求你,思考的方式是完全不一样的。
到工业界做科研是趋势
——裴昶华
(阿里北京站博士后)
我是2017年7月进站的,经历比较简单,清华计算机2008级本科,然后直博,2017年从清华毕业。我导师现在跟阿里、腾讯和其他公司也有一些深度的合作,他喜欢科研跟企业结合的方式。受导师影响,我也觉得科研应该做一些实际的问题,真正能够影响人们现实生活的问题。
裴昶华参加阿里年会
博士的时候,我研究怎么将机器智能用到网络领域,提高网络性能和可用性。来阿里之后,在搜索事业部,研究个性化推荐的问题。很多人都问我,你博士毕业了为什么不去学校,他们理解不了博士为什么要去工业界。大家一般认为去工业界就是写代码,科研能力相当于荒废了。其实不是这样的,我们也写论文,前段时间我刚投了一篇论文。以后企业招的博士后会越来越多,到工业界做科研肯定是一种趋势了。
在阿里的好处是,你不用刻意地去找问题,问题就自动地找上你了。
去年“双11”之前,我们做了一个百万级QPS(每秒查询率)的智能调度系统。“双11”有很多的用户会买买买,后台服务器压力就会突增。以前都是人工调度,看某个场景,比如手淘购物车——压力太大了,就多加点机器。有个人拿个本,在那儿记。我们就想,这是可以用算法解决的。当时就联合另一个团队做了一个调度算法。这个智能调度系统,并不是我们想着去做它,是备战“双11”的时候,人力成本太大,自然而然就想起这个问题。
2017年“双11”平稳度过后的凌晨,裴昶华(左二)与参与项目的其他同事合影留念
在阿里,现实问题推动创新的例子有很多。就在上个月,我们做了一个手机淘宝的项目,为了让推荐给用户的商品更精准,我们用了一个新模型——强化学习模型,算法上线之后,商品点击率提升了7%。这个工作现在我在总结,准备投一篇论文。
到阿里做博士后,对我的影响是比在学校时更重视细节了。在公司你做的项目是真实在线的,做产品对细节要求很严。比如这个调度系统,一旦出什么问题的话,那就会给公司带来直接的损失。那段时间,整天脑子里都是这个,睡觉想着这个东西,去食堂、在办公室里都是想着这个事情,想着哪里有遗漏,哪里还没解。后来“双11”平稳度过,凌晨从办公楼出来,当时就觉得很有成就感。自己做的东西被用上了,用到人们的生活里面,是一种不一样的感觉。