演讲嘉宾简介:谭剑,阿里巴巴达摩院MIT资深算法专家。
数十款阿里云产品限时折扣中,赶紧点击这里,领劵开始云上实践吧!
简介
本次分享主要围绕机器学习和运筹优化两个方面。它们在学术角度存在很大的重合,也有各自的侧重点。为了更好地帮助大家理解,这里借用心理学教授DANIEL KAHNEMAN的表达。
人有两个系统,System1和System2,分别负责快思考和慢思考。所谓快思考,即普通人在1到2秒之内能做出的决定,反之,如果需要一定的专注和专业,则为慢思考。在过去的六七年中,业界逐渐取得了在机器学习技术上的突破。而在很多传统行业中,关注的更多的是运筹学的内容。在复杂的生产管理和商业运营中,往往需要人在System1和System2之间进行反复的迭代,以取得更优的解。下面将围绕机器学习和运筹优化分享三个具体的实例。
案例介绍
第一个案例是智能农业。主要涉及养殖和种植。背后涉及的知识点是深度学习模型压缩与加速。 第二个案例是计算资源优化。它是运筹学比较关注的问题。第三个案例是新零售。本文将从算法和架构的角度,提供一些新的视角。我们的最终目的是希望通过机器学习使感知模型自动化,同时通过运筹优化使决策过程智能化。
智能农业
下图展示了深度学习模型压缩与加速在应用集团内外的一些落地项目。
下面主要介绍在种植和养殖方面的实际应用。下图展示了“天蓬计划”这个项目是真实的部署在养殖场中的。从右侧这张图展示的是实时监控猪的数量。左侧这张图是用以确定猪的身份的,比如来源、成长曲线等一系列关键的参数信息。
智能农业
通过无人机技术,我们希望能准确地获取农作物的生长状态信息。为承保、理赔提供参考信息,为实时监管提供有利的帮助。
下图展示的也是一个实时部署系统。在下图中,我们识别出了玉米大多正处在开花期。不仅如此,还识别出了数量信息。
下图展示了在烟草种植行业中的应用。左边的图,准确的识别出了棵树,为政府补贴和保险提供关键的信息。右图,烟草种植面积评估,对生产规划有着很重要的参考价值。
相关算法
这些应用的背后都需要强大的算法支持。在云端,我们有自己的训练平台,在移动端有嵌入式系统。但应用时还是存在一些问题亟待解决。
为此我们提出了Gauss作为解决方案。
在服务器端,有Gauss训练平台,集合了目前业界比较先进的算法进行模型的加速。并且,在过程中,我们也在自行开发新的技术,比如模型离散技术。在部署时也进行了优化,比如智能盒子。在之前提到的养猪实例中,就有智能盒子支持的摄像头。
下图列出了高效前向推理中的主要技术要点。
下面介绍有关计算资源优化的内容。由于我们内部管理了大量的数据中心,和海量的服务器,其中有极端复杂的技术。我们的目标是通过数据和算法得到最优的策略。主要的应用有三个。第一,优化预测。即根据趋势,在物体被分配之前,有针对性的找到可能的关注点。第二,优化配置。比如容器资源分配,不能多也不能少。第三,异常检测。在智能运维中有比较重要的应用。
下面给大家详细介绍一下资源调度的问题。它的基本模型非常简单,但在实际应用上是不可行的。主要的问题在于实际应用中异常复杂的约束关系。
下图给出了三个真实的计算资源优化实例。每张图的左边和右边都展示了上线前和上线后的区别。
新零售
下面介绍新零售方面的应用。关键点在于”新”。下面主要从算法架构的角度来讲述对新零售的理解。一个非常成功的案例就是盒马新零售。盒马是一个线上线下合一的自营体系。每一个店面分为两个部分。一部分是前台实体店面,另一个部分是仓储。前台主要服务的是线下的客户,仓储主要服务的是线上的客户。一个盒马店面实际上只有30%左右线下用户,有超过70%的用户是线上的。这种生态系统与传统的电商,比如淘宝,不一样。在线下的角度,它与菜鸟等,也不一样。在算法的角度,线上,不仅要关注用户的偏好,还要关注库存,也就是说线上对线下的库存起到导入的作用。在线下库存的角度,做库存和运营配送时也要考虑线上的作用。线上线下实际上是一个有机的整体,它跟菜鸟、淘宝这样的重量级系统是不太一样的。同时,这也造成了一系列的算法挑战。
第一,线上部分,用户行为偏好问题。我们可以从三个层次来理解这个问题。一,线下活跃但线上沉睡的客户。第二,新用户。第三,活跃用户个性化。
第二个问题是,线上精准营销的匹配问题,如下图。
第三,是线下配送问题。线上会源源不断的产生订单。订单都会有各自的配送时间和地点。这个问题的解决方案就是合批集单。
关于线下集单优化问题,如下图。
最后,从算法角度介绍一下新零售。除了之前提到的线上线下。还有一个问题就是运营。运营可以实时地获取新闻、交通、天气,并输入到线上和线下以起到调控的作用。
最后回归到人,技术最终是为了服务于人。希望能通过机器学习和运筹优化在更多行业起到助力的作用。
本文由云栖志愿小组马JY整理