如何利用大数据创造商业价值?阿里云在人工智能领域做了哪些创新和实践?如何利用大数据为机场管理保驾护航?
11月15日晚,阿里云数据科学家闫新发(算者)在华南理工大学举行的广东航空大数据创新大赛专场技术讲座现场给学子们做了一场精彩分享——《阿里云人工智能实战案例及技术能力》,现场座无虚席,气氛热烈。
闫新发,花名算者,人如其名:在2013-2015年期间,个人几乎包揽了阿里巴巴集团内部大数据竞赛的所有冠军;2015年带领团队在世界推荐算法比赛 (ACM RecSys Challenge,算法领域的世锦赛)取得第二名的成绩,2016年该团队在该比赛获得世界第一名。
大数据+算法
在阿里巴巴集团,算法创造了什么价值?
作巨额交易背后,阿里不仅提供商品,依靠推荐系统,更做到了基于个性推荐的千人前面:首页个性化,上亿用户和十余亿商品之间的精准匹配,提供差异化的服务,犹如消费者进入商场的差那就已经被传送到不同的楼层;店铺个性化犹如进入了商场的某个店面,其中不管是商品摆放还是风格都是根据用户的喜好定制。
最简单的例子就是女性用户和男性用户来到同一家淘宝店铺看到的是不一样的店铺承接页,女性看到是可爱的粉色页面,是女装,男生看到的可能是庄重的黑色页面和男装,这就好比每个人进了一家线下店看到的都是不一样的装修风格和不同的商品陈列,从而让用户产生更多的共鸣,有了更好的购物心情。
千人千面在有效提高转化率的同时也为用户提供了更愉悦的体验。正如马老师所说:“今天的成绩已经很满意了!双11已经不是数字上看销售额是多少,我们最希望双11给所有的买家和卖家带来快乐,快乐是我们最希望能够量化的东西。”
电商之外,大数据在基础产业亦发挥作用。比如在新能源领域,对风力进行预测,解决风力和火力的均衡问题,实现电网并网负载的均衡;在农业、林业领域,通过图像识别进行病虫害检测、产量预测等。与此同时,即便是日常生活中,算法亦无处不在,就比如旅游中常常购买特价机票,实际上是预测了未来三天的低价,再以未来某一天的低价的轻微上浮在当前进行出售。
在云计算领域,借助阿里云孵化器这一平台,大数据已改变许多行业,比如针对行业通用问题,建构企业图谱,让企业有谱,让舆情可控;在传统零售业预测销量;针对创业类公司,利用调度算法创新其商业模式;利用技术服务客户,利用云计算平台进行3D建模,提高效率;在传统工业通过算法优化提高工艺良品率。
从科技到普惠
“人工智能是基础,行业才是成为数据科学家的关键。”这是阿里云人工智能首席科学家、小Ai之父闵万里博士在内部常说的一句话。
▲阿里云大数据孵化器团队首席数据科学家闵万里(山景)博士▲
阿里巴巴从来就不仅是一家科技公司。计算,一定要成为普惠科技,成为各行各业能够简单获取的能力,才能不断去创造“无法计算的价值”。通过算者的详尽介绍可以发现,过去我们对大数据的研究多侧重于理念、发展未来、研究性产品,现在的重点更在于大数据的落地,阿里云致力于将它的能力赋能给各个行业,在各个产业落地。
而在这里,就不得不提阿里云的一支神秘“特种部队”——阿里云大数据孵化器。这是一群由科学家组成的团队,通过利用阿里云强大的计算平台加上顶级专业的算法与行业数据有机的融合,正在积极探索人工智能在各行业中的应用,不断的挖掘数据的价值,实现用数据驱动行业创新,用数据提升业务效率。
新生代成长
分享过程中,算者对同学们提出期待:借助阿里云天池平台提供的丰富资源,希望学生拓宽眼界,除了学好理论知识,做好研究之外,还要多看看外面的世界,思考大数据有可能在哪些行业落地,自己将来会进入哪个行业,如何将对技术的热爱与职业发展相结合。埋头看书的同时也要抬头看路。
而借助阿里云基于海量数据处理服务MaxCompute搭建的天池大数据平台(tianchi.aliyun.com),向社会提供科研数据和开放数据处理服务,旨在打造“数据众智、众创”第一平台,目前,天池平台拥有5万名高质量数据人才,是最大的数据爱好者社区。天池大数据竞赛是基于天池平台开展的数据类竞赛活动,包括算法大赛、可视化大赛和程序设计大赛等多种形式的竞赛,向社会提供科研和实际产业的数据,大赛让所有参与者有机会运用其设计的算法解决各类社会生活问题和商业世界中的实际问题。
正如此次2016“数据引领飞粤云端”广东航空大数据创新大赛,在广东省政府和阿里巴巴集团的有力推动下,联合广东省经信委、惠州市人民政府、阿里云、广州机场白云科技有限公司共同举办,首次开放航空数据,不仅是一场比赛,更进一步是培养大数据应用人才,鼓励数据创新创业实践,推动民航业大数据技术成果转化和落地。
(大)数据+(高级)算法=(小)目标
回到问题的原点,是不忘初心。大数据的“初心”是明确其目标,再去思考所需的数据和算法。目标的优化能带来方法的改进和效率的提升。比如人工智能阿尔法狗下围棋,待解决问题是如何做决策,落哪一个棋子是最优选择,解决方法是通过不断强化学习,而这整个过程都是围绕赢得博弈这个目标进行的。在我们日常生活中、各行各业的运行中有各种各样的目标,这些目标有大有小,有宏观为微观,大到如何让出行更顺畅,小到如何通过图像识别技术自动识别几百万公里线缆上的某一处是否有厘米级的破损,让我们一起探索用大数据来实现它。
正如马老师在2015年云栖大会的主题演讲中所总结的那样:中国一定会成为一个计算大国,因为未来的数据是一种生产资料,而未来的生产力就是计算能力和在座的所有创业者的创新能力,企业家精神。