【阿里算法专家】深度学习将业界技术迭代提升100倍,GraphDL 应用广阔

简介: IJCAI 2018 现场,阿里妈妈以 Ad Tech 为主题举办了 Workshop,阿里妈妈资深算法专家朱小强、高级算法专家林伟,分享了将深度学习引入工业级展示广告和搜索广告领域的创新与探索。

【新智元导读】IJCAI 2018 现场,阿里妈妈以 Ad Tech 为主题举办了 Workshop,阿里妈妈资深算法专家朱小强、高级算法专家林伟,分享了将深度学习引入工业级展示广告和搜索广告领域的创新与探索。

随着人工智能产学研的不断融合,企业与学术会议之间的合作也更加频繁和多样。此前,新智元曾经报道过,IJCAI国际广告算法大赛,中国团队包揽冠亚季军。这个竞赛实际上就是阿里集团与IJCAI的一个合作项目,阿里通过IJCAI的平台吸引更多人关注阿里,IJCAI则通过阿里的大赛吸引更多人关注和支持IJCAI。

IJCAI(International Joint Conference on Artificial Intelligence)被认为是人工智能领域最顶级的学术会议之一,涵盖机器学习、计算可持续性、图像识别、语音技术、视频技术等,对全球人工智能行业具有巨大影响力。

今年的合作竞赛由阿里妈妈承办。作为阿里巴巴旗下大数据营销平台,阿里妈妈身处于阿里巴巴庞大的交易场景之中,在人工智能领域也早有布局,构建了超大规模的学习模型,每天训练近100T的数据,有上千亿的样本。

IJCAI 2018 现场,阿里妈妈以 Ad Tech 为主题开展了workshop。阿里妈妈资深算法专家朱小强、高级算法专家林伟,以展示广告技术的两个最重要技术模块——Matching和Ranking为例,分享了他们在将深度学习引入工业级展示广告和搜索广告领域所做的创新与探索。

深度学习将业界技术迭代提升10~100倍

朱小强在演讲中表示,展示广告是互联网行业的主要营销模式之一。阿里巴巴有各种不同的展示广告形式,比如横幅、单品、信息流帖子等等。每天有数亿的用户访问阿里的系统,团队需要针对每位用户的个性化兴趣偏好,在几十毫秒内,从数千万广告集合中,寻找最优匹配结果进行展示。

超大规模的数据以及问题的高度非线性,对展示广告技术构成了巨大的挑战。过去两年里,阿里妈妈团队创造性地将深度学习引入到展示广告技术中,自主研发了一系列面向工业级尺度的端到端深度模型,推动了展示广告技术的全面革新,达到了世界领先的水平。

朱小强认为,深度学习给工业界掀起了一场生产力革命。在深度学习时代,模型的设计变成组件化,优化的方法变成标准化,而且设计和优化是解耦的。这些特点驱动了以深度学习为代表的AI技术迅速普及,而且将整个业界的技术迭代速度提升了1-2个数量级。

“过去两三年,深度学习在广告、搜索和推荐等核心工业界场景中野蛮生长,掀起了一股1.0的掘金浪潮;未来,我们判断深度学习将进一步完善为工业级基础设施,迈入2.0的工匠时代,技术的发展将由粗犷颠覆转变为精细化打磨。”

朱小强说:“10多年前,机器学习大规模地被引入到核心工业领域,由此开创了一个技术的黄金发展周期,我们预期深度学习技术会继续引领新的一轮技术增长。”

基于图的深度学习方法有广阔的应用空间

林伟在演讲中表示,搜索广告场景下,传统的观点一直认为匹配(Matching)的主要优化目标是寻找最相关的候选广告集。他们团队重新定义了这个目标,认为在电商场景下,Matching的主要优化目标是寻找相关性满足约束下,最符合业务目标(例如期望收益等)的候选广告集。基于对目标的重新认识,最近几年Matching算法的改进,大幅提升了直通车的营收。

林伟介绍,Matching主要问题可抽象为:1)对用户意图和候选广告之间是否可以建立链接的识别,以及2)对链接强度的预测。

图(Graph)是一种非常适合用来刻画这个问题的结构,基于图的深度学习方法在Matching上拥有广阔的应用空间。

目前,阿里妈妈已经构建了一套支持超大规模异构图表征学习的算法,并在Matching上成功落地。未来,他们将进一步深耕图深度学习(Graph-based Deep Learning)的方法及应用。

如今在淘宝场景中,图像因素越来越重要,用户的行为模式也越来越复杂。对于排序问题(Ranking),传统的一些模型在识别用户意图上存在诸多限制,需要更精巧和更强大的模型来更好地理解用户。阿里妈妈团队分别提出了很好的图像网络和记忆网络设计方法,增加Ranking模型识别用户意图的能力,经过实际测试都取得了不错的效果。

同时,此前在戛纳国际创意节首发的AI智能文案,在IJCAI也再度引发关注。这个产品基于深度神经网络的Sequence2Sequence模型,融合了注意力机制、位置编码、copy机制等,让机器模仿人写文案。

朱小强认为,“技术本身并不复杂和高深,但因为做到了从场景的实际需求出发,用技术和算法来驱动优化,也让技术和算法施展出最大的空间。”

本届 IJCAI 大会首席赞助官、悉尼科技大学杰出教授张成奇,阿里巴巴人工智能实验室研究员聂再清也到场做了分享。

原文发布时间为:2018-07-20
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。
原文链接:【阿里算法专家】深度学习将业界技术迭代提升100倍,GraphDL 应用广阔

相关文章
|
8月前
|
运维 监控 JavaScript
基于 Node.js 图结构的局域网设备拓扑分析算法在局域网内监控软件中的应用研究
本文探讨图结构在局域网监控系统中的应用,通过Node.js实现设备拓扑建模、路径分析与故障定位,提升网络可视化、可追溯性与运维效率,结合模拟实验验证其高效性与准确性。
457 3
|
8月前
|
机器学习/深度学习 资源调度 算法
遗传算法模型深度解析与实战应用
摘要 遗传算法(GA)作为一种受生物进化启发的优化算法,在复杂问题求解中展现出独特优势。本文系统介绍了GA的核心理论、实现细节和应用经验。算法通过模拟自然选择机制,利用选择、交叉、变异三大操作在解空间中进行全局搜索。与梯度下降等传统方法相比,GA不依赖目标函数的连续性或可微性,特别适合处理离散优化、多目标优化等复杂问题。文中详细阐述了染色体编码、适应度函数设计、遗传操作实现等关键技术,并提供了Python代码实现示例。实践表明,GA的成功应用关键在于平衡探索与开发,通过精心调参维持种群多样性同时确保收敛效率
|
8月前
|
机器学习/深度学习 边缘计算 人工智能
粒子群算法模型深度解析与实战应用
蒋星熠Jaxonic是一位深耕智能优化算法领域多年的技术探索者,专注于粒子群优化(PSO)算法的研究与应用。他深入剖析了PSO的数学模型、核心公式及实现方法,并通过大量实践验证了其在神经网络优化、工程设计等复杂问题上的卓越性能。本文全面展示了PSO的理论基础、改进策略与前沿发展方向,为读者提供了一份详尽的技术指南。
粒子群算法模型深度解析与实战应用
|
8月前
|
机器学习/深度学习 算法 安全
小场景大市场:猫狗识别算法在宠物智能设备中的应用
将猫狗识别算法应用于宠物智能设备,是AIoT领域的重要垂直场景。本文从核心技术、应用场景、挑战与趋势四个方面,全面解析这一融合算法、硬件与用户体验的系统工程。
710 0
|
机器学习/深度学习 运维 安全
深度学习在安全事件检测中的应用:守护数字世界的利器
深度学习在安全事件检测中的应用:守护数字世界的利器
568 22
|
机器学习/深度学习 编解码 人工智能
计算机视觉五大技术——深度学习在图像处理中的应用
深度学习利用多层神经网络实现人工智能,计算机视觉是其重要应用之一。图像分类通过卷积神经网络(CNN)判断图片类别,如“猫”或“狗”。目标检测不仅识别物体,还确定其位置,R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类,FCN开创像素级分类范式,DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割,Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等,OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步,广泛应用于实际场景。
1498 64
计算机视觉五大技术——深度学习在图像处理中的应用
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
1345 6
|
机器学习/深度学习 人工智能 运维
深度学习在流量监控中的革命性应用
深度学习在流量监控中的革命性应用
509 40
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
414 0
|
机器学习/深度学习 运维 资源调度
深度学习在资源利用率优化中的应用:让服务器更聪明
深度学习在资源利用率优化中的应用:让服务器更聪明
679 6