EMR-DataScience介绍 | Spark“数字人体”AI挑战赛赛题解析二

简介: 首届Spark“数字人体”AI挑战赛已开启,奖金高达46万,欢迎大家踊跃报名!本次直播将由阿里云人工智能产品专家李博为大家介绍,Data Science节点概述,Data Science节点深度学习框架,PAI-Alink流批一体化机器学习算法平台,AutoML,FaissServer以及PAI-EMS等Data Science原子化组件。

演讲嘉宾简介:李博(花名:傲海),阿里云人工智能产品专家,从事人工智能行业5年,主要负责人工智能平台类产品化建设工作。

以下内容根据演讲视频以及PPT整理而成。

点击链接观看精彩回放:https://developer.aliyun.com/live/43189

本次分享主要围绕以下两个方面:
一、Data Science节点概述
二、Data Science原子化组件介绍

一、Data Science节点概述

EMR-DataScience节点是阿里云机器学习PAI团队结合开源大数据框架和体系,构建的一套以人工智能服务为核心的EMR计算节点。在Spark“数字人体”AI挑战赛之前会为大家创建好这个节点,创建过程中可以进入EMR产品,选择Data Science节点,将使用的组件全部勾选上。这套环境与Hadoop3.X版本做了兼容,也与EMR4.2.X的大版本兼容。

image.png

从下图中可以清楚的看出Data Science节点提供的能力,其目的是为机器学建模提供覆盖全周期的端到端服务。从最下层开始,支持读取底层的HDFS和OSS数据。在计算框架层,分为两部分,一部分是传统的机器学习框架层,通过AlinkServer提供服务,底层是商业化Flink框架叫VVP。另一部分是深度学习框架,包括TensorFlow和PyTorch。用户实际使用过程中可以使用AlinkServer构建传统机器学习模型,也可以基于TensorFlow和PyTorch构建深度学习模型。本次的AI挑战赛以图像为主,使用较多的是TensorFlow和PyTorch。用户可以基于计算框架和算法完成数据的预处理和建模,之后需要做Tunning的工作。阿里云PAI团队提供了调参工具叫AutoML-Tunning,通过AutoML工具实现调参。在算法层,可以使用自己的算法。在服务层,需要将线上的模型与实际工业环境进行对接,有可能会用到PAI-EASCMD或PAI-FaissServer。

image.png

二、Data Science原子化组件介绍

Data Science节点深度学习框架
目前,在平台内部为参赛选手内置了TensorFlow和PyTorch两款深度学习框架,注意需要在python3环境下使用,写代码时要以Python3环境实现。在深度学习建模过程中,会依赖于很多第三方库,这里支持通过pip3 install的方式按照相关依赖。参赛选手可以通过vim开发代码,对vim不熟悉的同学也可以使用zeppeline进行交互式开发,zeppeline可以执行shell操作。

image.png

PAI-Alink流批一体化机器学习算法平台
即使大部分选手不使用传统机器学习算法,但有需要的同学可以使用Alink,不仅支持350多种的传统机器学习算法,算法覆盖数据预处理、特征工程、模型训练、模型评估等机器学习全生命周期,如K-Means,随机森林等等。支持流式算法和离线算法。还可以以拖拽的方式拖拽组件。Alink的优势是支持多种可视化方式,可以很方便的查看实验结果。

image.png

下图展示了Alink实验Demo,蓝色为流式算法,黄色为离线算法:
image.png

AutoML
AutoML是比赛中常用的组件,想拿到好的结果,除了构建模型,还需要进行调参找到合适的算法组合。阿里内部很少人工调参,为了此次AI挑战赛,阿里将AutoML放在了Data Science节点内。AutoML使用时,首先要构建建模的脚本,脚本中有很多参数要调整,如max_depth、learning_rate、train_id等。用户可以在代码中使用parser设置需要参与调参的参数。另外用户需要构建调参的脚本,import pai.automl.hop,将上面的参数做映射,再枚举需要设置的参数。如果不希望使用枚举的方式,可支持使用随机采样方式,用户划定范围,平台支持在区间范围内做随机采样。最终调参后的结果如下图右侧,展示了每种参数组合和最后的结果。注意在第二步中,除了设置枚举值,还需要设置一个metric,指以哪个指标为评估标准,如以准确率还是召回率作为评估标准,甚至用户可以自己自定义metric。AutoML免去了人工调参的工作。

image.png

FaissServer
FaissServer针对部分机器学习应用需要实时计算向量相似度的场景,可以快速计算某个向量其余向量的距离,将全部向量加载到FaissServer里,发送GRPC的查询,反馈TopN向量。DataScience节点内置了FaissServer。用户可以将生成的向量导入FaissServer,构建一个在线TopN向量查询引擎。FaissServer更多的用在图像相似度分析,查询等模块。

image.png

PAI-EAS模型在线服务
EAS可能在决赛阶段会用到。针对的场景主要是如果构建了比较好的模型,如何在业务端,如手机端、IoT,使用到模型。用户通过DataScience内置的PAI-EAS CMD可以将深度学习模型部署成在线服务,通过RestfulAPI服务在业务中使用该模型。EAS支持灰度发布、线上服务监控、版本控制等功能。

image.png

相关文章
人工智能 关系型数据库 分布式数据库
446 19
|
6月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
1854 0
|
8月前
|
人工智能 边缘计算 API
AI协作的四大支柱:协议详解与应用场景全解析​
本文深入解析Agentic AI协议的四大核心协议——MCP、A2A、ACP与ANP,涵盖技术特性、应用场景及选型指南,助你掌握多代理协作系统构建要点。
788 6
|
7月前
|
机器学习/深度学习 人工智能 运维
运维告警别乱飞了!AI智能报警案例解析
运维告警别乱飞了!AI智能报警案例解析
716 0
|
人工智能 搜索推荐 JavaScript
【Geo专家于磊】深度解析:Geo优化中的Schema标签,如何让你的内容在AI时代脱颖而出?
微笑老师详解Geo优化中Schema标签的写法,揭示如何通过结构化数据提升AI时代下的内容可见性。从选择类型、填写关键属性到JSON-LD格式应用与测试验证,全面掌握Geo优化核心技巧,助力本地商家在搜索结果中脱颖而出。(238字)
621 4
|
7月前
|
人工智能 数据可视化 数据处理
AI智能体框架怎么选?7个主流工具详细对比解析
大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。
1710 3
AI智能体框架怎么选?7个主流工具详细对比解析
|
6月前
|
人工智能 自然语言处理 机器人
2025年度最具影响力AI副业变现榜单:十大达人深度解析
2025年AI深度赋能商业,十位标杆人物引领副业变现新潮。武彬以AIGC+电商降本90%居首,王兴兴、姜大昕等聚焦机器人与大模型,龍新远、数字人博主等则掘金情感与教育赛道,揭示技术普惠与场景融合的爆发潜力。(238字)
1341 2
|
7月前
|
人工智能 安全 数据可视化
深度解析三大AI协议:MCP、ACP与A2A,看懂智能代理的通信法则
在AI代理技术快速发展的背景下,MCP、ACP和A2A三大协议成为推动AI生态协作的关键标准。MCP(模型上下文协议)为大模型提供标准化信息接口,提升AI处理外部数据的效率;ACP(代理通信协议)专注于边缘设备间的低延迟通信,实现本地系统的高效协同;A2A(代理对代理协议)则构建跨平台通信标准,打通不同AI系统的协作壁垒。三者各司其职,共同推动AI从独立工具向智能协作团队演进,提升整体智能化水平与应用灵活性。
3247 2
深度解析三大AI协议:MCP、ACP与A2A,看懂智能代理的通信法则
|
7月前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
1407 6

推荐镜像

更多
  • DNS