EMR-DataScience介绍 | Spark“数字人体”AI挑战赛赛题解析二

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 首届Spark“数字人体”AI挑战赛已开启,奖金高达46万,欢迎大家踊跃报名!本次直播将由阿里云人工智能产品专家李博为大家介绍,Data Science节点概述,Data Science节点深度学习框架,PAI-Alink流批一体化机器学习算法平台,AutoML,FaissServer以及PAI-EMS等Data Science原子化组件。

演讲嘉宾简介:李博(花名:傲海),阿里云人工智能产品专家,从事人工智能行业5年,主要负责人工智能平台类产品化建设工作。

以下内容根据演讲视频以及PPT整理而成。

点击链接观看精彩回放:https://developer.aliyun.com/live/43189

本次分享主要围绕以下两个方面:
一、Data Science节点概述
二、Data Science原子化组件介绍

一、Data Science节点概述

EMR-DataScience节点是阿里云机器学习PAI团队结合开源大数据框架和体系,构建的一套以人工智能服务为核心的EMR计算节点。在Spark“数字人体”AI挑战赛之前会为大家创建好这个节点,创建过程中可以进入EMR产品,选择Data Science节点,将使用的组件全部勾选上。这套环境与Hadoop3.X版本做了兼容,也与EMR4.2.X的大版本兼容。

image.png

从下图中可以清楚的看出Data Science节点提供的能力,其目的是为机器学建模提供覆盖全周期的端到端服务。从最下层开始,支持读取底层的HDFS和OSS数据。在计算框架层,分为两部分,一部分是传统的机器学习框架层,通过AlinkServer提供服务,底层是商业化Flink框架叫VVP。另一部分是深度学习框架,包括TensorFlow和PyTorch。用户实际使用过程中可以使用AlinkServer构建传统机器学习模型,也可以基于TensorFlow和PyTorch构建深度学习模型。本次的AI挑战赛以图像为主,使用较多的是TensorFlow和PyTorch。用户可以基于计算框架和算法完成数据的预处理和建模,之后需要做Tunning的工作。阿里云PAI团队提供了调参工具叫AutoML-Tunning,通过AutoML工具实现调参。在算法层,可以使用自己的算法。在服务层,需要将线上的模型与实际工业环境进行对接,有可能会用到PAI-EASCMD或PAI-FaissServer。

image.png

二、Data Science原子化组件介绍

Data Science节点深度学习框架
目前,在平台内部为参赛选手内置了TensorFlow和PyTorch两款深度学习框架,注意需要在python3环境下使用,写代码时要以Python3环境实现。在深度学习建模过程中,会依赖于很多第三方库,这里支持通过pip3 install的方式按照相关依赖。参赛选手可以通过vim开发代码,对vim不熟悉的同学也可以使用zeppeline进行交互式开发,zeppeline可以执行shell操作。

image.png

PAI-Alink流批一体化机器学习算法平台
即使大部分选手不使用传统机器学习算法,但有需要的同学可以使用Alink,不仅支持350多种的传统机器学习算法,算法覆盖数据预处理、特征工程、模型训练、模型评估等机器学习全生命周期,如K-Means,随机森林等等。支持流式算法和离线算法。还可以以拖拽的方式拖拽组件。Alink的优势是支持多种可视化方式,可以很方便的查看实验结果。

image.png

下图展示了Alink实验Demo,蓝色为流式算法,黄色为离线算法:
image.png

AutoML
AutoML是比赛中常用的组件,想拿到好的结果,除了构建模型,还需要进行调参找到合适的算法组合。阿里内部很少人工调参,为了此次AI挑战赛,阿里将AutoML放在了Data Science节点内。AutoML使用时,首先要构建建模的脚本,脚本中有很多参数要调整,如max_depth、learning_rate、train_id等。用户可以在代码中使用parser设置需要参与调参的参数。另外用户需要构建调参的脚本,import pai.automl.hop,将上面的参数做映射,再枚举需要设置的参数。如果不希望使用枚举的方式,可支持使用随机采样方式,用户划定范围,平台支持在区间范围内做随机采样。最终调参后的结果如下图右侧,展示了每种参数组合和最后的结果。注意在第二步中,除了设置枚举值,还需要设置一个metric,指以哪个指标为评估标准,如以准确率还是召回率作为评估标准,甚至用户可以自己自定义metric。AutoML免去了人工调参的工作。

image.png

FaissServer
FaissServer针对部分机器学习应用需要实时计算向量相似度的场景,可以快速计算某个向量其余向量的距离,将全部向量加载到FaissServer里,发送GRPC的查询,反馈TopN向量。DataScience节点内置了FaissServer。用户可以将生成的向量导入FaissServer,构建一个在线TopN向量查询引擎。FaissServer更多的用在图像相似度分析,查询等模块。

image.png

PAI-EAS模型在线服务
EAS可能在决赛阶段会用到。针对的场景主要是如果构建了比较好的模型,如何在业务端,如手机端、IoT,使用到模型。用户通过DataScience内置的PAI-EAS CMD可以将深度学习模型部署成在线服务,通过RestfulAPI服务在业务中使用该模型。EAS支持灰度发布、线上服务监控、版本控制等功能。

image.png

相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
143 10
|
10天前
|
人工智能
RealisHuman:AI 生成的人像不真实?后处理框架帮你修复生成图像中畸形人体部位
RealisHuman 是一个创新的后处理框架,专注于修复生成图像中畸形的人体部位,如手和脸,通过两阶段方法提升图像的真实性。
52 11
RealisHuman:AI 生成的人像不真实?后处理框架帮你修复生成图像中畸形人体部位
|
1月前
|
人工智能 小程序
【一步步开发AI运动小程序】十五、AI运动识别中,如何判断人体站位的远近?
【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力,无需后台支持,具有快速、体验好、易集成等特点。本文介绍如何利用插件判断人体与摄像头的远近,确保人体图像在帧内的比例适中,以优化识别效果。通过`whole`检测规则,分别实现人体过近和过远的判断,并给出相应示例代码。
|
2天前
|
存储 人工智能 NoSQL
Tablestore深度解析:面向AI场景的结构化数据存储最佳实践
《Tablestore深度解析:面向AI场景的结构化数据存储最佳实践》由阿里云专家团队分享,涵盖Tablestore十年发展历程、AI时代多模态数据存储需求、VCU模式优化、向量检索发布及客户最佳实践等内容。Tablestore支持大规模在线数据存储,提供高性价比、高性能和高可用性,特别针对AI场景进行优化,满足结构化与非结构化数据的统一存储和高效检索需求。通过多元化索引和Serverless弹性VCU模式,助力企业实现低成本、灵活扩展的数据管理方案。
24 12
|
20天前
|
人工智能 自然语言处理 Java
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
89 9
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
1月前
|
人工智能 小程序 UED
【一步步开发AI运动小程序】十六、AI运动识别中,如何判断人体站位?
【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力,本地引擎无需后台支持,具备快速、体验好、易集成等优势。本文介绍如何利用插件的`camera-view`功能,通过检测人体站位视角(前、后、左、右),确保运动时的最佳识别率和用户体验。代码示例展示了如何实现视角检查,确保用户正或背对摄像头,为后续运动检测打下基础。
|
1月前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态?
【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力,支持本地原生识别,无需后台服务,具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别,包括视频解码抽帧和人体识别的实现方法。
|
1月前
|
人工智能 自然语言处理 前端开发
OpenAI 12天发布会全解析 | AI大咖说
OpenAI近日宣布将在12个工作日内每天进行一场直播,展示一系列新产品和样品。首日推出GPT-o1正式版,性能大幅提升;次日展示Reinforcement Fine-Tuning技术,提高模型决策质量;第三天推出Sora,实现高质量视频生成;第四天加强Canvas,提升多模态创作效率;第五天发布ChatGPT扩展功能,增强灵活性;第六天推出ChatGPT Vision,实现多模态互动;第七天推出ChatGPT Projects,优化项目管理。这些新技术正改变我们的生活和工作方式。
896 9
|
1月前
|
人工智能 小程序 开发者
【一步步开发AI运动小程序】十一、人体关键点跳跃追踪
本文介绍如何利用“云智AI运动识别小程序插件”开发AI运动小程序,涵盖云上运动会、健身打卡等热门应用场景。通过示例代码展示如何调用插件功能,实现动作追踪与分析,助力开发者快速上手。
|
2月前
|
机器学习/深度学习 人工智能 数据处理
【AI系统】NV Switch 深度解析
英伟达的NVSwitch技术是高性能计算领域的重大突破,旨在解决多GPU系统中数据传输的瓶颈问题。通过提供比PCIe高10倍的带宽,NVLink实现了GPU间的直接数据交换,减少了延迟,提高了吞吐量。NVSwitch则进一步推动了这一技术的发展,支持更多NVLink接口,实现无阻塞的全互联GPU系统,极大提升了数据交换效率和系统灵活性,为构建强大的计算集群奠定了基础。
122 3

推荐镜像

更多