FFA 2022 专场解读 - 流批一体 & 平台建设 & AI 特征工程

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: Flink Forward Asia 2022 流批一体 & 平台建设 & AI 特征工程专场内容节选

主kv

Flink Forward Asia 2022 将于 11 月 26-27 日在线上举办,议程内容正式上线!

FFA 2022 官网:https://flink-forward.org.cn/

流批一体

流批一体专场由来自快手、京东、数禾、Shopee、蚂蚁集团等企业的技术专家为你呈现流批一体的大规模应用实践案例,详细拆解落地难点和应对方案。另有来自阿里巴巴的技术专家手把手教你如何基于 Hive SQL on Flink 构建流批一体引擎。

流批一体架构在快手的实践和思考

张静|快手技术专家,Apache Flink/Calcite Committer

本次演讲分享将包括:

  1. 流批一体的背景
  2. 流批一体在快手落地思路 & 分阶段建设的目标
  3. 第一阶段(加强 Flink 批能力建设)在快手的实践 & 挑战 & 进展
  4. 第二阶段(业务视角的流批一体)的挑战和相关的开放性问题

蚂蚁实时低代码研发和流批一体的应用实践

马年圣|蚂蚁集团数据技术专家,实时数仓架构师

王 鑫|蚂蚁集团高级技术专家,Apache Storm PMC,Apache RocketMQ Committer,Apache IoTDB Committer

蚂蚁实时研发体系经过一年多的升级,已经形成了基于元表资产+Flink 引擎的实时研发模式,并在此基础上构建了实时的资产消费和保障体系。再往前一步,我们探索并落地了蚂蚁的低代码研发和流批一体研发能力,来降低实时研发门槛并提效实时开发。本次 FFA 期望能够向大家介绍这两种能力的构建背景(业务/技术)、构建思路、核心能力和应用场景案例,来详细分析这两个能力构建的细节。

Flink 流批一体方案在数禾的实践

杨涵冰|上海数禾信息科技有限公司,大数据架构师

在如今互联网金融服务场景中,特征、模型、决策的实时性变得越来越重要,各场景对于实时化的需求也越来越多。

在对各场景的实时化实践中,我们遇到了一些共有的问题:离线、实时数据口径不一致;离线、实时逻辑不一致;批量、点查等查询场景多样;实时流特有概念较难理解,开发门槛较高;实时流回溯测试困难等问题。

本次分享将介绍数禾利用 Flink 流批一体方案解决上述问题的实践经验。

流批一体在 AI 核心电商领域的探索与实践

祝海峰|阿里巴巴高级技术专家

搜索、推荐、广告等核心电商领域,涉及海量的电商、用户行为等数据,需要支持大规模深度模型参数更新,是一个典型的批次/实时计算结合的场景,阿里智能引擎事业部基于大数据存储和计算引擎技术(Flink),针对复杂业务特点,简化用户 ETL 开发流程,探索出一套行之有效的批流一体技术,支撑了阿里巴巴集团数千个业务场景,具备 PB 级批处理,百万 TPS 吞吐,秒级延迟的处理能力。

Hive SQL on Flink 构建流批一体引擎

罗宇侠|阿里云 开发工程师

方盛凯|阿里云 开发工程师

在 Flink 1.16 中,社区通过加强对 Hive Dialect 的支持以及引进了 SQL Gateway 进一步提升了 Flink 对于 Hive 兼容性,帮助用户方便地将已有的 Hive 批作业迁移到 Flink 上以构建流批一体的计算引擎。 在大部份的场景下,用户只需要将提交作业的地址更改为 Flink SQL Gateway 就可以将原本的 Hive 作业改为通过 Flink 来执行,做到了无缝切换。同时用户既可以使用 Hive SQL 也可以使用 Flink SQL 的语法写流式任务。

在本篇演讲过程之中,将介绍以下内容:

  1. 构建流批一体引擎的挑战
  2. Hive SQL on Flink 构建流批一体引擎
  3. 流批一体引擎的收益
  4. Demo
  5. 未来展望

Flink 流批一体在 Shopee 的大规模实践

李明昆|Shopee 高级研发工程师,Flink Remote Shuffle Contributor

Shopee 各个业务线对 Flink 流批一体有很多需求,目前 Flink 流批一体已经具有支持大规模生产的能力,可以给数据开发的带来极大价值。

Shopee 的 Flink 团队大力发掘流批一体的价值,这次演讲将对这些落地实践做详细介绍。

  1. 流批一体在 Shopee 的应用场景
  2. 批处理能力的生产优化
  3. 与离线生态的完全集成
  4. 平台在流批一体上的建设和演进
  5. 未来规划

平台建设

平台建设专场由来自爱奇艺、知乎、Dinky 社区、货拉拉、美团、联通、小米、Apache StreamPark 社区、阿里巴巴、蚂蚁集团的技术专家分享基于 Apache Flink 的实时计算平台演进与实践。

阿里实时计算平台建设实践

周凯波|阿里云高级技术专家,Apache Flink Contributor

随着业务的快速发展,集团各个 BU 对实时计算的需求越来越强烈,平台化能显著提高研发效率,降低运维成本。本次分享主要介绍阿里实时计算平台从 2.0 基于 Yarn 的架构到 3.0 云原生时代的演进,以及在 3.0 平台上一些核心功能的建设实践,如健康分,智能诊断,细粒度资源,作业探查以及企业级安全的建设等。

Flink 在蚂蚁大规模金融场景的平台建设

李志刚|蚂蚁集团 高级技术专家,蚂蚁集团流计算平台负责人

介绍 Flink 在蚂蚁的实践情况,主要包含 Flink on k8s,on k8s 集群模式,热启动,自动化调优,流控,流批一体等技术

爱奇艺统一实时计算平台建设

李恒|爱奇艺资深研发工程师

为了更好地满足实时业务的需求,实现公司降本增效的目标,爱奇艺大数据团队对实时服务体系进行了系统的整合和优化设计。本次分享将介绍团队基于 Flink 建设统一实时计算平台的经验,以及通过数据湖和 Flink CDC 技术进行架构升级的实践。将分为三部分:

  1. 基于 Flink 的统一实时计算平台建设:旧服务整合和任务迁移,实现数据和任务统一维护,实现降本增效的目标。
  2. 基于 Flink 和 iceberg 的流批一体实践:平台化建设和用户行为数据近实时数仓建设。
  3. Flink CDC 的实践:典型业务基于 Flink CDC 的数据架构升级。

Flink 实时计算平台在知乎演进

贾承昆|知乎大数据架构负责人

  1. 实时计算平台在知乎的发展
  2. Flink SQL + 一站式元数据管理平台化
  3. 可运维性提升和保障
  4. Flink CDC 平台化

Dinky 在 Flink 开发模式的开源探索实践

亓文凯|开源 Dinky Maintainer

Dinky 是一个开源 FlinkSQL 平台,由于它具备自身 Flink 环境,可以构建各种定制业务,所以它的能力不仅仅局限于作业提交运维,而是在 Flink 环境和生态应用带来了无限可能。本次分享将介绍 Dinky 在 Flink 新开发模式的开源探索实践。

  1. Dinky & Flink 介绍
  2. FlinkSQL 开发调试
  3. FlinkCatalog 管理
  4. FlinkCDC 整库实时入仓入湖
  5. 未来规划

货拉拉基于 Flink 计算引擎的应用与优化实践

王世涛|货拉拉大数据实时研发平台负责人

  1. Flink 在货拉拉的使用现状
  2. 性能优化主题 1:udf/udtf 维表化 + 经纬度预处理缓存
  3. 性能优化主题 2:利用 binlog 数据中 old 属性,减少聚合函数计算量
  4. 数据确定性优化主题:通用版本 Flink Per-partition watermark 问题解决方案
  5. 数据准确性优化主题:group by 状态过期,延迟数据导致聚合数据覆盖问题
  6. 稳定性优化主题 1:多场景脏数据容忍
  7. 稳定性优化主题 2:异步 sink
  8. 平台化方案 1:指标监控方案
  9. 平台化方案 2:hdfs/doris 分区数据完整性可见性方案
  10. 未来展望

Flink SQL 在美团实时数仓生产中的增强与实践

董剑辉|美团数据系统研发工程师

张 彬|美团数据系统研发工程师

  1. Flink SQL 算子属性可灵活配置的能力建设
  2. Flink SQL 实时作业变更后从状态恢复的能力建设
  3. Flink SQL 实时作业语义正确性问题排查的能力建设

联通 Flink 实时计算平台化运维实践

穆纯进|联通数科实时计算团队负责人,Apache StreamPark Committer

  1. 业务介绍: 实时计算平台提供了在海量实时数据下打造平台级多种实时计算任务管理能力,集成了 50 多种实时数据源,日均 2.3 万亿的数据处理,支撑了 10000+的数据服务订阅。
  2. Flink 作业运维背景:支撑需求多、实时作业多、研发人员多、使用用户多、上线频率高、稳定要求高、监控延迟低、作业上线流程长、作业用途不明确、作业异常责任人不明确。
  3. 基于 StreamPark 打造一站式的面向 Flink 实时计算作业的 DevOps 平台和作业管理平台,集成了项目创建、代码编译、作业创建、环境设置、资源配置、作业启停、监控告警、日志管理、UDF、版本管理、支持 YARN/Kubernetes/Remote 等多集群的管理功能。

小米基于 Flink 的实时数仓建设实践

周超|小米软件开发工程师

在实时数仓场景下,小米选择 Flink 作为实时计算引擎,数据湖 Iceberg 作为存储底座,在流批一体方向不断探索,本次分享围绕小米在实时数仓方面的探索与实践展开,主要涉及:

  1. 小米数仓架构演进
  2. 基于 Flink+Iceberg 的实时数仓架构升级实践,提升链路稳定性与实时性
  3. 针对 Flink 状态过期而导致计算不确定性问题,介绍流批一体的解决方案
  4. 未来规划

Apache Streampark 让 Flink 开发管理更简单

王华杰|Apache StreamPark PPMC, 社区发起人

Apache StreamPark(Incubating) 于 2022 年 9 月 1 号正式通过投票成为 Apache 软件基金会的孵化项目, 初衷是让流处理更简单,StreamPark 规范了项目的配置, 定义了最佳的编程方式, 提供了一系列开箱即用的 Connectors 和一套快速开发的脚手架, 使用 StreamPark 开发,可以极大降低学习成本和开发门槛, 让开发者只用关心最核心的业务。

另一方面,在实时作业开发部署管理方面, 没有针对 Flink 作业的专业管理平台,这是企业在实践中会遇到的一道坎。StreamPark 提供专业的作业开发管理平台,包括但不限于作业开发、调试、交互查询、部署、操作、运维、实时数仓&流式数仓等, 是一个完整的解决方案, 这次演讲将对这些落地实践做详细介绍。

  1. 项目简介
  2. 核心能力
  3. 实现原理
  4. 最佳实践
  5. 新功能预览
  6. 未来规划

AI 特征工程

AI 特征工程专场将由来自腾讯、字节跳动、阿里巴巴的技术专家带来基于 Flink 的实时特征工程平台建设思路与落地实践。

FeatHub: 流批一体的实时特征工程平台

林东|Apache Kafka Committer 和 PMC 成员

本次演讲中,我们将介绍 FeatHub,一个由阿里云自研并开源的实时特征平台。我们将介绍 FeatHub 的架构设计,已经完成的工作,以及近期的发展计划。

我们为 FeatHub 设计了易于使用的 Python SDK,来方便用户开发,分享,以及部署特征工程作业到生产环境。FeatHub 目前支持使用 Flink 作为计算引擎来完成流批一体的特征计算,支持在 Kafka,文件系统等多种存储引擎中读取和存储特征。用户可以使用声明式的 API 来定义特征,无需担心特征穿越的问题,也无需使用相对复杂的底层计算引擎 API 来计算特征。我们希望通过提供这些功能,来提升特征工程作业的开发效率,并推动实时特征工程的应用发展。

我们将介绍 FeatHub 在运满帮的实践经验,并展望 FeatHub 未来的发展方向。FeatHub 已经在 https://github.com/alibaba/feathub 开源。欢迎大家尝试使用并提供反馈。

微信安全基于 Flink 实时特征开发平台实践

李天旺|腾讯专家级工程师

介绍微信安全基于 Flink 建设一站式实时特征开发平台实践;通过提供常用组件,方便重用能力与快速开发,并实现业务人员无需熟悉 Flink、无需写代码会简单 SQL 就能快速开发;再通过画布的形式组装组件,使业务逻辑更清晰、方便不同业务之间借鉴,赋能其他相似业务场景。

议题大纲如下:

  1. 风控实时特征开发的诉求与挑战
  2. 高效的一站式实时特征开发平台建设思路
  3. 线上运营过程遇到挑战
  4. 质量保障

基于 Flink ML 搭建的智能运维算法服务及应用

张颖莹|阿里云计算平台算法专家

  1. 大数据平台运维场景对算法的需求特点(实时、海量、多源异构数据)
  2. 智能运维算法在大数据平台运维业务场景的应用案例和典型模型。
  3. 传统算法架构的局限性
  4. 使用 Flink ML 搭建智能运维算法服务具体流程和收益

字节跳动十亿级特征计算平台的建设和应用

廖嘉逸|字节跳动推荐特征生产方向负责人

刘首维|字节跳动推荐架构工程师

字节跳动推荐架构在去年开始着手构建了流批一体的特征生产系统,基于 Flink 和强大的 State 能力功能实现了有状态的窗口统计类特征,并在 ETL 特征场景实现了 Flink Streaming & Batch 的流批一体。随着业务的逐步上量和场景的不断丰富,系统又在易用性、性能、机器学习生态支持上,出现了新的问题和挑战。我们在特征系统推广的过程中遇到了算法工程师调优实时特征的成本过高、生产链路无法和特征回溯打通、长周期的实时特征无法初始化、特征类型支持不足等问题。通过对流批一体架构的多次迭代,我们在计算层面引入了跨作业的流批一体 Planner、状态 Bootstrap 等能力,帮助特征生产系统的生态更上了一个台阶。

  1. 背景
  2. 流批一体架构回顾
  3. 流批一体 Planner
  4. 问题与挑战
  5. 未来规划

以上为 Flink Forward Asia 2022 流批一体 & 平台建设 & AI 特征工程专场内容节选,了解更多大会详情可点击下方链接:

https://flink-forward.org.cn/

移动端建议观看 ApacheFlink 视频号预约观看:
视频号

点击预约直播~


img

活动推荐

阿里云基于 Apache Flink 构建的企业级产品-实时计算Flink版现开启活动:
99 元试用 实时计算Flink版(包年包月、10CU)即有机会获得 Flink 独家定制卫衣;另包 3 个月及以上还有 85 折优惠!
了解活动详情:https://www.aliyun.com/product/bigdata/sc

image.png

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
3月前
|
人工智能 运维 监控
首个云上 AI 原生全栈可观测平台来了!
9月21日,2024 云栖大会,阿里云发布全新的 AI 原生全栈可观测平台,首次实现云上 AI 大模型从训练到推理再到应用的全链路实时观测、告警与诊断。
180 11
|
1月前
|
存储 人工智能 文字识别
利用AI能力平台实现档案馆纸质文件的智能化数字处理
在传统档案馆中,纸质文件管理面临诸多挑战。AI能力平台利用OCR技术,通过图像扫描、预处理、边界检测、文字与图片分离、文字识别及结果存储等步骤,实现高效数字化转型,大幅提升档案处理效率和准确性。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI驱动的个性化学习平台构建###
【10月更文挑战第29天】 本文将深入探讨如何利用人工智能技术,特别是机器学习与大数据分析,构建一个能够提供高度个性化学习体验的在线平台。我们将分析当前在线教育的挑战,提出通过智能算法实现内容定制、学习路径优化及实时反馈机制的技术方案,以期为不同背景和需求的学习者创造更加高效、互动的学习环境。 ###
58 3
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。
|
1月前
|
SQL 人工智能 DataWorks
DataWorks:新一代 Data+AI 数据开发与数据治理平台演进
本文介绍了阿里云 DataWorks 在 DA 数智大会 2024 上的最新进展,包括新一代智能数据开发平台 DataWorks Data Studio、全新升级的 DataWorks Copilot 智能助手、数据资产治理、全面云原生转型以及更开放的开发者体验。这些更新旨在提升数据开发和治理的效率,助力企业实现数据价值最大化和智能化转型。
310 5
|
3月前
|
人工智能 JSON 数据格式
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
【9月更文挑战第6天】RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
|
2月前
|
人工智能 Docker 容器
一、轻松部署的大模型开发平台dify.ai
一、轻松部署的大模型开发平台dify.ai
134 0
|
3月前
|
人工智能 分布式计算 大数据
AI Native平台,跨越AI应用从创新到生产的鸿沟
2024年是AI应用的元年,以大模型为中心的 AI Native 应用大爆发正在从理想变成现实。云计算带来的应用创新潮,经历了虚拟机时代和云原生时代,正在全面拥抱以大模型为核心的 AI Native 阶段,推动大数据与AI的工作流前所未有地紧密结合。领先大模型、高效的AI计算平台和统一的大数据平台是 AI Native 应用广泛落地背后不可获缺的要素。 9月20日,2024云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布大数据AI平台全面升级,为 AI Native 应用大爆发提供坚实的平台支撑。
|
3月前
|
人工智能 监控 Cloud Native
【涂鸦即艺术】基于云应用开发平台 CAP 部署 AI 实时生图绘板
本实验介绍如何使用阿里云的云原生应用开发平台CAP、函数计算FC和日志服务SLS,三步创建AI实时绘画平台。
【涂鸦即艺术】基于云应用开发平台 CAP 部署 AI 实时生图绘板
|
3月前
|
数据采集 机器学习/深度学习 人工智能
云栖实录 | GenAI 时代 AI Infra 工程技术趋势与平台演进
本文根据2024云栖大会实录整理而成,演讲信息如下: 演讲人:林伟 | 阿里云智能集团研究员、阿里云人工智能平台 PAI 负责人;黄博远|阿里云智能集团资深产品专家、阿里云人工智能平台 PAI 产品负责人 活动:2024 云栖大会 - AI Infra 核心技术专场、人工智能平台 PAI 年度发布专场