flink背压问题解决记录

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: flink做流表维表关联,每天TB级数据量

flink做流表维表关联,每天TB级数据量,维表存储在mysql。程序提交后,查看背压率为1.严重背压了
flink源是kafka,sink到hdfs。用到算子filter、process算子
filter按规则过滤
process关联维表,并作数据转换拼接
从flinkUI中看到filter方框的背压率为1,查看参数是output产生的背压,也就是process算子产生的背压。
优化手段:
checkpoint存储到rockDB,缩短checkpoint时间
给维表添加缓存,先读缓存,读不到再读数据库
mysql匹配字段添加索引
提高process算子并行度

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
目录
相关文章
|
6月前
|
消息中间件 缓存 监控
Flink背压原理以及解决优化
Flink背压原理以及解决优化
409 0
|
6月前
|
消息中间件 Java Kafka
Flink背压问题之checkpoint超时如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
|
6月前
|
消息中间件 监控 Java
一次线上Flink 背压情况分析之重新认识java dump 文件
一次线上Flink 背压情况分析之重新认识java dump 文件
205 0
|
消息中间件 存储 监控
【Flink-API】取消Kafka记录偏移量,flink管理偏移量
【Flink-API】取消Kafka记录偏移量,flink管理偏移量
337 0
【Flink-API】取消Kafka记录偏移量,flink管理偏移量
|
监控 Java 分布式数据库
Flink/Hbase - Sink 背压100% 与 hbase.util.RetryCounter.sleepUntilNextRetry 异常分析与排查
Flink-hbase 任务 hbase.util.RetryCounter.sleepUntilNextRetry 堆栈问题分析与排查。
448 0
Flink/Hbase - Sink 背压100% 与 hbase.util.RetryCounter.sleepUntilNextRetry 异常分析与排查
|
监控 Java Apache
记录一次Flink作业异常的排查过程
记录一次Flink作业异常的排查过程
记录一次Flink作业异常的排查过程
|
流计算 缓存 监控
深入了解 Flink 网络栈(二):监控、指标和处理背压
在之前的文章中,我们从高级抽象到底层细节各个层面全面介绍了 Flink 网络栈的工作机制。作为这一系列的第二篇文章,本文将在第一篇的基础上更进一步,主要探讨如何监视与网络相关的指标,从而识别背压等因素带来的影响,或找出吞吐量和延迟的瓶颈所在。
|
Java 流计算
Flink学习笔记记录
Flink学习笔记记录
2249 0
|
Java 流计算
Flink如何应对背压问题
经常有人会问Flink如何处理背压问题。其实,答案很简单:Flink没用使用任何通用方案来解决这个问题,因为那根本不需要那样的方案。它利用自身作为一个纯数据流引擎的优势来优雅地响应背压问题。这篇文章,我们将介绍背压问题,然后我们将深挖Flink的运行时如何在task之间传输数据缓冲区内的数据以及流数据如何自然地两端降速来应对背压,最终将以一个小示例来演示它。
2095 0
|
2月前
|
运维 数据处理 数据安全/隐私保护
阿里云实时计算Flink版测评报告
该测评报告详细介绍了阿里云实时计算Flink版在用户行为分析与标签画像中的应用实践,展示了其毫秒级的数据处理能力和高效的开发流程。报告还全面评测了该服务在稳定性、性能、开发运维及安全性方面的卓越表现,并对比自建Flink集群的优势。最后,报告评估了其成本效益,强调了其灵活扩展性和高投资回报率,适合各类实时数据处理需求。