Flink 新一代流计算和容错问题之在有状态的算子中,状态更新是怎么记录的

简介: Flink 新一代流计算和容错问题之在有状态的算子中,状态更新是怎么记录的

问题一:Buffer Debloating 如何帮助 Unaligned Checkpoint?


Buffer Debloating 如何帮助 Unaligned Checkpoint?


参考回答:

Buffer Debloating 通过减少中间流动的数据量,使得 Unaligned Checkpoint 在做快照时需要额外存储的中间数据也变少,从而加快 Checkpoint 的完成速度。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/671169



问题二:在 Buffer Debloating 中,Debloat Target 指的是什么?


在 Buffer Debloating 中,Debloat Target 指的是什么?


参考回答:

在 Buffer Debloating 中,Debloat Target 是指上游缓存“预期时间”内下游能处理的数据量。这个设置帮助动态调整缓存大小。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/671170



问题三:Generalized Log-Based Incremental Checkpoint 的主要目的是什么?


Generalized Log-Based Incremental Checkpoint 的主要目的是什么?


参考回答:

Generalized Log-Based Incremental Checkpoint 的主要目的是控制每次快照时需要上传的数据量,通过将 Checkpointing 过程和 State Backend 存储 Compaction 剥离开来,使得 Checkpoint 变得更加稳定和高频,从而缩短端到端的延迟。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/671171



问题四:在有状态的算子中,状态更新是如何记录的?


在有状态的算子中,状态更新是如何记录的?


参考回答:

在有状态的算子中,状态更新会记录在 State Table 里。当 Checkpointing 发生时,这个 State Table 会被刷到磁盘上,并异步上传到远端存储。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/671172



问题五:为什么 RocksDB 的增量 Checkpoint 有时并不比完整 Checkpoint 更高效?


为什么 RocksDB 的增量 Checkpoint 有时并不比完整 Checkpoint 更高效?


参考回答:

虽然 RocksDB 支持增量 Checkpoint,但一旦触发多层 Compaction,就会生成很多新的文件,这可能导致增量的部分甚至比一个完整的 Checkpoint 更大,因此上传时间依然不可控。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/671173

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
存储 分布式计算 流计算
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。
3760 73
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
|
消息中间件 存储 NoSQL
Flink(十二)【容错机制】(4)
Flink(十二)【容错机制】
|
调度 流计算
Flink 新一代流计算和容错问题之Flink 中的数据可以分为什么类型
Flink 新一代流计算和容错问题之Flink 中的数据可以分为什么类型
|
Cloud Native 安全 调度
Flink 新一代流计算和容错问题之Flink 通过云原生技术改进容错设计要如何操作
Flink 新一代流计算和容错问题之Flink 通过云原生技术改进容错设计要如何操作
132 2
|
运维 Cloud Native 数据库
Flink 新一代流计算和容错问题之将 Flink 的容错与云原生的弹性扩缩容相结合要怎么操作
Flink 新一代流计算和容错问题之将 Flink 的容错与云原生的弹性扩缩容相结合要怎么操作
135 1
|
存储 流计算
Flink 新一代流计算和容错问题之Flink 通过 Key Group 管理状态是怎么操作的
Flink 新一代流计算和容错问题之Flink 通过 Key Group 管理状态是怎么操作的
209 1
|
存储 调度 流计算
Flink 新一代流计算和容错问题之如何实现 Generalized Log-Based Incremental Checkpoint
Flink 新一代流计算和容错问题之如何实现 Generalized Log-Based Incremental Checkpoint
170 1
|
缓存 流计算
Flink 新一代流计算和容错问题之 Flink 作业的 local buffer pool 的 size 要如何估算
Flink 新一代流计算和容错问题之 Flink 作业的 local buffer pool 的 size 要如何估算
197 1
|
存储 缓存 数据处理
Flink 新一代流计算和容错问题之中间数据流动缓慢导致 Checkpoint 慢的问题要如何解决
Flink 新一代流计算和容错问题之中间数据流动缓慢导致 Checkpoint 慢的问题要如何解决
184 1
|
消息中间件 分布式计算 Kafka
流计算引擎数据问题之MillWheel 和 Flink 实现数据流的同步处理如何解决
流计算引擎数据问题之MillWheel 和 Flink 实现数据流的同步处理如何解决
102 0

热门文章

最新文章