文档备案控制台

开发者社区问答正文

如果Spark Streaming停掉了，如何保证Kafka的重新运作是合理的呢？

如果Spark Streaming停掉了，如何保证Kafka的重新运作是合理的呢？

展开

收起

游客ahv54x37wvm7u 2021-12-13 20:15:14 691 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客lu6fsp6mkfgcm

首先要说一下 Spark 的快速故障恢复机制，在节点出现故障的情况下，传统流处理系统会在其他节点上重启失败的连续算子，并可能冲洗能运行先前数据流处理操作获取部分丢失数据。在此过程中只有该节点重新处理失败的过程。只有在新节点完成故障前所有计算后，整个系统才能够处理其他任务。在 Spark 中，计算将会分成许多小的任务，保证能在任何节点运行后能够正确合并，因此，就算某个节点出现故障，这个节点的任务将均匀地分散到集群中的节点进行计算，相对于传递故障恢复机制能够更快地恢复。

2021-12-13 20:15:25

赞同展开评论

问答分类：

消息中间件分布式计算 Kafka 流计算 Spark 云消息队列 Kafka 版

问答标签：

spark云消息队列 Kafka 版 streaming云消息队列 Kafka 版 spark streaming云消息队列 Kafka 版云消息队列 Kafka 版spark 云消息队列 Kafka 版streaming

问答地址：

开发者社区 > 大数据 > 问答

相关问答

为什么选择从Kafka + Spark Streaming转向Flink？

125

1

0

Spark Structured Streaming 和 Kafka 在数据完整性推理上有何不足？

135

1

0

Kafka如何保证顺序消费？

140

1

0

在OceanBase数据库多个kafka消费者读取ob一张表数据如何保证不重复呀？

200

2

0

我公司现在要把azure上的Kafka集群和spark集群迁移到阿里云上能直接通过服务器迁移中心

229

4

0

spark写kafka，如何让分区分布均衡呢？

392

1

0

flink有api可以像 spark那样批出 kafka数据吗？

1007

6

0

有大佬知道这是怎么回事么 flink读不到kafka数据

1397

1

0

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

1330

4

0

麻烦问一下，我们现在的架构是希望数据统一从 Kafka 中出，但是又想用 Flink CDC，请问

1147

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

如何在阿里云服务器上部署网站？2026年阿里云服务器怎么选？

部署OpenClaw多少钱？2026年阿里云 OpenClaw（Clawdbot）怎么部署及收费标准

阿里云百炼Coding Plan是什么意思？

有传言通义灵码不再增加新功能了，是这样吗？

OpenClaw（原Clawdbot）阿里云一键部署后，2026年有哪些应用场景可用到？

相关文章

数仓-湖仓-湖流，人力家基于阿里云OpenLake架构演进与思考

百万消息积压 4 小时，我靠这套方案快速止血

函数计算异步任务在高并发Agent场景下的幂等性与去重实践（附真实踩坑案例）

诗悦游戏基于DLF与EMR StarRocks降本38%

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

还有其他疑问?