备案控制台

开发者社区问答正文

请教关于是否有除了计算压力以外的反压原因

如题，反压的原因，不考虑计算压力大，并行度不合理等问题。比如是否可能和网络也有关呢？考虑如下case，A->B->C这么一个拓扑，我A（source）结点反压100%，数据彻底不再发送，但B和C都不反压。但是B、C都是非常简单（不可能存在性能问题）。那这还有什么解释吗？

比如，A和B之间网络是否可能出问题呢？

此外，从机器cpu等监控来看，出现反压后，cpu idle提升，即反压到cpu利用率直接降低，且cpu在附近实际无升高的迹象。因此不会是瞬间有压力来导致反压。我当前怀疑和网络有关，有人知道如何确认吗。这种case是否有可能自动恢复呢。

我最近貌似遇到过好几次类似的case，就是反压到直接不发送数据，整个任务彻底停滞。最终解决方式：1 停任务（而且每次停任务都会有1个task长期处于canceling最终导致tm失败） 2 停ok并且重启tm后，重启任务。任务运行恢复正常。

从如上来看，也更进一步证明了不是压力问题，否则为什么我重启就没问题了。不重启则是“一直”反压停滞。*来自志愿者整理的flink邮件归档

展开

收起

毛毛虫雨 2021-12-08 11:28:36 833 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

雪哥哥

我比较倾向于是网络原因。但flink的日志目前无法很明显反映和确认。期望有人从flink反压机制角度考虑下，有没有因为网络“抖动”，比如长连接断开等问题导致反压的case。而且这种情况是否会自动恢复呢？*来自志愿者整理的flink邮件归档

2021-12-08 16:19:37

赞同展开评论

问答分类：

监控流计算实时计算 Flink版

问答地址：

开发者社区 > 大数据 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83693

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3739

1

0

sql server的用户名和密码怎么查啊？

37515

21

0

重启Docker后报错：Error response from daemon

2308

0

0

this xml file does not appear to have any style in

51874

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60932

32

0

OSS的endpoint如何查看

37494

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3660

1

0

LoRa的网络覆盖能力范围是怎么样的？

3169

1

0

阿里云服务器如何重置系统？

24728

4

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

Portainer轻量级图形化监控

CIG重量级监控

Activiti工程分享

如何做好SQL质量监控

Thread.sleep(0) 到底有什么用(读完就懂)

还有其他疑问?