文档备案控制台

开发者社区云原生正文

线上偶然会出现一批 Invoke remote method timeout，但服务本身没有超时

环境信息

Dubbo version: 2.7.6 Operating System version: Linux 3.10.0-1062.9.1.el7.x86_64 Java version: 1.8.0_212

步骤重现

线上正常调用偶然出现一批调用失败，调用方超时报 Invoke remote method timeout 我们排除了 GC、部署等一切有可能阻塞的因素，从网络的监控也未看到可疑的情况。

实际执行情况

有时线上会突然报一堆 RPC 调用超时，经过查看调用链路，绝大部分情况如下：

提问75.png

被调用方在调用方已经超时在之后才收到请求。现在超时时间设定为 3s，被调用方会在 3s 多一点接收到请求。而在之前超时为 1s 时，被调用方会在 1s 多一点接收到请求。

这个问题最棘手的点在于，它的出现没有任何规律，不同服务、不同时间段都有可能发生，有时只针对一个调用方，有时候是所有调用方。

我们怀疑是网络问题，但是粗粒度的 TCP 网络监控看不出任何问题，也不可能在不知道问题何时复现的情况下去抓包。假设是网络问题的话，我们又能从哪方面去改善此类问题呢？

这个问题已经困扰了我们半年，希望得到帮助。

原提问者GitHub用户liuzhiguo630

展开

收起

大圣东游 2023-05-11 20:00:21 676 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

后端老大

我提供一个思路仅供参考：如果默认使用dubbo配置的连接数，即一个consumer和一个provider只有一条TCP连接，可以增加日志或看下带宽，是不是出现了大数据包传输。如果某条内容数据内容比较大，比如整条数据超过1M，在高qps情况下，必然出现大量超时。

微观上，单条TCP通道上，还是顺序发送消息的，并且传输层会把单条数据分为每个包1500字节，共N个。在这个数据在被完整传输完之前，由于TCP可靠性、有序性的保证，其他的请求都只能排队等着，所以就超时了。。

原回答者GitHub用户fsx379

2023-05-12 11:09:12

赞同展开评论

问答分类：

监控网络协议 Dubbo Java Linux 应用服务中间件

问答地址：

开发者社区 > 云原生 > 问答

相关问答

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

272139

11

0

购买阿里国外的云服务器是否可以访问谷歌？

88641

49

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

138235

16

0

据说在家办公的程序员是这样写代码的？

1795784

70

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

4622

18

0

this xml file does not appear to have any style in

56521

11

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11775

2

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

36715

17

0

如何升级配置

538622

15

0

LoRa的网络覆盖能力范围是怎么样的？

4679

1

0

云原生

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践，通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式，助力制造业企业高效上云，实现系统稳定、应用敏捷智能。拥抱云原生，让创新无处不在。

我要提问

相关文章

分布式事务解决方案Seata之AT事务

超详细OpenClaw全场景部署教程：树莓派/阿里云MacOS/Linux/Windows11搭建+集成Skill零成本实现+百炼API配置攻略

OpenClaw公众号自动发文全流程：阿里云/本地部署OpenClaw+Skill无缝集成+百炼API配置详解教程

使用Java对接印度股票市场API 实时数据、IPO和K线（Kline）的PHP对接方案

别再无效刷题了！2026校招笔试高频考点权重排序（附大厂内部评分标准）

相关解决方案

更多

通义灵码一站式定制专属MCP服务

千问与 LangChain 搭建对话服务

精准识别，轻松集成人脸比对服务

对话分析，让服务更懂客户

高效构建全球网络服务性能观测体系

热门讨论

热门文章

为什么在mvnrepository中找不到2.1.0版本的一些模块，例如（nacos-nacos命名

spring-cloud-alibaba nacos配置2.1.0-RELEASE导入不了

sentinel-transport-common HTTP security | sentinel

为什么 Sentinel Transport 模块里自己用原生 Socket 或 Netty 自己

maven配置了这个，No versions available for com.aliyun:ev

Sentinel Transport 同一台机器起相同的端口不报错？

springmvc接入sentinel对资源做限流不生效

springBoot项目接入sentinel需要引入这个包吗？

默认情况下，从函数计算FC侧操作，创建的nas是性能型，能否手动创建容量型规格nas在FC中使用呢？

请问主域名备案了，子域名还要备案吗？

展开全部

Docker CE 镜像源站

重塑云上的 Java 语言

微服务（Microservice）那点事

3分钟，了解阿里云热门开发者工具 Cloud Toolkit

当 Kubernetes 遇到阿里云

基于Docker容器的，Jenkins、GitLab构建持续集成CI

谈谈 Docker Volume 之权限管理（一）

容器镜像服务 Docker镜像的基本使用

阿里中间件首席架构师钟华：《企业IT架构转型之道：阿里巴巴中台战略思想与架构实战》新书出版（含试读PDF）！

开发函数计算的正确姿势 —— 移植 next.js 服务端渲染框架

展开全部

还有其他疑问?