dubbo服务上线、下线更新服务时,nacos-client的HostReactor处理服务列表更新的方法processServiceJson持续收到空hosts列表,导致客户端将服务列表清空,调用dubbo服务(版本2.7.5) 出现no provider,实际上dubbo服务一直运行正常。
测试环境: nacos注册中心(集群多节点):1.4.1和1.2.1两个版本均测过 nacos客户端版本:1.4.1和1.2.1两个版本都会出现,使用1.4.1版本时问题更严重 1.4.1版本的com.alibaba.nacos.client.naming.core.HostReactor类的processServiceJson方法相比1.2.1,默认不再判断收到的serviceInfo内容是否合法(判断条件增加了一个配置选项pushEmptyProtection,默认为false)。
1、nacos-client处理服务列表推送Json串时,processServiceJson方法忽略CollectionUtils.isEmpty(serviceInfo.getHosts())的情况(即使服务都没有了,调用失败抛channel closed异常也好过把正常服务全清掉)。
2、排查nacos-server端的服务列表推送代码,不要莫名其妙地持续推送空服务列表给客户端,偶尔抽风可以忍受,持续这么搞就离谱了。
收到的服务推送列表为empty时(serviceInfo.getHosts().size()==0)时,服务列表被动清空,导致调用dubbo服务出现No provider。
原提问者GitHub用户zrlw
serviceInfo.validate中 1.4.1版本添加了空列表判断,可以读一下。
1.2.1确实存在问题, 没有推空保护的功能。
服务端推空一般有2种情况,1. 服务列表确实为空;2. 服务不存在
这两种情况都应该排查为什么服务没了。
如果需要推空保护,就需要升级到至少1.4.1版本客户端,打开推空保护。
原回答者GitHub用户KomachiSion
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。