物理部署图
物理部署图描述系统运行时的硬件配置与软件部署结构,展现节点、构件、物件及连接关系,常用于理解分布式系统的网络架构与运维部署,是实现应用与硬件协同运行的关键视图。
如何在线上环境里兼容多种 RPC 协议?
本讲探讨了如何在无接口定义下完成RPC调用,并重点讲解线上环境兼容多RPC协议的实现方案。通过支持多协议共存,利用magic number识别协议类型,实现请求的自动解析与响应,确保新老系统平滑升级,降低架构演进成本,提升系统可维护性与扩展性。
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,提升查询效率与资源治理能力。
生产环境缺陷管理
为解决大型团队多分支开发中bug漏修、漏发导致的生产故障,我们基于go-git打造了通用化工具git-poison。它实现分布式bug追溯与管理,支持投毒、解毒、银针三步闭环,自动阻塞带未修复bug的发布,降低协同成本,提升发布安全性,已在内部落地应用一年,显著减少“重复翻车”。
优雅关闭:如何避免服务停机带来的业务损失?
本讲深入探讨RPC优雅关闭机制。服务重启时,若未妥善处理,可能导致请求失败。通过引入关闭挡板、ShutdownHook钩子、引用计数与超时控制,确保正在处理的请求完成,新请求被拒绝并触发重试,实现业务无损下线。
如何在线上环境里兼容多种 RPC 协议?
本讲探讨了如何在线上环境兼容多种RPC协议。由于历史原因,系统中常存在多类RPC框架,导致维护成本高。为实现平滑升级,可通过支持多协议共存,利用magic number识别协议类型,动态选择解析方式,实现新老协议无缝切换,降低升级复杂度,提升系统可维护性与扩展性。
优雅关闭:如何避免服务停机带来的业务损失?
本讲深入探讨RPC中的优雅关闭机制。服务重启时,若未妥善处理,可能导致调用方请求失败。通过引入关闭钩子、连接通知与请求挡板,结合引用计数等待在途请求完成,可实现无损下线,保障系统稳定与业务连续性。
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,实现精细化管理与性能优化。
健康检测:这个节点都挂了,为啥还要疯狂发请求?
本文深入探讨RPC框架中的服务健康检测机制,针对超大规模集群中节点“半死不活”导致请求失败的问题,分析传统心跳机制的局限性。提出结合业务请求可用率的动态评估方案,避免误判与漏判,并通过多机房部署探活程序提升检测可靠性,最终实现“推拉结合,以拉为准”的最终一致性目标,保障业务高可用。