想看技术大牛眼里的世界
一、案件背景 近日,一个线上应用开始频繁报警:异常日志、接口rt超时、load高、tcp重传率高等等。现场监控如下: 从基础监控来看,cpu使用率不算特别异常,而load高说明等待cpu资源的线程队列长,配合rt上涨来看,推测是线程出现了堆积,而线程堆积一般有两种情况: 线程内部处理耗时变长:比如缓存未命中、被下游请求block、慢sql、循环逻辑耗时等。
“性能优化“相信是每个程序员都关心的问题,在实际工作中也常会对系统做优化。关于性能优化有两个问题很值得探讨: * HOW:影响性能的因素很多,该从何入手?找到需要优化的点后,如何进行优化? * WHY:优化后为什么能提升性能?为什么有些优化点更值得做? 本文先对公式进行简单推导和验证,熟悉的同学可以跳过这部分。