Arthas中pod cpu达到100%你们是如何排查问题的呢？

Arthas中pod cpu达到100%你们是如何排查问题的，当cpu快达到100%时，你们有生成类似dump文件的日志吗？

展开

收起

小小鹿鹿鹿 2023-11-14 22:49:51 604 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
当 Arthas 中的 Pod 的 CPU 利用率达到 100% 时，可以按照以下步骤来排查问题：
1. 确认问题是否持续： 首先确定 CPU 利用率持续为 100%，而不是短暂的 CPU 峰值。如果是峰值，可能是正常的负载波动，无需进一步排查。
2. 检查应用程序代码： 检查应用程序的代码逻辑，特别是与 CPU 密集型任务相关的部分。查看是否存在无限循环、死锁、大量资源消耗等问题。
3. 检查第三方库和框架： 如果应用程序使用了第三方库或框架，确保其版本和配置正确，并检查是否有已知的性能问题或 bug。升级到最新版本或尝试替换其他库来排除问题。
4. 观察系统资源： 使用工具监控和观察系统的其他资源情况，如内存、磁盘 I/O 等。高 CPU 利用率可能是由其他资源瓶颈引起的。确保没有其他资源竞争导致的性能问题。
5. 使用性能分析工具： 针对 CPU 利用率高的线程，使用性能分析工具如 JDK 提供的 JVisualVM、Java Mission Control，或者第三方工具如 Perf、Grafana 等，来进行深入分析和定位。这些工具可以帮助找出热点代码、线程调用关系等，并给出性能优化建议。
6. 优化代码和配置： 根据分析结果，针对发现的性能问题进行代码优化、调整应用程序配置，以降低 CPU 的使用量。可能需要优化算法、并发控制、资源管理等方面的设计。
7. 压力测试和监测： 在解决问题后，可以进行压力测试，模拟实际负载，观察 CPU 利用率的变化。持续监测和调整系统的性能表现，确保问题得到彻底解决。
2023-11-30 22:51:23

赞同展开评论
sunrr
当Arthas中的pod cpu达到100%时，首先需要理解这大概率是代码存在死循环。为了定位问题，可以使用arthas工具进行排查。arthas是阿里巴巴开源的Java诊断工具，它提供了许多实用的指令来帮助开发者进行问题定位。

具体操作步骤如下：
1. 使用命令java -jar arthas-boot.jar启动arthas。
2. 输入dashboard命令查看系统的实时数据面板，这里可以查看到各个线程的状态，包括CPU占用、内存占用等信息。
3. 通过点击左侧的“Thread”标签页，可以查看Java应用程序的线程栈信息。从线程栈信息中，可以定位到具体的Java代码，从而找到导致CPU占用高的原因。
4. 如果需要查看更详细的线程堆栈信息，可以使用thread -n <num> -i <interval>命令，其中<num>表示要查看的线程编号，<interval>表示每隔多少毫秒输出一次堆栈信息。
此外，当CPU快达到100%时，可以考虑生成dump文件来进一步分析。Dump文件是进程的内存镜像，它可以帮助我们更好地理解进程的状态和行为。在Linux系统中，可以使用kill -3 <pid>命令为进程生成dump文件。然后可以使用像perf或gdb这样的工具来分析这个dump文件，找出导致CPU占用高的原因。
2023-11-15 15:30:09

赞同展开评论

Arthas中pod cpu达到100%你们是如何排查问题的呢？

云原生

相关文章

热门讨论

热门文章