【Java虚拟机】JVM诊断神器Arthas入门实操

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 【Java虚拟机】JVM诊断神器Arthas入门实操

1.Arthas简介快速入门

d61a80e8671c4d7c839a389c3706bb12.jpg

  • 阿里开源的Java诊断工具,它可以在运行时对Java应用程序进行动态诊断和调试
  • 当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决

这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?

我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?

遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?

线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!

是否有一个全局视角来查看系统的运行状况?

有什么办法可以监控到 JVM 的实时运行状态?

怎么快速定位应用的热点,生成火焰图?

怎样直接从 JVM 内查找某个类的实例?

github地址:https://github.com/alibaba/arthas

官网:https://arthas.aliyun.com/

版本:Arthas-3.6.7

环境说明

Arthas 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,

提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断

也支持浏览器直接访问对应的ip+端口,固定端口 8563

默认情况下,arthas 只 listen 127.0.0.1,所以如果想从远程连接,使用 --target-ip参数指定 listen 的 IP

快速使用

启动 java -jar arthas-boot.jar

04270329836f43a7b543a82eb51359f5.jpg


运行日志路径 ~/logs/arthas/arthas.log

84d68db4af4c408794767f2e3eba8fb1.jpg


退出 arthas

如果只是退出当前的连接,其他客户端不受影响,可以用 quit或者exit命令

目标进程上的 arthas 还会继续运行,端口保持开放,下次连接时执行java -jar arthas-boot.jar可以直接连接上

如果想完全退出 arthas,可以执行stop命令

2.Arthas常用基础命令实战

  • version - 输出当前目标 Java 进程所加载的 Arthas 版本号
  • base64 - base64 编码转换,和 linux 里的 base64 命令类似

cat - 打印文件内容,和 linux 里的 cat 命令类似

cls - 清空当前屏幕区域

echo - 打印参数,和 linux 里的 echo 命令类似

grep - 匹配查找,和 linux 里的 grep 命令类似

help - 查看命令帮助信息

history - 打印命令历史

keymap - Arthas 快捷键列表及自定义快捷键

pwd - 返回当前的工作目录,和 linux 命令类似

quit - 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响

reset - 重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类

session - 查看当前会话的信息

stop - 关闭 Arthas 服务端,所有 Arthas 客户端全部退出

tee - 复制标准输入到标准输出和指定的文件,和 linux 里的 tee 命令类似

61853ce1763244b1b66adcaac374e80f.jpg

3.Arthas常用JVM命令案例实战

(1)JVM相关的命令

  • dashboard - 当前系统的实时数据面板

heapdump - dump java heap, 类似 jmap 命令的 heap dump 功能

jvm - 查看当前 JVM 的信息

memory - 查看 JVM 的内存信息

ognl - 执行 ognl 表达式

perfcounter - 查看当前 JVM 的 Perf Counter 信息

sysenv - 查看 JVM 的环境变量

sysprop - 查看和修改 JVM 的系统属性

thread - 查看当前 JVM 的线程堆栈信息

vmoption - 查看和修改 JVM 里诊断相关的 option

(2)dashboard - 当前系统的实时数据面板

  • 整体大面板

b94908aebb504708b40040f0b4624dec.jpg

  • 顶部-线程的基本信息

image.jpeg

字段 说明
id Java 级别的线程 ID
name 线程名称
group 线程组名称
proirity 线程优先级,1 ~ 10 之间的数字,越大优先级越高
state 线程的状态
cpu 线程的 cpu 使用率
lta_time 上次采样之后线程运行增量 CPU 时间,数据格式为秒
time 线程运行总 CPU 时间,数据格式为 分:秒
interupted 当前线程是否中断
daemon 是否是 daemon 守护线程
  • 中部-堆内存的使用情况


49f3bc68b4c54d0e8201051fa5f101e7.jpg

字段 说明
used 当前使用了多少内存
total 总共分配了多少内存
max 最大使用了多少
usage 使用比例
gc 垃圾回收器
  • 底部-操作系统信息,JDK版本

e01fafd57c7c4411999f90b763266b1b.jpg

(3)thead - 查看当前 JVM 的线程堆栈信息

  • 常用参数
  • –all :显示所有匹配的线程,默认就是第一页线程信息

image.jpeg

  • -i:设置cpu统计时的采样间隔,单位为毫秒 thread -i 2000

image.jpeg

  • [ id ]:查看指定ID的线程堆栈 thread 54

d4f81d46f1044b40a588c72f648c99d5.jpg

  • -n :查看CPU使用率最高的TopN个线程, 如果值为-1表示显示所有线程 thread -n 3

d98f689ee3304302b06ec1b131828964.jpg

-b :展示阻塞线程 thread -b

cf864118d50d4cefb9de644a22973410.jpg


–state : 根据线程状态筛选线程 thread --state TIMED_WAITING

状态类型:NEW, RUNNABLE, TIMED_WAITING, WAITING, BLOCKED,TERMINATED


8e3258e936364949bbfa24cfda846768.jpg

(4)heapdump - 类似 jmap 命令的 heap dump 功能

  • 生成堆栈快照 heapdump /Users/mac/Desktop/heapdump.hprof


a5e4dd79cae9426da242bf6597032834.jpg

(5)jvm - 查看当前 JVM 的信息

afbf07ec381f49fcbc45f877ffe33759.jpg

(6)sysenv - 查看 JVM 的环境变量

2960faed793b454f9eb8b5a6c86ed9a4.jpg

(7)sysprop - 查看和修改 JVM 的系统属性

  • 查看所有属性:sysprop

fd4c71644b974ac99abd4601878dd056.jpg

  • 查看单个属性:sysprop java.version

9c43ef501700453e89cff2bd547dac28.jpg

  • 修改某个属性:sysprop user.country CN


654df90a70fd477e81fa2cba10b8a1e7.jpg

(8)sc - 查看 JVM 已加载的类信息

  • -d 详情,-f 类属性输出
  • sc -d -f com.lixiang.controller.SpringTestController
  • 6b9c0b13704c41e4932c4c228fc5c2a9.jpg

(9)sm - 查看已加载类的方法信息

  • sm -d com.lixiang.controller.SpringTestController

bfd7d834262444a286efdebcb6eaca8f.jpg

(10)jad - 反编译指定已加载类的源码

  • 反编译整个类 jad com.lixiang.SpringTestApplication

0729b94018d44e42a81da9654007e9ab.jpg

  • 通过--source-only选项,可以只打印源代码

aa785ae44ee5400a91eee48079960ce5.jpg

  • 应用场景
  • 查看某个类的业务逻辑,方法逻辑
  • 查看本地修改的代码是否线上成功生效

4.Arthas方法诊断命令案例实战

(1)monitor - 方法执行监控

  • 非实时响应,需要对应的方法有被调用才行,所以需要触发web接口请求
  • 监视一个时间段中指定方法的执行次数,成功次数,失败次数,耗时等这些信息
  • monitor -c 2 com.lixiang.controller.SpringTestController query

a303e256a5154021bce7ed0120967e5a.jpg


5c222cc0b5534c0f9e414f070be79bb1.jpg

7e7b6bf596b64bab924650d6bdd46120.jpg

(2)stack - 输出当前方法被调用的调用路径, 一个方法被执行的路径非常多,不知道这个方法是从那里被执行,就可以采用

  • 案例 stack com.lixiang.controller.SpringTestController query

fd83c8b377724a72a077dad4444e46c7.jpg

403b8e8c84f440c1b01f25adeb96887d.jpg


79be7e37ca9d49a2ba8e3bd94cf099b8.jpg

(3)trace - 方法内部调用,输出方法路径上的每个节点上耗时, 定位因 RT 高导致的性能问题

  • 每次只能跟踪一级方法的调用链路
  • 案例输出全部方法 trace com.lixiang.controller.SpringTestController *

ts: 时间戳,表示日志记录的时间,该字段的值为2023年3月26日下午5点48分46秒。

thread_name: 线程名称,表示当前执行该日志记录的线程名称,该字段的值为http-nio-8080-exec-10。

id: 线程ID,表示当前执行该日志记录的线程ID,该字段的值为20。

  • is_daemon: 是否为守护线程,该字段的值为true,表示该线程是守护线程。
  • priority: 线程优先级,该字段的值为5,表示该线程的优先级为5。
  • TCCL: 线程上下文类加载器,表示当前线程的上下文类加载器为TomcatEmbeddedWebappClassLoader。

2919855aa71e41bea88ccc46bbacb304.jpg

默认情况下,trace不会包含jdk里的函数调用,如果希望trace jdk里的函数, 需要显式设置–skipJDKMethod false

即 trace --skipJDKMethod false com.lixiang.controller.SpringTestController *

67910d6653114830867bd07dc0a1185d.jpg

(4)watch - 方法执行数据观测

  • 应用场景:查看方法调用栈,参数入参,返回值等调试
  • 默认的 观察表达式,默认值是{params, target, returnObj}
  • 也可以指定观察返回值 watch com.lixiang.controller.SpringTestController * {params,returnObj}


973f60c428624089ad8122844d6a18dc.jpg

  • 展开里面具体的值 -x 参数表示遍历深度,可以调整来打印具体的参数和结果内容,默认值是 1, 最大是4。
  • watch com.lixiang.controller.SpringTestController * {params,returnObj} -x 4


f4e5166dbe3b46edb15fa6244b8ec2da.jpg

5.Arthas在线调试案例实战

  • 生产环境运行了java程序,需要在线调试,在不重启JVM程序,动态调整,打印参数或修改方法内部逻辑。
  • 步骤以及环境准备f308e26eb70c4d5895314c7afbb1b534.jpg
  • 第一步:jad 把字节码文件反编译成源代码


81da20ae1d4d4bd4b44b811f142e8cc5.jpg



aace80d1af98416ebbc263f85096fc94.jpg

  • 第二步:mc 在内存中把源代码编译成字节码文件

e1a819bcdf7e410fad4ad3c4c8bb9ccf.jpg

9b1fa50b247449b6a1aef5d7b80fda80.jpg

  • 第三步:redefine 把新生成的字节码文件在内存中执行

b0fcc5e6c954419ba0f594a804c85d6f.jpg

e75b8245cdff4083a68d5ba9cae37405.jpg


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2月前
|
Java
jvm复习,深入理解java虚拟机一:运行时数据区域
这篇文章深入探讨了Java虚拟机的运行时数据区域,包括程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区、元空间和运行时常量池,并讨论了它们的作用、特点以及与垃圾回收的关系。
66 19
jvm复习,深入理解java虚拟机一:运行时数据区域
|
2月前
|
存储 SQL 小程序
JVM知识体系学习五:Java Runtime Data Area and JVM Instruction (java运行时数据区域和java指令(大约200多条,这里就将一些简单的指令和学习))
这篇文章详细介绍了Java虚拟机(JVM)的运行时数据区域和JVM指令集,包括程序计数器、虚拟机栈、本地方法栈、直接内存、方法区和堆,以及栈帧的组成部分和执行流程。
36 2
JVM知识体系学习五:Java Runtime Data Area and JVM Instruction (java运行时数据区域和java指令(大约200多条,这里就将一些简单的指令和学习))
|
9天前
|
监控 算法 Java
深入理解Java虚拟机(JVM)的垃圾回收机制
【10月更文挑战第21天】 本文将带你深入了解Java虚拟机(JVM)的垃圾回收机制,包括它的工作原理、常见的垃圾收集算法以及如何优化JVM垃圾回收性能。通过本文,你将对JVM垃圾回收有一个全新的认识,并学会如何在实际开发中进行有效的调优。
29 0
|
2月前
|
存储 算法 Java
Java虚拟机(JVM)的内存管理与性能优化
本文深入探讨了Java虚拟机(JVM)的内存管理机制,包括堆、栈、方法区等关键区域的功能与作用。通过分析垃圾回收算法和调优策略,旨在帮助开发者理解如何有效提升Java应用的性能。文章采用通俗易懂的语言,结合具体实例,使读者能够轻松掌握复杂的内存管理概念,并应用于实际开发中。
|
2月前
|
Arthas 监控 Java
JVM知识体系学习七:了解JVM常用命令行参数、GC日志详解、调优三大方面(JVM规划和预调优、优化JVM环境、JVM运行出现的各种问题)、Arthas
这篇文章全面介绍了JVM的命令行参数、GC日志分析以及性能调优的各个方面,包括监控工具使用和实际案例分析。
51 3
|
2月前
|
存储 算法 Java
深入理解Java虚拟机(JVM)及其优化策略
【10月更文挑战第10天】深入理解Java虚拟机(JVM)及其优化策略
45 1
|
2月前
|
安全 Java API
🌟探索Java宇宙:深入理解Java技术体系与JVM的奥秘
本文深入探讨了Java技术体系的全貌,从Java语言的概述到其优点,再到Java技术体系的构成,以及JVM的角色。旨在帮助Java开发者全面了解Java生态,提升对Java技术的认知,从而在编程实践中更好地发挥Java的优势。关键词:Java, JVM, 技术体系, 编程语言, 跨平台, 内存管理。
41 2
|
2月前
|
小程序 Oracle Java
JVM知识体系学习一:JVM了解基础、java编译后class文件的类结构详解,class分析工具 javap 和 jclasslib 的使用
这篇文章是关于JVM基础知识的介绍,包括JVM的跨平台和跨语言特性、Class文件格式的详细解析,以及如何使用javap和jclasslib工具来分析Class文件。
49 0
JVM知识体系学习一:JVM了解基础、java编译后class文件的类结构详解,class分析工具 javap 和 jclasslib 的使用
|
2月前
|
监控 Java
Java的JVM如何优化?
Java的JVM如何优化?
60 3
|
3月前
|
存储 缓存 监控
【Java面试题汇总】JVM篇(2023版)
JVM内存模型、双亲委派模型、类加载机制、内存溢出、垃圾回收机制、内存泄漏、垃圾回收流程、垃圾回收器、G1、CMS、JVM调优
【Java面试题汇总】JVM篇(2023版)