【Java虚拟机】JVM诊断神器Arthas入门实操

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 【Java虚拟机】JVM诊断神器Arthas入门实操

1.Arthas简介快速入门

d61a80e8671c4d7c839a389c3706bb12.jpg

  • 阿里开源的Java诊断工具,它可以在运行时对Java应用程序进行动态诊断和调试
  • 当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决

这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?

我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?

遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?

线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!

是否有一个全局视角来查看系统的运行状况?

有什么办法可以监控到 JVM 的实时运行状态?

怎么快速定位应用的热点,生成火焰图?

怎样直接从 JVM 内查找某个类的实例?

github地址:https://github.com/alibaba/arthas

官网:https://arthas.aliyun.com/

版本:Arthas-3.6.7

环境说明

Arthas 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,

提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断

也支持浏览器直接访问对应的ip+端口,固定端口 8563

默认情况下,arthas 只 listen 127.0.0.1,所以如果想从远程连接,使用 --target-ip参数指定 listen 的 IP

快速使用

启动 java -jar arthas-boot.jar

04270329836f43a7b543a82eb51359f5.jpg


运行日志路径 ~/logs/arthas/arthas.log

84d68db4af4c408794767f2e3eba8fb1.jpg


退出 arthas

如果只是退出当前的连接,其他客户端不受影响,可以用 quit或者exit命令

目标进程上的 arthas 还会继续运行,端口保持开放,下次连接时执行java -jar arthas-boot.jar可以直接连接上

如果想完全退出 arthas,可以执行stop命令

2.Arthas常用基础命令实战

  • version - 输出当前目标 Java 进程所加载的 Arthas 版本号
  • base64 - base64 编码转换,和 linux 里的 base64 命令类似

cat - 打印文件内容,和 linux 里的 cat 命令类似

cls - 清空当前屏幕区域

echo - 打印参数,和 linux 里的 echo 命令类似

grep - 匹配查找,和 linux 里的 grep 命令类似

help - 查看命令帮助信息

history - 打印命令历史

keymap - Arthas 快捷键列表及自定义快捷键

pwd - 返回当前的工作目录,和 linux 命令类似

quit - 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响

reset - 重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类

session - 查看当前会话的信息

stop - 关闭 Arthas 服务端,所有 Arthas 客户端全部退出

tee - 复制标准输入到标准输出和指定的文件,和 linux 里的 tee 命令类似

61853ce1763244b1b66adcaac374e80f.jpg

3.Arthas常用JVM命令案例实战

(1)JVM相关的命令

  • dashboard - 当前系统的实时数据面板

heapdump - dump java heap, 类似 jmap 命令的 heap dump 功能

jvm - 查看当前 JVM 的信息

memory - 查看 JVM 的内存信息

ognl - 执行 ognl 表达式

perfcounter - 查看当前 JVM 的 Perf Counter 信息

sysenv - 查看 JVM 的环境变量

sysprop - 查看和修改 JVM 的系统属性

thread - 查看当前 JVM 的线程堆栈信息

vmoption - 查看和修改 JVM 里诊断相关的 option

(2)dashboard - 当前系统的实时数据面板

  • 整体大面板

b94908aebb504708b40040f0b4624dec.jpg

  • 顶部-线程的基本信息

image.jpeg

字段 说明
id Java 级别的线程 ID
name 线程名称
group 线程组名称
proirity 线程优先级,1 ~ 10 之间的数字,越大优先级越高
state 线程的状态
cpu 线程的 cpu 使用率
lta_time 上次采样之后线程运行增量 CPU 时间,数据格式为秒
time 线程运行总 CPU 时间,数据格式为 分:秒
interupted 当前线程是否中断
daemon 是否是 daemon 守护线程
  • 中部-堆内存的使用情况


49f3bc68b4c54d0e8201051fa5f101e7.jpg

字段 说明
used 当前使用了多少内存
total 总共分配了多少内存
max 最大使用了多少
usage 使用比例
gc 垃圾回收器
  • 底部-操作系统信息,JDK版本

e01fafd57c7c4411999f90b763266b1b.jpg

(3)thead - 查看当前 JVM 的线程堆栈信息

  • 常用参数
  • –all :显示所有匹配的线程,默认就是第一页线程信息

image.jpeg

  • -i:设置cpu统计时的采样间隔,单位为毫秒 thread -i 2000

image.jpeg

  • [ id ]:查看指定ID的线程堆栈 thread 54

d4f81d46f1044b40a588c72f648c99d5.jpg

  • -n :查看CPU使用率最高的TopN个线程, 如果值为-1表示显示所有线程 thread -n 3

d98f689ee3304302b06ec1b131828964.jpg

-b :展示阻塞线程 thread -b

cf864118d50d4cefb9de644a22973410.jpg


–state : 根据线程状态筛选线程 thread --state TIMED_WAITING

状态类型:NEW, RUNNABLE, TIMED_WAITING, WAITING, BLOCKED,TERMINATED


8e3258e936364949bbfa24cfda846768.jpg

(4)heapdump - 类似 jmap 命令的 heap dump 功能

  • 生成堆栈快照 heapdump /Users/mac/Desktop/heapdump.hprof


a5e4dd79cae9426da242bf6597032834.jpg

(5)jvm - 查看当前 JVM 的信息

afbf07ec381f49fcbc45f877ffe33759.jpg

(6)sysenv - 查看 JVM 的环境变量

2960faed793b454f9eb8b5a6c86ed9a4.jpg

(7)sysprop - 查看和修改 JVM 的系统属性

  • 查看所有属性:sysprop

fd4c71644b974ac99abd4601878dd056.jpg

  • 查看单个属性:sysprop java.version

9c43ef501700453e89cff2bd547dac28.jpg

  • 修改某个属性:sysprop user.country CN


654df90a70fd477e81fa2cba10b8a1e7.jpg

(8)sc - 查看 JVM 已加载的类信息

  • -d 详情,-f 类属性输出
  • sc -d -f com.lixiang.controller.SpringTestController
  • 6b9c0b13704c41e4932c4c228fc5c2a9.jpg

(9)sm - 查看已加载类的方法信息

  • sm -d com.lixiang.controller.SpringTestController

bfd7d834262444a286efdebcb6eaca8f.jpg

(10)jad - 反编译指定已加载类的源码

  • 反编译整个类 jad com.lixiang.SpringTestApplication

0729b94018d44e42a81da9654007e9ab.jpg

  • 通过--source-only选项,可以只打印源代码

aa785ae44ee5400a91eee48079960ce5.jpg

  • 应用场景
  • 查看某个类的业务逻辑,方法逻辑
  • 查看本地修改的代码是否线上成功生效

4.Arthas方法诊断命令案例实战

(1)monitor - 方法执行监控

  • 非实时响应,需要对应的方法有被调用才行,所以需要触发web接口请求
  • 监视一个时间段中指定方法的执行次数,成功次数,失败次数,耗时等这些信息
  • monitor -c 2 com.lixiang.controller.SpringTestController query

a303e256a5154021bce7ed0120967e5a.jpg


5c222cc0b5534c0f9e414f070be79bb1.jpg

7e7b6bf596b64bab924650d6bdd46120.jpg

(2)stack - 输出当前方法被调用的调用路径, 一个方法被执行的路径非常多,不知道这个方法是从那里被执行,就可以采用

  • 案例 stack com.lixiang.controller.SpringTestController query

fd83c8b377724a72a077dad4444e46c7.jpg

403b8e8c84f440c1b01f25adeb96887d.jpg


79be7e37ca9d49a2ba8e3bd94cf099b8.jpg

(3)trace - 方法内部调用,输出方法路径上的每个节点上耗时, 定位因 RT 高导致的性能问题

  • 每次只能跟踪一级方法的调用链路
  • 案例输出全部方法 trace com.lixiang.controller.SpringTestController *

ts: 时间戳,表示日志记录的时间,该字段的值为2023年3月26日下午5点48分46秒。

thread_name: 线程名称,表示当前执行该日志记录的线程名称,该字段的值为http-nio-8080-exec-10。

id: 线程ID,表示当前执行该日志记录的线程ID,该字段的值为20。

  • is_daemon: 是否为守护线程,该字段的值为true,表示该线程是守护线程。
  • priority: 线程优先级,该字段的值为5,表示该线程的优先级为5。
  • TCCL: 线程上下文类加载器,表示当前线程的上下文类加载器为TomcatEmbeddedWebappClassLoader。

2919855aa71e41bea88ccc46bbacb304.jpg

默认情况下,trace不会包含jdk里的函数调用,如果希望trace jdk里的函数, 需要显式设置–skipJDKMethod false

即 trace --skipJDKMethod false com.lixiang.controller.SpringTestController *

67910d6653114830867bd07dc0a1185d.jpg

(4)watch - 方法执行数据观测

  • 应用场景:查看方法调用栈,参数入参,返回值等调试
  • 默认的 观察表达式,默认值是{params, target, returnObj}
  • 也可以指定观察返回值 watch com.lixiang.controller.SpringTestController * {params,returnObj}


973f60c428624089ad8122844d6a18dc.jpg

  • 展开里面具体的值 -x 参数表示遍历深度,可以调整来打印具体的参数和结果内容,默认值是 1, 最大是4。
  • watch com.lixiang.controller.SpringTestController * {params,returnObj} -x 4


f4e5166dbe3b46edb15fa6244b8ec2da.jpg

5.Arthas在线调试案例实战

  • 生产环境运行了java程序,需要在线调试,在不重启JVM程序,动态调整,打印参数或修改方法内部逻辑。
  • 步骤以及环境准备f308e26eb70c4d5895314c7afbb1b534.jpg
  • 第一步:jad 把字节码文件反编译成源代码


81da20ae1d4d4bd4b44b811f142e8cc5.jpg



aace80d1af98416ebbc263f85096fc94.jpg

  • 第二步:mc 在内存中把源代码编译成字节码文件

e1a819bcdf7e410fad4ad3c4c8bb9ccf.jpg

9b1fa50b247449b6a1aef5d7b80fda80.jpg

  • 第三步:redefine 把新生成的字节码文件在内存中执行

b0fcc5e6c954419ba0f594a804c85d6f.jpg

e75b8245cdff4083a68d5ba9cae37405.jpg


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
1月前
|
Java Docker 索引
记录一次索引未建立、继而引发一系列的问题、包含索引创建失败、虚拟机中JVM虚拟机内存满的情况
这篇文章记录了作者在分布式微服务项目中遇到的一系列问题,起因是商品服务检索接口测试失败,原因是Elasticsearch索引未找到。文章详细描述了解决过程中遇到的几个关键问题:分词器的安装、Elasticsearch内存溢出的处理,以及最终成功创建`gulimall_product`索引的步骤。作者还分享了使用Postman测试接口的经历,并强调了问题解决过程中遇到的挑战和所花费的时间。
|
15天前
|
Arthas Java 测试技术
Java字节码文件、组成,jclasslib插件、阿里arthas工具,Java注解
Java字节码文件、组成、详解、分析;常用工具,jclasslib插件、阿里arthas工具;如何定位线上问题;Java注解
Java字节码文件、组成,jclasslib插件、阿里arthas工具,Java注解
|
20天前
|
人工智能 JSON 文字识别
【实操】Java+百度ocr,实现图片识别文字小工具
本文介绍了一个基于Java和百度OCR的文字识别工具,能够通过截图或上传图片实现文字识别,并使用exe4j将工具封装为exe文件以便于使用。文章详细介绍了实现过程,包括Java Swing页面布局、百度OCR配置及使用方法,以及如何将Java项目打包成jar和exe文件。此外,还提供了一些相关资源供读者参考。
19 0
【实操】Java+百度ocr,实现图片识别文字小工具
|
1月前
|
存储 安全 Java
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程,JDK、JRE、JVM关系;程序计数器,堆,虚拟机栈,堆栈的区别是什么,方法区,直接内存
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程是什么,JDK、JRE、JVM的联系与区别;什么是程序计数器,堆,虚拟机栈,栈内存溢出,堆栈的区别是什么,方法区,直接内存
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程,JDK、JRE、JVM关系;程序计数器,堆,虚拟机栈,堆栈的区别是什么,方法区,直接内存
|
2月前
|
Arthas 监控 算法
JVM成神路终章:深入死磕Java虚拟机序列总纲
JVM成神路终章:深入死磕Java虚拟机序列总纲
|
1月前
|
监控 算法 Java
深入理解Java虚拟机:JVM调优与性能提升
本文旨在为Java开发者提供一条清晰的路径,以深入掌握Java虚拟机(JVM)的内部机制和性能调优技巧。通过具体案例分析,我们将探讨如何识别性能瓶颈、选择合适的工具进行监控与调试,以及实施有效的优化策略,最终达到提高应用程序性能的目的。文章不仅关注理论,更注重实践应用,帮助读者在面对复杂的Java应用时能够游刃有余。
49 0
|
2月前
|
存储 Java 对象存储
Java虚拟机(JVM)中的栈(Stack)和堆(Heap)
在Java虚拟机(JVM)中,栈(Stack)和堆(Heap)是存储数据的两个关键区域。它们在内存管理中扮演着非常重要的角色,但各自的用途和特点有所不同。
38 0
|
2月前
|
缓存 安全 算法
Java面试题:如何通过JVM参数调整GC行为以优化应用性能?如何使用synchronized和volatile关键字解决并发问题?如何使用ConcurrentHashMap实现线程安全的缓存?
Java面试题:如何通过JVM参数调整GC行为以优化应用性能?如何使用synchronized和volatile关键字解决并发问题?如何使用ConcurrentHashMap实现线程安全的缓存?
24 0
|
2月前
|
存储 Java 程序员
Java面试题:方法区在JVM中存储什么内容?它与堆内存有何不同?
Java面试题:方法区在JVM中存储什么内容?它与堆内存有何不同?
54 10
|
2月前
|
存储 运维 Java
Java面试题:JVM的内存结构有哪些主要部分?请简述每个部分的作用
Java面试题:JVM的内存结构有哪些主要部分?请简述每个部分的作用
43 9