JFR诊断增强学习笔记

2022-09-03 152

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习JFR诊断增强

开发者学堂课程【JFR诊断增强：JFR诊断增强】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/57

JFR诊断增强

一、概览

1、历史

JFR技术最早起源于JRockit，这项技术最初被设计用于收集虚拟机的各项性能指标，帮助提高虚拟机的性能。在Oracle收购后，这项技术被合并后入OracleJDK中成为商业特性-JDK 7u4+。

最早发布在OracleJDK，期中用户没有办法在生长环境免费使用，幸运的是在2018年，这项技术正式开源于OpenJDK11中，两年后在多个公司的努力下JFR被移植到主流版本OpenJDK8u中，开发者可以在生产环境中免费使用。

2、JFR是什么

JFR是基于事件的数据收集、tracing框架，同时他的完整实践内建于Jdk中。同时，他是一个低开销、生产级别可用的工具，在默认配置下，开销能够控制住2%以内。JFR提供了一套完成的Java API,能够帮助用户自定义和消费事件同时控制JFR的各种行为。

3、优势

相对于传统的Java应用数据收集方案(MX Bean、Java/Native Agent) ， JFR的优势：

1、一套标准的API，允许用户自定义事件

2、默认提供数据持久化和磁盘rotate的能力

3、完善的内存消耗控制策略，高效压缩的二进制数据格式

4、可以收集JVM内部最底层的信息，传统的方案几乎无法低开销地实现

5、应用异常退出时，仍然可以保证数据的完整性和一致性，保证最终的数据能够正常被解析

6、使用场景：在线的性能分析，问题排查以及持续监控 Profiling&Troubleshooting&Monitoring

从图中我们可以看出JFR相对于常用的日字记录组件在性能上有着质的提升。

二、基础

1、Event

对于所有JFR事件来说，有着统一的格式，除了事件大小以及事件ID这类基础信息外，每个事件中还包含了开始时间，消耗时间以及所属现场的ID等等消息，在实线上，JFR为了存储空间的使用效率，使用了变长枕术压缩算法。

JFR为了提高记录事件的效率，能够在最大程度降低开销，在实线上，每个需要记录JFR事件的现成，都会维护自己的缓存用于记录局部的事件，当局部缓存满后，会将其中内容拷贝到全剧缓存中，最后会被刷出到磁盘文件中，而每一个磁盘文件中的内容都能够被单独解析，因为他包含了所有的数据，文件内容也使用了自描述的格式，保证了数据的完整性和一致性。

JDK默认提供了超过140个的内置事件，覆盖了各个模块，比如在环境角度，用户能够通过JFR收集到os、cpu层面的数据，在执行角度，用户能搜集到网络文件io等数据以及电动站的数据，在gvm角度，用户能够收集到内加载、垃圾回收器以及及时编译器的数据。

1、Api

API是一套核心的注解，这套注解能够帮助用户自定义事件，比如用户能够通过内幕注解来定义事件的名称，通过Enabled的注解来定义事件，是否被默认打开，通过StackTrace注释来定义事件是否需要记录站的信息，任务通过这套核心注解以及基础类库，能够完成自定义事件的定义。

例：图中定义了一个“Hello JFR”事件里面包含了一个message字段，用户能够通过API完成事件的记录。首先用户需要创建一个事件对象，然后通过begin和commit API，来完成事件的记录。

1、Command

在启动阶段JFR提供了一个参数，能够帮助用户在启动阶段开启一次JFR的记录，同时提供了jcommand的几个命令来帮助用户在运行期间来控制JFR的行为，最后他也提供了JFR命令，来帮助用户打印转储文件中的JFR事件信息。

例子：

首先在本地环境准备一个支持JFR的JDK，图片中提供了openJDK 15，用户可以选择openJDK8u 262之后的版本或者openJDK 11以及以上的版本，用来进行演示。

在启动参数中增加StartFlatRecording参数来开启一次记录，在demo中通过name来标注这次记录的名称叫demo，在启动之后会有一段录制输出，来标记这次飞行记录的生效。

在期间，可以通过JFR.check命令来检查我们记录的配置信息，图中我们可以看出这次记录会去记录各类事件，比如ActRecording事件等。

在运行一段时间以后，我们能通过dump命令将这期间采集到的JFR事件dump到文件中，我们需要指定recording的名字以及目标，dump文件的路径，最终我们可以从图中看到文件大小为420k。

有了dump文件，我们就可以用JFR命令输出文件中的事件信息，图中使用了summary命令，可以看到文件中各类事件的基础信息，例如monitorwait事件总共发生了4148次，占用了约100k的大小，用户也可以用print命令来打印更详细的信息。

一、监控

JFR最初被设计用来问题排查和性能分析上，为了能够让JFR应用于持续监控中，Oracle开源了JEP 349特性：JFR Event Streaming，这个特性提拱了一系列的API，能够让用户连续消费JFR事件，保证额外的开销控制在1%以内，目前已经在openJDK14中正式开源，而阿里巴巴Dragonwell 8.5.4也将这个特性集成进来，从图中我们可以看到，用户能够通过recordingString API以及eventString API来进行特定事件的特定操作。

1、Visualization

在可视化角度，官方提供了JDK mission control 一款桌面软件来帮助用户来进行JFR文件的分析。

在生产环境，我们能够通过agent将JFR数据转换成指标数据，通过目前比较流行的可视化工具，比如granafa进行JFR数据的分析。

JFR诊断增强学习笔记

课程地址：https://developer.aliyun.com/learning/course/57

JFR诊断增强

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

JFR诊断增强学习笔记

课程地址：https://developer.aliyun.com/learning/course/57

JFR诊断增强

热门文章

最新文章

相关电子书