19-案例实战剖析-日处理上亿数据的系统内存分析和优化

简介: 这是当时开发中遇到的一个真实场景,也是大部分人在开发项目中有可能会遇到的一些场景,该系统主要是做大数据相关计算分析的,日处理数据量在上亿的规模。这里我们重点针对JVM内存的管理来进行模型分析,数据的来源获取主要是MYSQL数据库以及其他数据源里提取大量的数据,通过加载到JVM内存的过程我们来一起分析出现的问题以及如何优化解决

案例实战剖析-日处理上亿数据的系统内存分析和优化

1.系统背景

这是当时开发中遇到的一个真实场景,也是大部分人在开发项目中有可能会遇到的一些场景,该系统主要是做大数据相关计算分析的,日处理数据量在上亿的规模。这里我们重点针对JVM内存的管理来进行模型分析,数据的来源获取主要是MYSQL数据库以及其他数据源里提取大量的数据,通过加载到JVM内存的过程我们来一起分析出现的问题以及如何优化解决(如下图所示):

2.生产环境

这是一套分布式运行系统,生产环境部署了多台服务器(每台4核8G配置),每台机器大概每分钟负责执行100次数据提取和计算,每次提取大概1万条左右的数据到内存计算,平均每次计算需要耗费10秒左右时间。 JVM内存总共分配了4G,堆内存占3G,其中新生代和老年代分别是1.5G的内存空间

3.过程分析

按照上述的背景和实际生产环境,那每次1万条数据会占用多少的内存空间呢?这里每条数据较大,平均包含20个字段,可以认为每条数据大概在1KB左右。那么1万条数据对应就是10MB大小。那么运行多久就会导致新生代塞满呢?

新生代总共分配1.5G,那么Eden区分配就是1.2G,S1和S2区分别是150MB;如下图:

现在我们可以来手动计算下了,1次往Eden区里填充10MB对象,1分钟读取100次,也就是差不多1个G,那也就是1分钟左右的时候我们的Eden区就差不多填满了,这个时候如果触发Minor GC,我们通过上文学习知道,JVM在执行Minor GC之前是会进行一步检查动作的:老年代可用内存空间是否大于新生代全部对象?如果是第一次运行到这儿,那么我们的老年代是空的,也就是有1.5G的空间,完全是够用的。

这里触发Minor GC进行回收,但是问题在于如何回收呢?我们重点来看每次任务计算的耗时是10S,这里差不多有80次的任务都已经执行完毕了,还有大概20个任务正在计算中,也就是对应还有200MB的对象在引用着,这部分对象是不会被回收的,而我们的幸存者区域最大也就是150MB无法存放下200MB,那么根据我们讲过的空间担保机制,这200MB对象会直接进入到老年代!

由于每一分钟就会将Eden区填满触发Minor GC,也就是每分钟就会有200MB对象进入到老年代,那当老年代的内存占用的越多后会发生什么事情呢?比如两分钟过去了,这时占用400MB,那老年代可用空间就只剩1.1G了,那第三分钟触发Minor GC的时候,一判断发现,老年代剩余空间已小于Eden区所有对象1.2G大小了,则会走另一条分支的判断了,我们可以根据下图再来回顾下:

先看参数: -XX:-HandlePromotionFailure是否设置,当然一般都会设置,此时会判断老年代连续空间是否大于历史平均晋升老年代对象的大小,那历史晋升对象大小都在200MB,很明显大于,那么JVM会直接进行冒险操作,触发Minor GC的执行,而本次冒险是成功的!新生代依然继续晋升200MB对象到老年代。

那么当系统运行到第7分钟的时候,这时进入到老年代的对象有1.4G了,剩余空间仅剩100MB!如下图:

系统运行到这儿,发现老年代剩余空间已经比历史平均晋升对象大小都要小了,这时会直接触发Full GC!假设老年代空间都可以被回收,那么这时老年代对象就完全清除,接着会继续进行Minor GC,200MB对象继续进入老年代,又开始重复循环执行了。

那么按照以上的运行分析,我们可以得出一个结论就是:系统平均运行7、8分钟左右就会触发一次Full GC的执行!而每次一旦Full GC执行,就会严重影响到系统的运行效率,加上该系统的Full GC频率较高,给用户带来的使用感受是非常糟糕的!

4.JVM优化

像真实开发中大家也有很大几率会遇到类似这样的情况,我们应该减少Full GC的次数以及降低它出现的频率,甚至不触发Full GC,那么如何进行优化呢?这也是考验一个Java程序员的价值体现。

针对类似的计算系统,每次Minor GC的时候,必然会有一部分数据没处理完毕,但是按照现有的内存模型,我们的幸存者区域只有150MB是无法满足200MB对象的存放,因此有必要调整我们的内存比例。

解决方案:

3GB的堆内存大小,我们直接分配2G给新生代,1G给老年代,这样Survivor区的大小就有200MB了每次刚好能存放下MinorGC过后存活的对象了。如下图所示:

只要每次Minor GC时200MB存活对象可以存放进Survivor区,那么等下一次Minor GC时这部分对象对应的计算任务也已经结束,也可以直接进行回收。

那么接下来我们还是在继续模拟跑一次,当Eden区内存已经装满,此时S0区也有200MB对象,这是触发Minor GC的执行,200MB正在执行的任务对象(存活对象)直接转移到S1区,回收清空掉Eden区和S0区,如下图:

那么通过以上的分析也不免看出,基本上很少会有对象进入到老年代,我们也成功的将几分钟一次的Full GC降低到几个小时一次,大幅度提升了系统的性能,避免了Full GC对系统运行的影响!

当然这里其实还有一个细节点:就是动态年龄对象规则!如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到-XX: MaxTenuringThreshold中要求的年龄。 这里需要结合自己公司的实际系统分析到底有多少对象是根据动态年龄规则进入到了老年代,如果要避免因为这项规则进入老年代,从而触发Full GC也可以尝试调整Eden区和Survivor区的比例,调整survivor区的大小。

目录
相关文章
|
2月前
|
机器学习/深度学习 算法 PyTorch
125_训练加速:FlashAttention集成 - 推导注意力优化的独特内存节省
2025年,大型语言模型的训练面临着前所未有的挑战。随着模型参数量和序列长度的不断增加,传统注意力机制的内存瓶颈问题日益突出。FlashAttention作为一种突破性的注意力算法,通过创新的内存访问模式和计算优化,显著提升了训练效率和内存利用。
|
2月前
|
存储 机器学习/深度学习 PyTorch
119_LLM训练的高效内存管理与优化技术:从ZeRO到Flash Attention
大型语言模型(LLM)的训练面临着前所未有的计算和内存挑战。随着模型规模达到数百亿甚至数千亿参数,高效的内存管理成为训练成功的关键因素之一。2025年,LLM训练的内存优化技术已经取得了显著进展,从ZeRO优化器到Flash Attention等创新技术,为训练超大规模模型提供了可能。
|
6月前
|
存储 弹性计算 缓存
阿里云服务器ECS经济型、通用算力、计算型、通用和内存型选购指南及使用场景分析
本文详细解析阿里云ECS服务器的经济型、通用算力型、计算型、通用型和内存型实例的区别及适用场景,涵盖性能特点、配置比例与实际应用,助你根据业务需求精准选型,提升资源利用率并降低成本。
469 3
|
5月前
|
缓存 固态存储 Windows
如何让内存发挥到最大效能?全面优化指南,提升电脑运行体验
电脑内存使用不合理会导致卡顿,本文教你如何优化内存性能。检查内存容量与主板支持上限,考虑升级或调整配置;关闭后台程序、管理浏览器标签、结束异常进程以释放内存;设置虚拟内存、调整视觉效果、定期重启提升效率;必要时增加内存条、选择高频内存、更换固态硬盘。避免盲目清理内存和依赖大内存忽视其他硬件瓶颈。只需合理设置,无需额外花钱,就能显著提升电脑速度。
|
2月前
|
设计模式 缓存 Java
【JUC】(4)从JMM内存模型的角度来分析CAS并发性问题
本篇文章将从JMM内存模型的角度来分析CAS并发性问题; 内容包含:介绍JMM、CAS、balking犹豫模式、二次检查锁、指令重排问题
130 1
|
5月前
|
存储 人工智能 自然语言处理
AI代理内存消耗过大?9种优化策略对比分析
在AI代理系统中,多代理协作虽能提升整体准确性,但真正决定性能的关键因素之一是**内存管理**。随着对话深度和长度的增加,内存消耗呈指数级增长,主要源于历史上下文、工具调用记录、数据库查询结果等组件的持续积累。本文深入探讨了从基础到高级的九种内存优化技术,涵盖顺序存储、滑动窗口、摘要型内存、基于检索的系统、内存增强变换器、分层优化、图形化记忆网络、压缩整合策略以及类操作系统内存管理。通过统一框架下的代码实现与性能评估,分析了每种技术的适用场景与局限性,为构建高效、可扩展的AI代理系统提供了系统性的优化路径和技术参考。
290 4
AI代理内存消耗过大?9种优化策略对比分析
|
5月前
|
存储 人工智能 API
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
在AI代理系统开发中,上下文工程成为提升系统性能的关键技术。本文探讨了从提示工程到上下文工程的转变,强调其通过为AI系统提供背景信息和工具支持,显著提升智能化程度和实用价值。文章系统分析了上下文工程的理论基础、核心策略(如写入、选择、压缩和隔离),并结合LangChain和LangGraph工具,展示了如何实现上下文工程技术以优化AI代理性能。通过Scratchpad机制、内存管理、RAG系统集成、多代理架构及沙盒环境等技术手段,开发者可以更高效地构建高性能、可扩展的AI系统。
584 0
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
|
4月前
|
边缘计算 算法 Java
Java 绿色计算与性能优化:从内存管理到能耗降低的全方位优化策略与实践技巧
本文探讨了Java绿色计算与性能优化的技术方案和应用实例。文章从JVM调优(包括垃圾回收器选择、内存管理和并发优化)、代码优化(数据结构选择、对象创建和I/O操作优化)等方面提出优化策略,并结合电商平台、社交平台和智能工厂的实际案例,展示了通过Java新特性提升性能、降低能耗的显著效果。最终指出,综合运用这些优化方法不仅能提高系统性能,还能实现绿色计算目标,为企业节省成本并符合环保要求。
175 0
|
5月前
|
存储
阿里云轻量应用服务器收费标准价格表:200Mbps带宽、CPU内存及存储配置详解
阿里云香港轻量应用服务器,200Mbps带宽,免备案,支持多IP及国际线路,月租25元起,年付享8.5折优惠,适用于网站、应用等多种场景。
1866 0
|
5月前
|
存储 缓存 NoSQL
内存管理基础:数据结构的存储方式
数据结构在内存中的存储方式主要包括连续存储、链式存储、索引存储和散列存储。连续存储如数组,数据元素按顺序连续存放,访问速度快但扩展性差;链式存储如链表,通过指针连接分散的节点,便于插入删除但访问效率低;索引存储通过索引表提高查找效率,常用于数据库系统;散列存储如哈希表,通过哈希函数实现快速存取,但需处理冲突。不同场景下应根据访问模式、数据规模和操作频率选择合适的存储结构,甚至结合多种方式以达到最优性能。掌握这些存储机制是构建高效程序和理解高级数据结构的基础。
552 1

热门文章

最新文章