在启动一个Springboot工程时,抛出一项“Cannot allocate memory”异常,很明显,是因为内存分配原因导致的OOM异常导致JVM宕掉。跟随log,查看JVM hs_err_pid24442.log文件。
这里解释了可能的原因以及可能的解决措施:
可能的原因:
#系统已超出物理RAM或交换空间
#在32位模式下,进程大小受到限制
可能的解决方案:
#减少系统上的内存负载
#增加物理内存或交换空间
#检查交换后备存储器是否满
#在64位操作系统上使用64位Java
#减少Java堆大小(-Xmx/-Xms)
#减少Java线程的数量
#减少Java线程堆栈大小(-Xss)
#使用-XX:ReservedCodeCacheSize=设置较大的代码缓存
内存不足错误(os_linux.cpp:2640), pid=24442, tid=0x00007fd6af4f4700
JRE版本:Java(TM) SE运行时环境(8.0_131-b11) (build 1.8.0_131-b11)
Java VM: Java HotSpot(TM) 64位服务器VM (25.131-b11混合模式linux-amd64压缩oops)
写核心转储失败。核心转储已被禁用。要启用核心转储,请在再次启动Java之前尝试“ulimit -c unlimited”
1、ulimit -c unlimited:
按照carsh提供的可能解决方案,即ulimit -c unlimited。 用ulimit -a可以查看当前用户可执行的资源限制。使用ulimit -c unlimited来释放该限制。经尝试,无效。
2、释放缓存:
top查看当前内存的使用情况。
[root@iZwz90hf9uqjtrspga3v5bZ /]# echo 1 > /proc/sys/vm/drop_caches
0:不释放(系统默认值)
1:释放页缓存
2:释放dentries和inodes
3:释放所有缓存
释放缓存,增加内存空间。 经尝试,无效。
3、查看进程数是否上限:
[root@iZwz90hf9uqjtrspga3v5bZ /]# sysctl kernel.pid_max
kernel.pid_max = 32768
[root@iZwz90hf9uqjtrspga3v5bZ /]# ps -eLf |wc -l
1431
[root@iZwz90hf9uqjtrspga3v5bZ /]#
发现,最大上限为32768, 当前才1431,远不到上限。无效。
4、overcommit_memory:
内存分配策略。vm.overcommit_memory:
可选值:
0, 表示内核将检查是否有足够的可用内存供应用进程使用;如果有足够的可用内存,内存申请允许;否则,内存申请失败,并把错误返回给应用进程。
1, 表示内核允许分配所有的物理内存,而不管当前的内存状态如何。
2, 表示内核允许分配超过所有物理内存和交换空间总和的内存
Overcommit和OOM:
Linux对大部分申请内存的请求都回复"yes",以便能跑更多更大的程序。因为申请内存后,并不会马上使用内存。这种技术叫做Overcommit。当linux发现内存不足时,会发生OOM killer(OOM=out-of-memory)。它会选择杀死一些进程(用户态进程,不是内核线程),以便释放内存。
当oom-killer发生时,linux会选择杀死哪些进程?选择进程的函数是oom_badness函数(在mm/oom_kill.c中),该函数会计算每个进程的点数(0~1000)。点数越高,这个进程越有可能被杀死。每个进程的点数跟oom_score_adj有关,而且oom_score_adj可以被设置(-1000最低,1000最高)。
查看当前Crash文件:
CommitLimit=8758104 kB,Committed_AS=8573176 kB。为什么会分配不到内存呢?
CommitLimit是一个内存分配上限,CommitLimit = 物理内存 * overcommit_ratio(默认50,即50%) + swap大小
Committed_As是已经分配的内存大小。
overcommit_memory参数就是控制分配内存是否可以超过CommitLimit,
0默认值,即启发式的overcommitting handle,会尽量减少swap的使用,root可以分配比一般用户略多的内存;
1表示允许超过CommitLimit;
2表示不允许超过CommitLimit。
解决方案:
[root@iZwz90hf9uqjtrspga3v5bZ /]# vi /etc/sysctl.conf
将vm.overcommit_memory=2改为1。
[root@iZwz90hf9uqjtrspga3v5bZ /]# sysctl -p
配置立即生效。再次重启应用,正常。