为了账号安全,请及时绑定邮箱和手机立即绑定

JVM调优实战:G1中的to-space exhausted问题

标签:
Java JVM

最近刚刚将自己的一个应用从CMS升级到G1,在一天早上,刚刚到办公室坐下,就收到手机一阵报警,去查看了监控,发现机器的内存出现了一个90度的涨幅,如下图所示:
图片描述

在查看GC日志后,发现那个时间点附近出现了“to-space exhausted”这种日志(关于G1的日志学习,参见我之前的文章:【译】深入理解G1的GC日志(一)

图片描述

在这里,我比较奇怪的是为啥to-sapce exhausted会导致整个机器的内存激增。我们JVM团队同学给我的解释是:老区不够了,这个时候会把young区所有对象不管死活都转成old区对象,所以总的内存使用量会暴增。这一个知识点,我之前学习G1的时候还真没有get到(关于G1的基本知识,参见之前的文章:可能是最全面的G1学习笔记)。

不过,我有另外一个疑问:xmx和xms相同的话堆空间应该不变,一开始就分配5g,然后加上非堆内存,那么java进程起来后就会超过5g,这是没问题的;但是这里利用空闲的内存也应该是利用堆上的空间,然后整体的内存块应该已经分配出去了,应该不会出现机器内存激增的情况。JVM团队的同学给我解释道:没有,第一次读写到了才会实际从os分配出来物理内存。

针对上面的问题,我们最终确定了下面的调优建议:

  • 这次没有发生FGC,可能是由于我前面将xmx和xms调大了导致的,这次准备将xmx和xms先调回到原来的值;
  • 加上HeapDumpAfterFullGC参数,下次再发生类似情况的时候,就会触发FGC,然后自动dump堆内存,就可以针对堆内存进行分析,看看是什么对象占用了这么多内存,然后就可以针对性优化。

关于to-space exhausted的更多总结

基于上面这个问题,我又去找了一些资料,整理如下。

《Java性能权威指南》

在这本书的123页有提到,上面这种情况属于晋升失败的情况——G1收集器完成了标记阶段,开始启动混合式垃圾收集,准备要清理老年代分区,但是老年代分区在垃圾收集器释放出足够的空间之前就已经被耗尽了。这种失败通常意味着混合式垃圾收集需要更迅速得完成垃圾收集,每次新生代垃圾收集需要处理更多的老年代分区。一般来说,一系列的to-space exhausted之后会跟着一次FGC。

在我们上面的这个例子中,是old区的使用速度超过了垃圾收集器的回收速度,因此可以考虑两种调优的思路

  • 让G1更早得启动混合式垃圾收集周期,通过调小-XX:InitiatingHeapOccupancyPercent=N这个参数,默认情况下该参数是45(PS:这个参数表示的是占用整个堆内存的比例),不过,这个参数也不能调得太小,否则会导致过多的并发收集周期和混合式垃圾收集,给应用早成过多的停顿。
  • 除了考虑增加速度,还可以考虑增加每次混合式垃圾收集收集的Old分区数量,通过调整-XX:G1MixedGCCountTarget=N参数可以控制每个混合式周期中回收的Old分区数量,该参数的默认值是8;

《Java性能调优指南》

要特别关注日志片段中的"to-space exhausted"和“Evacuation Failure”两个日志,如下图所示。可以看出,Evacuation Failure消耗了684.1ms,也就是说,这次转移失败导致了将近1s的应用暂停。
图片描述

这种情况属于转移失败,这本书给出了两点建议:

  • 和《Java性能权威指南》一样,也建议调小-XX:InitiatingHeapOccupancyPercent=N这个参数的值,因为转移失败的代价比多执行一些并发标记周期高很多
  • 建议通过调整-XX:ConcGCThreads,增加用于垃圾收集的线程个数,代价是会多一些CPU的消耗;也就是会占用Java应用的CPU时间,这一点也需要权衡一下。
  • 有时候转移失败是由于survivor分区中没有足够的空间容纳新晋升的对象,如果是这种情况,还可以考虑增加-XX:G1ReservePercent的大小,在G1中这个默认值是10%。

总结

JVM参数的调优,是一个不断推导和尝试的过程,其中最重要的数据就是GC日志和Java堆内存快照,因此:(1)在JVM参数中一定要设置HeapDumpAfterFullGC和HeapDumpOnOutOfMemoryError两个参数,可以在发送FGC和OOM的时候将当时的Java堆情况记录下来,用于事后分析;(2)GC日志要单独打印到一个日志文件中,方便分析,如果不特别设置,GC日志会打印到stdout.log中,会有其他的日志混合在中间,影响问题排查。

JVM的参数调优并不是万能的,发生OOM或者FGC的时候,业务代码中也一定有不合理的地方,需要做合理的限制和优化,不能将所有的事情都交给JVM抗。

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
JAVA开发工程师
手记
粉丝
0
获赞与收藏
10

关注作者,订阅最新文章

阅读免费教程

  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消