OOM 排查之路:一次曲折的线上故障复盘

摘要

服务整合Paimon与RocksDB后,连续三次内存溢出(OOM)。首次OOM因Paimon表bucket数量过多,调整后解决。第二次OOM排查发现堆外内存泄漏,最终通过调低JVM堆内存、升级RPC框架等措施缓解。第三次OOM确认是RocksDB的JNI内存分配无法释放,最终改用Flink写Paimon解决。排查过程中使用了MAT、NMT、Arthas等工具。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.144.1. UTC+08:00, 2025-07-31 16:33
浙ICP备14020137号-1 $Map of visitor$