去哪儿 KAFKA 性能优化-节省 2000 核 CPU

摘要

去哪儿旅行的Kafka日志集群在春节压测期间遇到性能问题,导致部分客户端堆积和数据生产异常。集群网络闲置率降低到0.4以下,部分机器接近闲置,无法通过增加机器解决性能问题。经排查,发现数据量增大和高峰期pod扩展导致网络链接数增加影响性能。通过将num.io.threads参数从32修改为128,优化了Kafka本身解决了问题,并节省了2000核CPU。此外,将单盘改为双盘并没有提升闲置率。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-24 14:02
浙ICP备14020137号-1 $访客地图$