Improved Alerting with Atlas Streaming Eval

摘要

Netflix采用基于实时流式度量的告警方式,用于处理高维度/基数限制的时间序列数据库。这种方法可以支持更多的用例,提高系统的可靠性,避免误报和漏报。另外,流式评估可以放松高基数限制,监控并警报一些高基数用例,如从自由形式日志数据中派生的指标。Netflix还将其应用健康监控系统Telltale从轮询指标缓存转换为实时Atlas流式处理,以检测异常并计算相关性,减少故障恢复平均时间(MTTR)。此外,Netflix发现流式度量方法不受监视查询数量的限制,且支持更高的度量维度/基数,这为更精确的警报和更好的可观察性提供了机会。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2024 iteam. Current version is 2.123.4. UTC+08:00, 2024-04-20 14:07
浙ICP备14020137号-1 $访客地图$