兴盛优选云原生大型分布式监控告警系统实践
摘要
星斗云告警管理平台是一个解决监控指标存储和告警规则配置的平台。它通过自研的告警管理平台实现了动态识别应用负责人联系方式和告警重要程度的能力,并提供用户自定义告警规则。告警消息的处理流程是通过Alertmanager接收并路由告警消息,最后发送给用户。平台使用Kafka消息队列和数据库实现高并发的告警消息通知和存储。文章还分析了Prometheus和Alertmanager的使用情况,并介绍了基于kvass和thanos的解决方案。总的来说,该平台提供了一个大型分布式监控告警系统,解决了云原生下大规模监控告警问题。
欢迎在评论区写下你对这篇文章的看法。