分布式时序数据库在流利说的应用
摘要
随着越来越多的监控指标(机器,容器,服务网格,网关,业务等)产生,使用单个巨大的 Prometheus 来存储和提供查询无论从可用性还是性能都不能满足我们的要求,所以我们对此进行了类别维度的垂直切分,通过多个较小的 Prometheus 节点存储相应的数据。这种方式虽然解决了上面提到的部分问题,但是对于查询来说不够友好,查询具体指标时去找实例和类别指标之间的映射关系,降低了研发效率和幸福感。为了解决这个问题,我们把所有实例的指标通过 RemoteWrite 方式同步到云厂商提供的服务里作为统一操作界面。运行一段时间我们发现无论存储成本还是查询响应时间都不够理想,于是我们开始了分布式时序数据库自建的历程。
欢迎在评论区写下你对这篇文章的看法。