基于 StarRocks 的极速实时数据分析实践

摘要

在汽车之家内部,实时数据的来源主要是三部分:

  • 手机端户行为的日志;
  • 应用程序的服务端的日志;
  • MySQL、SQLServer数据。

实时数据分析场景,目前面临的一些痛点包括:

  • 使用 Flink 做指标聚合,Flink 聚合不灵活,面对需求的时候开发成本比较高的,面对多变的需求,经常需要重复开发;
  • Kylin 支持指标预计算,并发支持较好,但是不能够支持高效的明细数据查询。在一些需要下钻或者获取明细数据的场景支撑的不够好;
  • TiDB 不支持预聚合模型,某些数据量大的场景,聚合指标需要在线计算。在线计算会导致服务器压力瞬间增大,而且查询性能不稳定,取决于参与计算的数据量和当时服务器的负载情况。

欢迎在评论区写下你对这篇文章的看法。

评论

Accueil - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-15 10:25
浙ICP备14020137号-1 $Carte des visiteurs$