Apache Kylin 原理介绍与新架构分享(Kylin On Parquet)

摘要

Kylin是一个开源的分布式分析引擎,可在亚秒内查询大规模的Hive表。它通过预计算来加速固定模式的OLAP查询,基于Cube理论进行计算。Kylin适配用户的查询计划,使其能够查询预计算过的Cube数据。预计算能够大幅降低数据扫描和计算量,并跳过Agg和Join流程,提高查询性能和并发。此外,Kylin还支持按order by的列进行排序,消除Sort操作,减少计算任务和shuffle的次数,提升查询并发度。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2024 iteam. Current version is 2.124.0. UTC+08:00, 2024-05-02 12:05
浙ICP备14020137号-1 $访客地图$