中间件与数据库:ClickHouse
火山引擎在行为分析场景下的 ClickHouse JOIN 优化
随着接入应用以及应用的 DAU 日益增加,ClickHouse 表的事件量增长迅速;并且基于行为数据需要分析的业务指标越来越复杂,需要 JOIN 的表增多;我们遇到有一些涉及到 JOIN 的复杂 SQL 执行效率低,内存和 CPU 资源占用高,导致分析接口响应时延和错误率增加。
漫谈Clickhouse Join
随着公司业务的不断发展,不同业务线数据都有了大规模积累。在此基础上为了精细化运营,更好地服务客户,就需要通过积累的数据沉淀出各类实体标签,比如用户标签、帖子标签、基金标签。
ClickHouse增强计划之“多表关联查询”
如何加强ClickHouse多表关联查询能力?
基于Clickhouse的下一代日志系统技术揭秘
唯品会日志系统dragonfly 1.0基于EFK构建,随着公司的业务发展,日志应用场景逐渐遇到了一些瓶颈,ELK的架构的缺点显现,鉴于出现的问题,我们开始探索新的日志系统架构,该文章揭秘唯品会现用的基于clickhouse的日志系统技术。
如何利用ClickHouse搭建OLAP?
我们今天要介绍的是另一匹黑马-ClickHouse-号称比Hive快126倍的OLAP利器。
SRE实战(02)Clickhouse在好大夫服务治理中的落地应用
随着SRE的概念逐步推广,越来越多的业务接入微服务治理平台,大量数据也随之而来,ElasticSearch对海量日志的实时分析逐渐出现了性能问题。另外,随着治理平台自身的发展以及各种监控大盘的陆续上马,业务研发对日志可视化的实时性要求也越来越高,查询的数据规模和范围也越来越大。
为了不让平台建设拖SRE落地的后腿,经过调研,我们最终选择了Clickhouse这一新生利器。接下来我来汇报一下,Clickhouse在好大夫微服务治理中是如何落地实战的。
ClickHouse在工业互联网场景的OLAP平台建设实践
京东工业是2021独立出来成立的新事业群-京东工业事业群,包括工业品、工业服务、工业互联等四大板块业务。工业互联业务主要是搭建工业互联网平台,用于将实时现场工业数据汇入平台进行分析,做数据智能工作。目前支持业务有国家电网管理平台、综合能源、碳中和交易、电力交易等业务。
京东云ClickHouse和ES双引擎设计在零售选品中的应用实践
涅槃选品是京东零售内的战略级bigboss项目,项目主要致力于构建商品底层能力,打通提报、投放流程,实现选品的线上化、规则化与智能化;通过多方协作盘货,充分表达营销、品类、运营/采销等多方意志。
业务上的多样化需求,导致在项目初期面临以下众多技术难点与挑战。
微信 ClickHouse 实时数仓的最佳实践
微信作为一款国民级应用,已经覆盖了社交、支付、出行等人们生活的方方面面。海量多样化的业务形态,对数据分析提出了新的挑战。为了满足业务数据分析的需求,微信 WeOLAP 团队联手腾讯云,共建千台规模、数据 PB 级、批流一体的 ClickHouse 数据仓库,实现了 10 倍以上的性能提升。下文将由浅入深,为大家揭晓微信在 ClickHouse 实时数仓实践中积累的经验及方法。
基于EMR OLAP的开源实时数仓解决方案之ClickHouse事务实现
Flink 和 ClickHouse 分别是实时流式计算和 OLAP 领域的翘楚,很多互联网、广告、游戏等客户都将两者联合使用于构建用户画像、实时 BI 报表、应用监控指标查询、监控等业务,形成了实时数仓解决方案(如图-1)。这些业务对数据的准确性要求都十分严格,所以实时数仓整个链路需要保证端到端的 Exactly-Once。通常来说 Flink 的上游是可以重复读取或者消费的 pull-based 持久化存储(例如Kafka),要实现 Source 端的 Exactly-Once 只需要回溯 Source 端的读取进度即可。Sink 端的 Exactly-Once 则比较复杂,因为 Sink 是 push-based 的,需要依赖目标输出系统的事务保证,但社区 ClickHouse 对事务并不支持,所以针对此情况阿里云 EMR ClickHouse 与 Flink 团队一起深度研发,支持了 Flink 到 ClickHouse 的 Exactly-Once写入来保证整个实时数仓数据的准确性。本文将分别介绍下现有机制以及实现方案。
Apache Doris和ClickHouse的深度分析
全面分析对比了Apache Doris和ClickHouse各自的优劣势。
Shopee ClickHouse 冷热数据分离存储架构与实践
使用 JuiceFS 客户端 mount 远端对象存储到本地机器路径,通过编写 ClickHouse 的存储策略,如同使用多卷存储一样使用远端对象存储。
基于ClickHouse的用户行为分析系统
本文分享的是一个“亿级数据秒级分析”。包括但不限于介绍用户行为分析系统的组成、ClickHouse集群的部署、从Hive到ClickHouse的推数、用户数据及建表以及五种行为分析等。
Clickhouse在唯品会的实践
目前唯品会在实时领域主要使用Flink +ClickHouse解决方案,覆盖业务场景主要包括实验平台、agamotto监控、OLAP 查询日志等,整体响应80%在5秒内完成,大大提升了用户实时取数体验,推动业务快速迭代发展。
ClickHouse 在有赞的实践之路
本文主要介绍了 ClickHouse 的简单原理,有赞 OLAP 相关组件以及 ClickHouse 在有赞的实践之路。
Clickhouse的实践之路
在数据量日益增长的当下,传统数据库的查询性能已满足不了我们的业务需求。而Clickhouse在OLAP领域的快速崛起引起了我们的注意,于是我们引入Clickhouse并不断优化系统性能,提供高可用集群环境。本文主要讲述如何通过Clickhouse结合大数据生态来定制一套完善的数据分析方案、如何打造完备的运维管理平台以降低维护成本,并结合具体案例说明Clickhouse的实践过程。