中间件与数据库：ClickHouse的相关资料

9亿数据归因分析跑进15秒：携程智能归因系统如何用 Ray+DuckDB 破解算力危机？

携程智能归因团队通过引入Ray+DuckDB架构，成功解决了大数据分析中的性能瓶颈问题。Ray作为分布式计算框架，实现了动态资源调度和高性能对象存储，而DuckDB则以其向量化引擎和列式存储提供了极致的单机查询性能。这一组合将9亿+数据的归因分析耗时从40秒降至15秒，性能提升160%，同时消除了资源争抢问题，显著提升了系统稳定性和扩展性。

百度MEG数据中台ClickHouse在数据湖仓中的探索和应用

百度MEG数据中台构建了存算分离的湖仓一体架构，解决了传统ClickHouse面临的长周期存储成本高、即席探索链路冗长、故障恢复缓慢等问题。通过冷热分层缓存、数据上卷及布局优化，显著提升了查询性能。同时，引入统一查询网关，支持将复杂查询透明降级至Spark运行，确保系统稳定性。该架构已在多个业务线成功应用，提升了数据分析效率和用户体验。

Flink ClickHouse Sink：生产级高可用写入方案

Flink ClickHouse Sink生产级方案深度解析！针对开源组件痛点，创新实现本地表直写、动态分表路由、双触发攒批机制，通过HikariCP连接池优化与递归重试策略，完美支撑百万级TPS日志场景。方案涵盖流量控制、内存管理、异常隔离等核心设计，配合Checkpoint强一致性保障，为实时数仓提供高可靠写入能力。技术亮点层层拆解，最佳实践一目了然！

得物技术

360智汇云KV数据库ZestKV详解

ZestKV是一款云原生KV存储服务，解决了Pika在存储容量、弹性扩缩容等方面的不足。其采用存算分离架构，支持多租户和弹性扩缩容，提升了数据隔离和资源利用率。与Pika相比，ZestKV在性能、数据持久性和使用成本上均有显著优势，未来还将探索多模数据库和细粒度多租户功能。

360技术

AliSQL 向量技术解析（二）：读写缓存与事务并发

AliSQL 8.0通过引入节点缓存（Nodes Cache）优化向量搜索性能，分为公共缓存和事务缓存，支持读已提交隔离级别。采用预计算和SIMD指令加速向量计算，提升查询效率75%。读写并发通过锁机制保障安全，目前仅支持读读和读写并发。后续将优化写写并发与全局缓存管理。

阿里巴巴技术

腾讯技术面：聊聊MySQL五大核心模块

MySQL核心技术架构详解：分层逻辑结构包括连接层、服务层和存储引擎层；InnoDB存储引擎采用B+树索引与MVCC机制，支持高效事务处理与并发控制；主从复制通过Binlog实现数据同步；分区策略优化大数据管理。深入理解MySQL运行机制，提升数据库性能与可靠性。

腾讯技术

Blazing Fast OLAP on Uber’s Inventory and Catalog Data with Apache Pinot™

Uber Eats采用Apache Pinot™处理海量商品数据，支持实时搜索和低延迟分析。核心实体为“产品”和“商品”，通过Kafka实时更新数据，Pinot提供快速查询和聚合功能。优化了非拉丁文本搜索，引入UUID哈希函数减少内存占用，并升级Java运行时提升性能。通过小段合并任务，显著降低查询延迟和表大小，支持无限保留用例。

uber技术

ClickHouse 的“独孤九剑”：极速查询的终极秘籍

ClickHouse凭借其独特的架构和技术创新，在大数据分析领域脱颖而出。采用列式存储和向量化引擎，大幅提升查询效率；预排序和表引擎设计优化了数据访问；分片与副本策略增强了系统扩展性和容错性。稀疏索引和跳数索引进一步加速查询。这些技术共同作用，使ClickHouse在处理海量数据时表现出色，成为联机分析处理的利器。

京东技术

ClickHouse 的“独孤九剑”：极速查询的终极秘籍

ClickHouse凭借其独特架构和技术创新，在大数据分析领域脱颖而出。其列式存储、向量化执行引擎和数据压缩技术显著提升了查询效率。分布式架构和分片副本策略进一步增强了处理能力和容错性。这些特性共同造就了ClickHouse在海量数据处理中的卓越表现，成为OLAP领域的佼佼者。

京东技术

ClickHouse BSI与字典服务在B站商业化DMP中的应用实践

DMP（数据管理平台）为广告部门提供B站用户数据的管理。主要功能包括用户标签收集存储，标签市场建设，人群包圈选，人群画像分析，人群/特征定向几大功能模块。

其中人群包圈选和人群画像分析是两大核心功能。对设计，性能，扩展性，可维护性都有比较高的要求。也是本文中要讨论的ClickHouse技术的应用场景。在实践中，我们利用ClickHouse的bitmap相关功能，实现了人群包的实时预估和计算，也实现了人群包画像的分钟级计算。

哔哩哔哩技术

中间件与数据库：ClickHouse的相关资料

中间件与数据库：ClickHouse

9亿数据归因分析跑进15秒：携程智能归因系统如何用 Ray+DuckDB 破解算力危机？

百度MEG数据中台ClickHouse在数据湖仓中的探索和应用

Flink ClickHouse Sink：生产级高可用写入方案

360智汇云KV数据库ZestKV详解

AliSQL 向量技术解析（二）：读写缓存与事务并发

腾讯技术面：聊聊MySQL五大核心模块

Blazing Fast OLAP on Uber’s Inventory and Catalog Data with Apache Pinot™

ClickHouse 的“独孤九剑”：极速查询的终极秘籍

ClickHouse 的“独孤九剑”：极速查询的终极秘籍

ClickHouse BSI与字典服务在B站商业化DMP中的应用实践

CDP技术系列（二）：ClickHouse+Bitmap实现海量数据标签及群体组合计算

《ClickHouse：强大的数据分析引擎》

ClickHouse在百度MEG数据中台的落地和优化

ClickHouse在京东能源管理平台的实践

ClickHouse物化视图里常见的7个坑，你踩过几个？

数据库不应放在容器中？- B站Kubernetes有状态服务实践(Elasticsearch/Clickhouse)