中间件与数据库：StarRocks的相关资料

广告投流第一战：如何用 StarRocks 搞定“起量监控”与“素材优选”？

广告投流全链路中，展示→点击阶段的CTR优化是核心难题。StarRocks实时分析方案通过Flink+明细表+物化视图架构，实现分钟级CTR监控与素材优选，解决冷启动慢、素材衰退、空跑浪费三大痛点。Pinterest案例显示，该方案使查询延迟降50%、成本降68%，数据新鲜度达10秒级，助力广告主快速决策，提升投放效率。

基于StarRocks释放天玑买量数据价值

天玑买量平台面临数据孤岛、实时性与查询性能难以兼顾等问题，决定基于StarRocks构建统一数仓。新架构通过简化存储层、消除冗余存储类型，解决了跨数据源查询与时效性问题。SR的高吞吐写入、部分列更新和物化视图技术，显著提升了数据准确性和查询效率，降低了开发成本，满足了复杂OLAP需求。

爱奇艺技术

告别 Count Distinct 慢查询：StarRocks 高效去重全攻略

在大数据分析中，去重计算（如 Count Distinct）常因高基数和高并发成为性能瓶颈。StarRocks 提供了多种优化策略，包括以精度换性能、数据类型转换、使用 Bitmap 或 HLL 数据结构，以及通过物化视图预计算。结合实际应用场景，这些方案在性能、精度与易用性之间进行权衡，有效提升查询效率。

去哪儿StarRocks实践

去哪儿网数据平台引入StarRocks作为统一OLAP引擎，替代了Trino、Presto等多引擎架构，解决了兼容性、性能和运维难题。StarRocks支持实时和批量数据导入，具备高效查询和智能优化能力，显著提升了系统性能。通过集群监控、灾备方案和SQL优化，实现了稳定高效的运行，支持看板、即席查询等多场景，未来计划结合Kubernetes和物化视图进一步提升实时数仓能力。

携程技术

京东物流基于Flink & StarRocks的湖仓建设实践

京东物流实时湖仓建设中，结合Flink与StarRocks，优化了数据流处理与存储架构。通过联邦查询与物化视图，实现了分钟级数据聚合与查询，支持复杂业务场景。存算分离策略降低了存储成本，提升了长周期数据的访问效率。未来将推广长周期数据存储服务，进一步优化数据分析体验。

深度剖析 StarRocks 读取 ORC 加密文件背后的技术

本文深入解析了StarRocks数据库如何高效读取ORC加密文件。通过剖析ORC文件的三层索引和四层结构，详细介绍了加密数据的读取流程，包括密钥管理、数据解密与解压的协作机制。重点探讨了加密块的跳读机制，结合AES加密模式与压缩算法的应用，提升了查询效率与数据安全性。

vivo技术

Building a Spark observability product with StarRocks: Real-time and historical performance analysis

Grab 的 Spark 可观测性工具 Iris 通过引入 StarRocks 数据库，解决了实时和历史数据管理的挑战。新架构简化了数据流，支持复杂查询和实时监控，提升了查询性能和用户体验。通过 Kafka 直接数据摄入、物化视图和动态分区优化，Iris 实现了高效的数据存储与分析，为 Spark 作业提供了更强大的监控和调试能力，推动了资源管理和决策效率的提升。

grab技术

StarRocks 在七猫的应用(四)-探索 StarRocks 读取 Paimon 优势及物化视图加速能力

面对海量小说数据，StarRocks通过直接查询、Data Cache和异步物化视图，显著提升查询效率。其Catalog功能简化了Paimon数据湖的管理，支持多元数据融合分析，助力精准推荐和内容创作。未来，StarRocks将优化元数据管理、执行计划和物化视图，进一步强化实时数据处理能力，推动公司业务发展。

七猫技术

StarRocks 在七猫的应用(三)-实时数据写入与查询性能优化

StarRocks在实时数据处理中表现出色，通过Delete & Insert模式、CBO优化器和向量化执行引擎，显著提升了数据导入和查询性能。开发流程简化，数据准确性高，运维便捷。针对复杂查询，使用物化视图和二级分区策略，进一步优化了查询效率，大幅减少了数据扫描量，提升了查询速度。

七猫技术

腾讯大数据基于 StarRocks 的向量检索探索

向量检索技术通过近似最近邻查询(ANN)提升性能,结合量化、倒排和图算法(如HNSW)实现高效检索。StarRocks引入该技术后,查询延迟从15秒降至2秒,成本降至1/3。该技术适用于大模型场景,支持混合检索、范围查询等,优化了前过滤与后过滤策略,确保高召回率和低延迟,为海量数据处理提供高效解决方案。

深入解析 StarRocks 物化视图：全方位的查询改写机制

查询改写让分析更简单、更高效！

StarRocks存算分离在得物的降本增效实践

Clickhouse虽然单机性能首屈一指，但分布式架构存在水平扩展性、元数据管理，数据一致性，join查询性能等一系列问题。随着业务增长，集群面临一些实际问题。

得物技术

全托管 StarRocks 在七猫的应用和实践

现在七猫有多套全托管 StarRocks 集群在生产环境投入了使用，部分 StarRocks 集群从 EMR StarRocks 集群逐步升级成为全托管 StarRocks 集群。据不完全统计，数据治理前离线数据加实时数据，总数据量大约在 20PB 左右。

七猫技术

探索 StarRocks on Kubernetes

StarRocks是一个高性能的分析型数据库，专为大规模数据分析而设计。它采用了MPP(Massively Parallel Processing)架构，能够在多个节点上并行处理查询，从而实现快速响应。

微信作为国内活跃用户最多的社交软件，其数据平台建设经历了从 Hadoop 到 ClickHouse 亚秒级实时数仓的阶段，但仍旧面临着数据体验割裂、存储冗余的问题。通过 StarRocks 的湖仓一体方案，以及和社区密切配合开发的实时增量物化视图，微信解决了“实时、极速”背后的“统一”诉求。在直播业务场景中，通过湖上建仓的方案改造，使得数据开发同学需要运维的任务数减半，同时存储成本降低65%以上，离线任务产出时间缩短两小时。

当前，基于 StarRocks 的湖仓一体方案已经在微信的多个业务场景中上线使用，包括视频号直播、微信键盘、微信读书和公众号等，集群规模达到数百台机器，数据接入量近千亿，向理想化的湖仓一体形态不断演进。

中间件与数据库：StarRocks的相关资料

中间件与数据库：StarRocks

广告投流第一战：如何用 StarRocks 搞定“起量监控”与“素材优选”？

基于StarRocks释放天玑买量数据价值

告别 Count Distinct 慢查询：StarRocks 高效去重全攻略

去哪儿StarRocks实践

京东物流基于Flink & StarRocks的湖仓建设实践

深度剖析 StarRocks 读取 ORC 加密文件背后的技术

Building a Spark observability product with StarRocks: Real-time and historical performance analysis

StarRocks 在七猫的应用(四)-探索 StarRocks 读取 Paimon 优势及物化视图加速能力

StarRocks 在七猫的应用(三)-实时数据写入与查询性能优化

腾讯大数据基于 StarRocks 的向量检索探索

深入解析 StarRocks 物化视图：全方位的查询改写机制

StarRocks存算分离在得物的降本增效实践

StarRocks在同程旅行的应用与实践

全托管 StarRocks 在七猫的应用和实践

探索 StarRocks on Kubernetes

微信基于 StarRocks 的湖仓一体实践