中间件与数据库：Kafka的相关资料

Kafka双活演练自动化及一次失败演练总结

Kafka双活建设完成后，通过自动化编排和切换验证备机房集群能力。切换流程包括修改Partition副本列表和分批选举Leader副本。自动化流程涵盖工单创建、数据编排、分批切换及一键回滚。演练中因幂等逻辑漏洞导致编排失败，通过排查定位问题并优化校验逻辑，确保后续演练顺利进行。

信也技术

去哪儿 KAFKA 再度优化-提升服务上限35%

文章探讨了在节日流量高峰时，KAFKA集群面临的性能瓶颈，特别是生产压缩率低导致的服务端压力增大问题。通过优化Filebeat的批次发送参数和内存队列配置，提升了压缩率，减少了服务端的请求量和流量消耗。优化后，集群的CPU使用率、网络流量和磁盘存储均显著降低，KAFKA的处理能力提升了35%，有效保障了业务的稳定性和数据的完整性。

携程技术

Event-Driven AI: Building a Research Assistant with Kafka and Flink

Agentic AI的兴起使得自主任务执行和复杂工作流成为可能，但在实际应用中面临架构挑战。通过事件驱动架构（EDA），可以实现灵活、高效的数据交换，避免依赖瓶颈。PodPrep AI是一个AI驱动的研究助理，展示了EDA如何在复杂的分布式系统中实现无缝数据集成和可扩展性。该系统使用实时数据流和Flink等工具，实现独立组件的高效协作，提升AI应用的效率和灵活性。

Kafka Streams 在监控场景的应用与实践

介绍 Kafka Streams 的原理架构，常见配置以及在监控场景的应用。

vivo技术

货拉拉消息中间件之Kafka架构演进

随着货拉拉业务的快速增长，Kafka集群流量和负载也呈现出明显的增长趋势。作为货拉拉业务核心的消息中间件，Kafka架构也做了相应架构演进。本篇文章将会重点介绍过去、现在kafka架构的演进历程。

货拉拉技术

Pinterest Tiered Storage for Apache Kafka®️: A Broker-Decoupled Approach

When it comes to PubSub solutions, few have achieved higher degrees of ubiquity, community support, and adoption than Apache Kafka®️, which has become the industry standard for data transportation at large scale. At Pinterest, petabytes of data are transported through PubSub pipelines every day, powering foundational systems such as AI training, content safety and relevance, and real-time ad bidding, bringing inspiration to hundreds of millions of Pinners worldwide. Given the continuous growth in PubSub-dependent use cases and organic data volume, it became paramount that PubSub storage must be scaled to meet growing storage demands while lowering the per-unit cost of storage.

pinterest技术

DoorDash Empowers Engineers with Kafka Self-Serve

Learn how DoorDash built a Kafka self-serve platform to streamline infrastructure management, empower engineers, and enhance scalability and security.

doordash技术

Soul APP Kafka系统性治理之路

Apache Kafka 的定位是一个分布式流处理平台，它被设计用于处理高吞吐量的数据流。Kafka 能够在不同的系统和应用程序之间提供实时的数据传输、存储和流处理功能。Kafka 在现代数据架构中扮演着“承上启下”的角色，这意味着它在数据流和处理的不同阶段之间起到了桥梁的作用。具体来说，Kafka 可以从上游系统接收数据，并将其有效地传递到下游系统，同时还能在这些过程中对数据进行加工和处理。Kafka 成为了现代数据架构中不可或缺的消息引擎及流处理平台。

Soul技术

图解Kafka：架构设计、消息可靠、数据持久、高性能背后的底层原理

在构建高吞吐量和高可靠性的消息系统时，Apache Kafka 成为了众多程序员的首选。本文深入剖析了 Kafka 的内部机制，从宏观架构到消息流转的细节，揭示了 Kafka 如何通过精心设计的系统组件和策略，实现消息的异步处理和流量管理。

本文将带你探索 Kafka 的 ack 策略、数据持久化技术以及提升系统性能的关键设计，包括批量处理、压缩、PageCache 和零拷贝等技术。同时，文章还涵盖了负载均衡和集群管理，为你提供一个全面视角，理解 Kafka 如何满足大规模分布式系统中对消息队列的严苛要求。

腾讯技术

Flipkart 异步总线如何实现不停机从 Kafka 迁移到 Pulsar

Flipkart 是印度领先的电子商务平台之一。我们基于 Kafka 打造的异步总线承接了公司海量的 HTTP 调用和消息传输。但随着业务的发展，Kafka 已经不能跟上公司快速变化的业务发展要求。随着调研和测试，我们最终决定使用 Pulsar 替换 Kafka。

从 Kafka 迁移到 Pulsar 给我们带来了诸多优势。Pulsar 内置的企业级功能，减少了我们自行开发和维护的成本，也降低了系统的总体复杂性。在 Kafka 中，这些高级功能都需要额外构建和维护。

Setting Up Kafka Multi-Tenancy

Discover how DoorDash implemented a multi-tenancy awareness system for both Kafka producers and consumers.

doordash技术

Introduction to Kafka Tiered Storage at Uber

Uber提出了Kafka分层存储方案，用于解决Kafka集群存储的扩展性、效率和操作成本问题。该方案通过引入本地和远程两个存储层，实现了存储的扩展性和长期存储的可行性。远程存储层可以使用不同的扩展存储，并具有更长的数据保留期。分层存储方案减轻了Kafka代理的本地存储负担，降低了操作成本。此外，该方案通过引入RemoteLogManager和RemoteStorageManager等组件，实现了远程日志的复制、获取和删除操作，并提供元数据的生命周期管理。分层存储方案的架构图展示了本地和远程日志的复制过程，以及远程日志的清理过程。跟随者副本需要复制可在领导者本地存储中找到的段，并在开始从领导者获取任何消息之前构建辅助数据。

uber技术