中间件与数据库：Kafka的相关资料

爱彼迎如何构建下一代键值存储

Mussel V2重构解决了V1在运维复杂度、容量热点、一致性灵活性及成本透明度上的挑战，采用NewSQL后端，实现自动化、可扩展的键值存储。通过蓝绿迁移策略，成功将1PB数据迁移至V2，确保零数据丢失和零停机。新架构结合Kafka、Kubernetes，优化了批量导入、TTL管理，提升了读写性能和系统稳定性。

airbnb技术

Synchronizing the Senses: Powering Multimodal Intelligence for Video Search

视频搜索面临多模态数据融合的复杂挑战，需整合人物识别、场景分析和对话解析等模型输出。Netflix通过分阶段的处理管道，实现了高效的时间线同步和大规模数据处理，确保搜索结果精准且实时。系统支持多种搜索模式和动态相似度计算，提升语义匹配的准确性。未来将推进自然语言搜索和自适应排序，进一步优化用户体验，助力创意团队高效挖掘关键片段。

netflix技术

大禹平台：流批一体离线Dump平台的设计与应用

大禹平台是一个离线Dump平台，专注于搜索、推荐、广告场景的异构数据处理。平台采用流批一体架构，通过可视化DAG编排工具提升开发效率，确保数据质量与稳定性。其核心优化包括MySQL镜像至HBase、Binlog订阅平台化、状态大宽表消除反查等，支持任务复用与分层管理，显著加速数据处理与Dump流程。未来将持续增强算子体系与性能优化，深化与索引平台的协同，释放更多业务价值。

得物技术

Introducing uFowarder: The Consumer Proxy for Kafka Async Queuing

Uber开发了uForwarder，一个基于Kafka的推送式消费者代理，用于优化硬件效率、确保消费者隔离、解决队头阻塞和支持消息延迟处理。该系统通过gRPC接口抽象Kafka消费者管理复杂性，支持上下文感知路由和延迟处理机制，提升消息队列性能和可靠性。uForwarder已开源，旨在简化大规模数据处理场景下的消息队列应用。

uber技术

用Go重构C++老系统，一次降本82%的极致之旅

QQ游戏成就系统重构，从C++同步直写转向Go+Kafka异步队列，大幅提升性能和稳定性。通过Kafka分区机制，将并发写转为串行写，减少CAS冲突，CPU和内存使用率显著降低。重构后，服务器资源成本减少82%，CAS写入错误率降至接近0%，系统响应速度提升40%。整体架构优化，为高并发场景提供更强支撑。

腾讯技术

Kafka、RocketMQ、JMQ 存储架构深度对比

消息队列存储架构是关键，Kafka、RocketMQ、JMQ各具特色。Kafka以Topic-Partition为核心，依赖顺序I/O和mmap实现高吞吐。RocketMQ采用CommitLog+ConsumeQueue+IndexFile三层结构，分离数据存储与索引查询。JMQ结合两者优点，以PartitionGroup为基本单元，优化写入和读取性能，适合高并发场景。

京东技术

中原银行开源消息中间件的落地实践

中原银行从RabbitMQ转向Pulsar，解决了脑裂风险、扩展性不足等问题。Pulsar的存算分离架构提升了资源利用率，支持动态伸缩与云原生部署，增强了稳定性和容错能力。银行还对Pulsar进行了深度定制，优化了跨区域网络管理、客户端SDK功能和集群部署模式，实现了双活架构，显著提高了资源利用率和容灾能力。未来将探索消息平台的智能化，提升运维效率。

从Kafka到AutoMQ：爱奇艺实时流数据架构演进

爱奇艺流数据架构升级记：从私有云Kafka到AutoMQ的华丽转身！面对集群弹性差、成本高难题，团队先通过Stream平台+SDK实现业务与存储解耦，再引入公有云Kafka提升资源利用率。最终押注存算分离的AutoMQ，单副本设计+秒级弹性让成本直降70%。现在近半流量跑在云端，未来还要继续扩大AutoMQ版图~（138字）

爱奇艺技术

RocketMQ高性能揭秘：承载万亿级流量的架构奥秘

RocketMQ作为高性能分布式消息中间件，采用生产者、消费者、NameServer和Broker四组件协同设计，实现消息全链路解耦。其核心架构优化包括NameServer的轻量级服务发现、Broker的消息存储与转发、Producer与Consumer的高效模型，以及高可用设计和刷盘策略优化，确保金融级可靠性和万亿级消息堆积能力。

得物技术

Contributing to Debezium: Fixing Logical Replication at Scale

Zalando通过Debezium和PostgreSQL逻辑复制处理海量事件流，解决了WAL增长和LSN管理难题。贡献了lsn.flush.mode和offset.mismatch.strategy配置选项，允许用户根据需求选择LSN刷新和偏移量处理策略，防止低活跃数据库的WAL膨胀，并优化了重启时的偏移量同步问题。这些改进确保了逻辑复制的稳定性和灵活性，适用于大规模生产环境。

zalando技术

How Uber Indexes Streaming Data with Pull-Based Ingestion in OpenSearch™

Uber的搜索平台采用拉取式数据模型，基于Apache Kafka构建，实现了高可用性和全球一致性。通过多区域部署和流式数据处理，平台能够高效处理实时请求，确保数据新鲜度和系统稳定性。拉取式模型解决了传统推送模型在高流量下的性能瓶颈，简化了数据重放和优先级控制。Uber还将这一模型贡献给OpenSearch项目，推动了开源社区的发展。

uber技术

From Batch to Streaming: Accelerating Data Freshness in Uber’s Data Lake

Uber 重新设计了数据湖的摄取系统 IngestionNext，基于 Apache Flink 实现了流式处理，将数据新鲜度从小时级提升至分钟级，同时降低了计算成本。该系统解决了小文件生成、分区倾斜等问题，并通过行组合并优化了 Parquet 文件的压缩效率。IngestionNext 还增强了容错性和自动化管理，确保在故障时数据不丢失。未来，Uber 计划进一步扩展实时数据处理能力，以支持端到端的实时洞察和分析。

uber技术

Blazing Fast OLAP on Uber’s Inventory and Catalog Data with Apache Pinot™

Uber Eats采用Apache Pinot™处理海量商品数据，支持实时搜索和低延迟分析。核心实体为“产品”和“商品”，通过Kafka实时更新数据，Pinot提供快速查询和聚合功能。优化了非拉丁文本搜索，引入UUID哈希函数减少内存占用，并升级Java运行时提升性能。通过小段合并任务，显著降低查询延迟和表大小，支持无限保留用例。

uber技术

流式应用服务灾备体系建设实践与场景化应用

数据服务总线平台（NRDP）构建同城双中心级灾备集群，通过数据双写、主备双活及全方位监控，提升业务连续性与可靠性。用户可通过升级Kafka客户端SDK实现灾备切换，确保业务在各种场景下持续运行。NRDP还支持定制化灾备升级，帮助用户完成灾备建设，提升全行业务场景连续性。

Real-time data quality monitoring: Kafka stream contracts with syntactic and semantic test

数据质量监控是AI创新的基石，但Kafka流数据的语法和语义问题常导致下游故障。Coban平台创新性地通过数据契约定义、自动化测试和实时告警三大模块破解难题：用户可自定义字段级语义规则，平台通过FlinkSQL实时检测异常数据并精准定位问题字段，同时结合LLM智能推荐规则降低配置门槛。上线后已守护100+关键数据流，实现秒级问题拦截。未来将拓展数据溯源和跨字段校验能力，打造更立体的数据质量防护网。

grab技术

Architecting AI Agent Auditing Systems in Agentforce: Overcoming Data Cloud and Kafka Integration Challenges

Madhavi Kavathekar领导的团队成功将AI审计系统与Data Cloud集成，解决了技术挑战，并通过Kafka处理了不可预测的AI流量。该系统支持500家企业客户，每月处理2000万次模型交互，确保信任、安全和合规。团队采用迭代开发，优化了数据管道架构，动态调整流量控制，提升了系统性能和可扩展性。

salesforce技术