中间件与数据库:Flink

京东零售基于Flink的推荐系统智能数据体系

京东零售技术专家张颖在Flink峰会上揭秘了基于Flink构建的智能推荐数据体系。核心架构包含索引、样本、特征、可解释性和指标五大模块,通过实时+离线双链路保障数据一致性。重点解决了特征穿越、样本冷启动等难题,并创新采用分阶段窗口机制实现秒级实时样本拼接。可解释性模块能精准追踪推荐全链路决策过程,为效果优化提供数据支撑。整个体系日均处理PB级数据,显著提升了推荐系统的智能化水平。

Lalamove基于Flink实时湖仓演进之路

Lalamove利用Flink技术构建实时数仓,应对业务扩张带来的技术挑战,如多数据中心、时区差异和上游系统频繁改造。通过引入Paimon湖仓和Flink新特性,实现了数据模型兼容性、资源优化和成本降低。未来,Lalamove将继续探索湖流融合技术,进一步提升实时数仓的性能和效率。

京东物流基于Flink & StarRocks的湖仓建设实践

京东物流实时湖仓建设中,结合Flink与StarRocks,优化了数据流处理与存储架构。通过联邦查询与物化视图,实现了分钟级数据聚合与查询,支持复杂业务场景。存算分离策略降低了存储成本,提升了长周期数据的访问效率。未来将推广长周期数据存储服务,进一步优化数据分析体验。

基于Flink的配置化实时反作弊系统

基于Flink的实时反作弊流式过滤系统,通过秒级特征计算、高频策略热更新、模拟过滤验证及多场景数仓对接,解决了大流量场景下的复杂特征计算与策略迭代难题。系统优化了窗口触发机制与状态存储,提升高并发下的精准风控判定,支持实时监控与离线分析,为互联网业务提供高效、低延迟的反作弊解决方案。

Flink CDC YAML:面向数据集成的 API 设计

Flink CDC通过数据库日志捕获实现全量与增量数据的一体化读取,升级至3.0版本后支持从源到目的地的流畅数据集成。提供CDC YAML、Flink SQL和DataStream API,其中YAML API最推荐,支持Schema演化、行过滤等高级特性。相比传统方案,Flink CDC简化了流程,支持端到端亚秒级延迟和精确一次语义。Transform环节增强了数据加工能力,并支持与AI模型集成,实现实时数据同步和处理。

Event-Driven AI: Building a Research Assistant with Kafka and Flink

Agentic AI的兴起使得自主任务执行和复杂工作流成为可能,但在实际应用中面临架构挑战。通过事件驱动架构(EDA),可以实现灵活、高效的数据交换,避免依赖瓶颈。PodPrep AI是一个AI驱动的研究助理,展示了EDA如何在复杂的分布式系统中实现无缝数据集成和可扩展性。该系统使用实时数据流和Flink等工具,实现独立组件的高效协作,提升AI应用的效率和灵活性。

Flink+Paimon实时数据湖仓实践分享

随着Paimon近两年的推广普及,使用 Flink+Paimon 构建数据湖仓的实践也越来越多。本文主要分享了使用 Paimon 作为实时状态存储,并在 Flink 中通过 Lookup 维表 Join 的方式进行状态查询和更新的应用实践。

基于Flink的实时风控解决方案

大数据领域的数据处理从大的分类看有批处理和流式处理

Flink在同程艺龙实时计算平台的研发与应用实践

我们在18年初选择基于Flink开发同程艺龙新一代实时计算平台。目前已支撑近千个实时任务运行,服务公司的市场、机票、火车票、酒店、金服、国旅、研发等各个业务条线。下面主要结合实时计算平台分享下我们在Flink落地过程中的一些实践经验及思考。

基于图遍历的Flink任务画布模式下零代码开发实现方案

提交一个DataSteam 的 Flink应用,需要经过 StreamGraph、JobGraph、ExecutionGraph 三个阶段的转换生成可成执行的有向无环图(DAG),并在 Flink 集群上运行。

Flink CDC 在货拉拉的落地与实践

分享了货拉拉在 Flink CDC 生产实践落地,系统的介绍业务背景,技术选型,整体能力构建与收益,以及开源参与以及未来开展的工作和期望。

Flink CDC 在新能源制造业的实践

本文撰写自某新能源企业的研发工程师 单葛尧 老师。本文详细介绍该新能源企业的大数据平台中 CDC 技术架构选型和 Flink CDC 的最佳实践。

Apache Flink® on Kubernetes

At Airbnb, Apache Flink was introduced in 2018 as a supplementary solution for stream processing. It ran alongside Apache Spark™ Streaming for several years before transitioning to become the primary stream processing platform. In this blog post, we will delve into the evolution of Flink architecture at Airbnb and compare our prior Hadoop Yarn platform with the current Kubernetes-based architecture. Additionally, we will discuss the efforts undertaken throughout the migration process and explore the challenges that arose during this journey. In the end we will summarize the impact, learnings along the way and future plans.

得物Flink内核探索实践

在众多实时处理框架中,Apache Flink以其强大的流处理能力和丰富的功能集,受到了广泛关注和应用。本次分享将重点介绍得物在Flink内核方面的探索与实践,探讨如何通过深度优化和定制,实现更加高效和稳定的数据处理能力。

芒果 TV 基于 Flink 的实时数仓建设实践

基于 Flink 技术的特点,芒果 TV 在未来的数仓建设中将注重实现湖仓一体的架构,以实现对数据的全面管理和利用。

基于 Flink 的实时数仓在曹操出行运营中的应用

本次分享将为大家介绍实时数仓在曹操出行(互联网网约车出行企业)的实时数仓应用场景,以及通过离线场景向实时场景下加速升级而获得的业务价值。

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.144.0. UTC+08:00, 2025-07-08 21:15
浙ICP备14020137号-1 $Map of visitor$