JRC Flink流作业调优指南

JRC Flink 流作业调优指南

出处：mp.weixin.qq.com

摘要

Apache Flink作为Google Dataflow Model的工业级实现，经过多年的发展，如今已经成为流式计算开源领域的事实标准。它具有高吞吐、低时延、原生流批一体、高一致性、高可用性、高伸缩性的特征，同时提供丰富的层级化API、时间窗口、状态化计算等语义，方便用户快速入门实时开发，构建实时计算体系。

古语有云，工欲善其事，必先利其器。要想让大规模、大流量的Flink作业高效运行，就必然要进行调优，并且理解其背后的原理。本文是笔者根据过往经验以及调优实践，结合京东实时计算平台（JRC）背景产出的面向专业人员的Flink流作业调优指南。主要包含以下四个方面：

TaskManager内存模型调优

网络栈调优

RocksDB与状态调优

其他调优项

本文基于Flink 1.12版本。阅读之前，建议读者对Flink基础组件、编程模型和运行时有较深入的了解。

阅读原文

xiaozi 于 2022-09-06 分享

5670

关联话题： #京东 #Flink

欢迎在评论区写下你对这篇文章的看法。

JRC Flink流作业调优指南

JRC Flink 流作业调优指南

摘要

评论

文库