知乎基于Celeborn优化Spark Shuffle的实践 - herramientas en línea

herramientas en línea

herramientas en línea

lista de clasificación

反馈

herramientas en línea

biblioteca mío

más

知乎基于 Celeborn 优化 Spark Shuffle 的实践

出处：zhuanlan.zhihu.com

摘要

知乎使用Hadoop和Spark集群进行大量作业处理，每天的Shuffle量达到3PB以上，单个作业的Shuffle量最大接近100TB。为了保证稳定性，知乎使用了ESS作为Spark的Shuffle服务。然而，ESS存在一些限制，如大量的随机IO导致磁盘IOPS瓶颈，降低作业性能和稳定性。知乎经常遇到IO负载高的节点导致作业耗时不稳定、失败等问题。解决这些问题的方法是减少Shuffle Read Block的数量和大小。

阅读原文

xiaozi 于 2024-06-29 分享

46

关联话题： #知乎

欢迎在评论区写下你对这篇文章的看法。

评论

据说喜欢分享的,后来都成了大神

国别域名注册8折优惠

vultr activity

tencent

这辈子最灿烂的笑容，大概都奉献给，我的手机屏幕了。

文库

更多

inicio - Wiki
Copyright © 2011-2024 iteam. Current version is 2.129.0. UTC+08:00, 2024-07-01 19:13
浙ICP备14020137号-1 $mapa de visitantes$