Uber’ s Journey to Ray on Kubernetes: Ray Setup

摘要

Uber将机器学习工作负载迁移至Kubernetes,解决了资源管理复杂、利用率低和容量规划不灵活等问题。通过构建联邦资源管理架构,抽象化底层基础设施,实现自动化资源分配和优化。新架构显著提升了训练速度,并提高了GPU资源的利用率,最终在2024年初完成所有项目的迁移。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.142.1. UTC+08:00, 2025-04-04 17:07
浙ICP备14020137号-1 $访客地图$