Accelerating Deep Learning: How Uber Optimized Petastorm for High-Throughput and Reproducible GPU Training

Online Tools

Online Tools

反馈

Online Tools

Home Topic

Library Code Library Shop

Accelerating Deep Learning: How Uber Optimized Petastorm for High-Throughput and Reproducible GPU Training

出处：www.uber.com

存档：存档

译文：中文

摘要

Uber通过优化Petastorm数据加载器，解决了大规模深度学习模型训练中的GPU利用率低和训练不可复现的问题。通过本地磁盘缓存和并行化数据转换，GPU利用率从10-15%提升至60%以上，训练时间从22小时缩短至3小时，计算成本降低80%。同时，消除数据加载中的随机性，确保训练结果的复现性。这些优化显著提升了训练效率和模型迭代速度。

阅读原文

xiaozi 于 2026-05-03 分享

2235

关联话题： #Uber

欢迎在评论区写下你对这篇文章的看法。