Cache-DiT:唯品会开源的扩散模型推理加速框架

摘要

DiT模型推理面临时序冗余、注意力成本高和显存压力三大瓶颈。Cache-DiT框架通过统一缓存抽象、DBCache分区缓存、UAA并行、SVDQuant量化及Bucket式Offload等可组合优化,将FLUX.1-dev在单卡L20上从24.85秒加速至约4.5秒,实现5.52倍提速。

欢迎在评论区写下你对这篇文章的看法。

评论

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-13 01:26
浙ICP备14020137号-1 $방문자$