Cache-DiT：唯品会开源的扩散模型推理加速框架

온라인도구

反馈

자세히

出处：mp.weixin.qq.com

DiT模型推理面临时序冗余、注意力成本高和显存压力三大瓶颈。Cache-DiT框架通过统一缓存抽象、DBCache分区缓存、UAA并行、SVDQuant量化及Bucket式Offload等可组合优化，将FLUX.1-dev在单卡L20上从24.85秒加速至约4.5秒，实现5.52倍提速。

阅读原文

xiaozi 于 2026-06-12 分享

897

欢迎在评论区写下你对这篇文章的看法。

据说喜欢分享的,后来都成了大神

一场说走就走的旅行归来后，除了该做的事情被拖延的更久了，什么都没有改变。