类库
› dflash
z-lab/dflash
DFlash是一个轻量级块扩散模型,专为Flash投机解码设计。它通过高效的并行草稿生成,显著提升大语言模型的推理速度和质量。该仓库提供多种主流模型(如Gemma、Qwen系列)的DFlash适配版本,适用于需要加速LLM生成的AI应用场景。
DFlash是一个轻量级块扩散模型,专为Flash投机解码设计。它通过高效的并行草稿生成,显著提升大语言模型的推理速度和质量。该仓库提供多种主流模型(如Gemma、Qwen系列)的DFlash适配版本,适用于需要加速LLM生成的AI应用场景。