类库
› dflash
z-lab/dflash
DFlash是一个轻量级块扩散模型,专为Flash投机解码设计。它通过高效的并行草稿生成,显著提升大语言模型的推理速度和质量。该仓库提供多种主流模型(如Gemma、Qwen系列)的DFlash适配版本,适用于需要加速LLM生成的AI应用场景。
DFlash是一个轻量级块扩散模型,专为Flash投机解码设计。它通过高效的并行草稿生成,显著提升大语言模型的推理速度和质量。该仓库提供多种主流模型(如Gemma、Qwen系列)的DFlash适配版本,适用于需要加速LLM生成的AI应用场景。
Home
-
Wiki
Copyright © 2011-2026 iteam.
Current version is 2.155.2.
UTC+08:00, 2026-05-11 21:04
浙ICP备14020137号-1
$Map of visitor$