类库
› dflash-mlx
Aryagm/dflash-mlx
基于MLX框架为Apple Silicon设备实现DFlash推测解码加速库,可显著提升大语言模型(如Qwen3/3.5)的推理速度,支持命令行和Python API调用。
截图
基于MLX框架为Apple Silicon设备实现DFlash推测解码加速库,可显著提升大语言模型(如Qwen3/3.5)的推理速度,支持命令行和Python API调用。