类库
› mlx-dspark
ARahim3/mlx-dspark
基于MLX在Apple Silicon上原生运行DeepSeek DSpark和z-lab DFlash推测解码技术。支持Qwen3和Gemma-4等模型,提供无损加速(约1.8倍),可通过CLI、Python脚本或OpenAI兼容API服务,适用于本地LLM工具集成与基准测试。
截图
基于MLX在Apple Silicon上原生运行DeepSeek DSpark和z-lab DFlash推测解码技术。支持Qwen3和Gemma-4等模型,提供无损加速(约1.8倍),可通过CLI、Python脚本或OpenAI兼容API服务,适用于本地LLM工具集成与基准测试。