类库
› krasis
brontoguana/krasis
Krasis是一个混合LLM运行时,专注于在消费者级VRAM有限硬件上高效运行大型专家混合模型。它使用Python编排的Rust MoE运行时,能在普通硬件上运行2000亿+参数的大模型,支持全GPU预填充和高效的CPU解码,实现实用速度。
标签
截图
Krasis是一个混合LLM运行时,专注于在消费者级VRAM有限硬件上高效运行大型专家混合模型。它使用Python编排的Rust MoE运行时,能在普通硬件上运行2000亿+参数的大模型,支持全GPU预填充和高效的CPU解码,实现实用速度。