类库
› krasis
brontoguana/krasis
Krasis是一个混合LLM运行时,专注于在消费者级VRAM有限硬件上高效运行大型专家混合模型。它使用Python编排的Rust MoE运行时,能在普通硬件上运行2000亿+参数的大模型,支持全GPU预填充和高效的CPU解码,实现实用速度。
Krasis是一个混合LLM运行时,专注于在消费者级VRAM有限硬件上高效运行大型专家混合模型。它使用Python编排的Rust MoE运行时,能在普通硬件上运行2000亿+参数的大模型,支持全GPU预填充和高效的CPU解码,实现实用速度。
Home
-
Wiki
Copyright © 2011-2026 iteam.
Current version is 2.155.2.
UTC+08:00, 2026-06-27 17:19
浙ICP备14020137号-1
$Map of visitor$