类库 › krasis
brontoguana

brontoguana/krasis

Krasis是一个混合LLM运行时,专注于在消费者级VRAM有限硬件上高效运行大型专家混合模型。它使用Python编排的Rust MoE运行时,能在普通硬件上运行2000亿+参数的大模型,支持全GPU预填充和高效的CPU解码,实现实用速度。

brontoguana/krasis

评论

inicio - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-03 06:26
浙ICP备14020137号-1 $mapa de visitantes$