类库 › krasis
brontoguana

brontoguana/krasis

Krasis是一个混合LLM运行时,专注于在消费者级VRAM有限硬件上高效运行大型专家混合模型。它使用Python编排的Rust MoE运行时,能在普通硬件上运行2000亿+参数的大模型,支持全GPU预填充和高效的CPU解码,实现实用速度。

brontoguana/krasis

截图

Krasis Server

评论

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-06 01:34
浙ICP备14020137号-1 $방문자$