类库 › mini-sglang
sgl-project

sgl-project/mini-sglang

mini-sglang 是一个轻量级高性能的大型语言模型推理框架,通过约5000行Python代码实现,提供先进的优化功能如Radix缓存、张量并行和FlashAttention集成,旨在简化现代LLM服务系统复杂度,适用于研究和开发。

4,143 626 4,143 47
在 GitHub 上查看
sgl-project/mini-sglang

截图

shell-example
offline
online

评论

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-11 01:50
浙ICP备14020137号-1 $Carte des visiteurs$