类库
› mini-sglang
sgl-project/mini-sglang
mini-sglang 是一个轻量级高性能的大型语言模型推理框架,通过约5000行Python代码实现,提供先进的优化功能如Radix缓存、张量并行和FlashAttention集成,旨在简化现代LLM服务系统复杂度,适用于研究和开发。
截图
mini-sglang 是一个轻量级高性能的大型语言模型推理框架,通过约5000行Python代码实现,提供先进的优化功能如Radix缓存、张量并行和FlashAttention集成,旨在简化现代LLM服务系统复杂度,适用于研究和开发。
Home
-
Wiki
Copyright © 2011-2026 iteam.
Current version is 2.155.2.
UTC+08:00, 2026-05-10 21:39
浙ICP备14020137号-1
$Map of visitor$