类库 › gpustack
gpustack

gpustack/gpustack

GPUStack是一个开源GPU集群管理器,专为高效部署AI模型而设计。它通过选择最佳推理引擎(如vLLM、SGLang)、调度GPU资源、分析模型架构和自动配置参数,帮助用户在自有GPU硬件上实现优化的AI推理吞吐量。

4,762 489 4,762 541
在 GitHub 上查看
gpustack/gpustack

技术栈

查看全部依赖 (26)

依赖

NumPy Pydantic aiohappyeyeballs aiohttp aiosignal annotated-types anyio attrs certifi distro frozenlist h11 httpcore httpx httpx-aiohttp idna jiter multidict openai propcache pydantic_core sniffio tqdm typing-inspection typing_extensions yarl

截图

gpustack-v2-architecture
a100-throughput-comparison
deploy qwen3 from catalog
model is running
quick chat

评论

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-02 17:17
浙ICP备14020137号-1 $Carte des visiteurs$