类库 › vibe-serve
uw-syfi

uw-syfi/vibe-serve

VibeServe利用AI智能体为特定模型、硬件和负载定制生成专用的LLM推理服务系统。通过多智能体优化循环,自动生成调度、缓存及性能优化代码,旨在替代通用运行时,在主流及特殊场景下实现媲美vLLM的高性能部署。

uw-syfi/vibe-serve

截图

docs/figures/architecture.png

评论

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-28 01:46
浙ICP备14020137号-1 $Гость$