类库 › vibe-serve
uw-syfi

uw-syfi/vibe-serve

VibeServe利用AI智能体为特定模型、硬件和负载定制生成专用的LLM推理服务系统。通过多智能体优化循环,自动生成调度、缓存及性能优化代码,旨在替代通用运行时,在主流及特殊场景下实现媲美vLLM的高性能部署。

uw-syfi/vibe-serve

截图

docs/figures/idea.png
docs/figures/architecture.png

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-07-03 07:05
浙ICP备14020137号-1 $访客地图$