类库
› vime
vllm-project/vime
Vime是基于vLLM的LLM后训练框架,专为强化学习扩展设计。它结合Slime的训练栈与vLLM作为默认回滚后端,提供高性能训练和灵活的数据生成功能。支持Qwen、DeepSeek及Llama等主流模型,旨在为vLLM生态提供生产就绪的训练解决方案。
技术栈
根目录 python
查看全部依赖 (24)
依赖
accelerate
anthropic
blobfile
cloudpickle
datasets
e2b
httpx
mcp
memray
numba
omegaconf
openai
openai-agents
pillow
pylatexenc
pyyaml
qwen_vl_utils
ray
ring_flash_attn
safetensors
tensorboard
transformers
vllm-router
wandb
截图