类库 › verl-omni
verl-project

verl-project/verl-omni

VeRL-Omni是一个专注于扩散模型和全模态模型的强化学习训练框架。它提供高效的 rollout、灵活的奖励管道及模块化后端,支持图像、视频、音频等多模态生成任务的 RL 后训练,旨在提升训练吞吐量与稳定性。

verl-project/verl-omni

技术栈

根目录 python

框架

FastAPI
查看全部依赖 (26)

依赖

NumPy Pandas accelerate cachetools codetiming datasets diffusers dill hydra-core latex2sympy2_extended liger-kernel math_verify packaging peft pre-commit pyarrow pybind11 pylatexenc ray tensorboard tensordict torchdata transformers uvicorn verl wandb

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-13 09:12
浙ICP备14020137号-1 $Map of visitor$