类库
› verl-omni
verl-project/verl-omni
VeRL-Omni是一个专注于扩散模型和全模态模型的强化学习训练框架。它提供高效的 rollout、灵活的奖励管道及模块化后端,支持图像、视频、音频等多模态生成任务的 RL 后训练,旨在提升训练吞吐量与稳定性。
技术栈
根目录 python
框架
FastAPI
查看全部依赖 (26)
依赖
NumPy
Pandas
accelerate
cachetools
codetiming
datasets
diffusers
dill
hydra-core
latex2sympy2_extended
liger-kernel
math_verify
packaging
peft
pre-commit
pyarrow
pybind11
pylatexenc
ray
tensorboard
tensordict
torchdata
transformers
uvicorn
verl
wandb