类库 › Repo2RLEnv
huggingface

huggingface/Repo2RLEnv

Repo2RLEnv将任意GitHub仓库转化为可验证的强化学习环境。它从现有代码库合成训练与评估数据,导出为Harbor统一规范并推送至Hugging Face Hub,消除胶水代码需求,直接兼容Harbor运行时,助力RL模型的高效训练与评估。

评论

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-08 12:10
浙ICP备14020137号-1 $Гость$