类库 › Search-R1
PeterGriffinJin

PeterGriffinJin/Search-R1

Search-R1是一个基于强化学习(veRL)的高效、可扩展训练框架,专门用于训练能够交替进行推理和调用搜索引擎(工具调用)的大型语言模型,可视为开源版的DeepSeek-R1或DeepResearch替代方案。

4,342 373 4,342 32
在 GitHub 上查看
PeterGriffinJin/Search-R1

技术栈

查看全部依赖 (16)

依赖

IPython unknown NumPy unknown Pandas unknown accelerate unknown codetiming unknown datasets unknown dill unknown flash-attn unknown hydra-core unknown matplotlib unknown pybind11 unknown ray unknown tensordict unknown transformers unknown vllm unknown wandb unknown

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-02 07:35
浙ICP备14020137号-1 $访客地图$