GuoqingWang1/IGPO

类库 › IGPO

GuoqingWang1/IGPO

IGPO是基于信息增益的策略优化方法，专为多轮搜索智能体设计。该仓库提供核心训练代码及DR-Venus深度研究智能体的实现，支持长 horizon 任务，旨在提升智能体在复杂搜索基准测试中的性能与效率。

90 5 90 1

在 GitHub 上查看

技术栈

根目录 python

框架

FastAPI Flask

网络

Requests

查看全部依赖 (52)

依赖

Jinja2 NumPy Pandas Pillow PyYAML Pydantic accelerate aiohttp beautifulsoup4 cachetools cloudpickle codetiming datasets dill einops filelock html2text huggingface_hub hydra-core mammoth markdownify modelscope omegaconf openai packaging pathvalidate pdfminer.six peft psutil puremagic pyarrow pydub pylatexenc python-pptx ray safetensors serpapi setuptools smolagents starlette sympy tensordict tomli torch torchdata tqdm transformers triton uvicorn vllm wandb youtube_transcript_api

截图

GuoqingWang1/IGPO

GuoqingWang1/IGPO

技术栈

根目录 python

框架

网络

依赖

截图

相关项目

评论

项目信息

支持平台