类库 › VRAG
Alibaba-NLP

Alibaba-NLP/VRAG

由阿里通义实验室开发的多模态检索增强生成框架,通过多轮多模态智能体强化学习实现更先进的RAG能力。支持构建自定义检索器、运行演示和模型训练,适用于增强大模型在图文视频等多模态场景下的理解和生成能力。

Alibaba-NLP/VRAG

技术栈

根目录 python

框架

FastAPI

网络

Requests
查看全部依赖 (16)

依赖

NumPy faiss-gpu json5 openai pdf2image peft pillow qwen-vl-utils sentence-transformers streamlit torch torchcodec tqdm transformers uvicorn vllm

截图

assets/compare.png
assets/gif1.gif
assets/gif2.GIF
assets/gif3.GIF
assets/rl.jpg
assets/vimrag_train.png

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-25 19:01
浙ICP备14020137号-1 $Map of visitor$