类库
› VRAG
Alibaba-NLP/VRAG
由阿里通义实验室开发的多模态检索增强生成框架,通过多轮多模态智能体强化学习实现更先进的RAG能力。支持构建自定义检索器、运行演示和模型训练,适用于增强大模型在图文视频等多模态场景下的理解和生成能力。
技术栈
根目录 python
框架
FastAPI
网络
Requests
查看全部依赖 (16)
依赖
NumPy
faiss-gpu
json5
openai
pdf2image
peft
pillow
qwen-vl-utils
sentence-transformers
streamlit
torch
torchcodec
tqdm
transformers
uvicorn
vllm
截图