类库 › tuna-2
facebookresearch

facebookresearch/tuna-2

TUNA-2是Meta等机构提出的统一多模态模型,通过直接对图像像素块进行嵌入,无需传统视觉编码器,在统一的理解与生成任务上表现优异。该仓库提供了官方实现代码,主要用于训练和评估此类视觉语言模型。

facebookresearch/tuna-2

技术栈

lmms-eval/lmms_eval/tasks/megabench python

网络

Requests
查看全部依赖 (15)

依赖

NumPy Requests Unidecode antlr4-python3-runtime filelock geopy jieba nltk pronouncing rapidfuzz regex requests_cache sacrebleu sympy tqdm

根目录 python

查看全部依赖 (14)

依赖

NumPy einops huggingface-hub hydra-core omegaconf pillow safetensors tokenizers torch torchdiffeq torchtnt torchvision tqdm transformers

截图

assets/teaser.png

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-01 20:18
浙ICP备14020137号-1 $Map of visitor$