类库
› tuna-2
facebookresearch/tuna-2
TUNA-2是Meta等机构提出的统一多模态模型,通过直接对图像像素块进行嵌入,无需传统视觉编码器,在统一的理解与生成任务上表现优异。该仓库提供了官方实现代码,主要用于训练和评估此类视觉语言模型。
技术栈
lmms-eval/lmms_eval/tasks/megabench python
网络
Requests
查看全部依赖 (15)
依赖
NumPy
Requests
Unidecode
antlr4-python3-runtime
filelock
geopy
jieba
nltk
pronouncing
rapidfuzz
regex
requests_cache
sacrebleu
sympy
tqdm
根目录 python
查看全部依赖 (14)
依赖
NumPy
einops
huggingface-hub
hydra-core
omegaconf
pillow
safetensors
tokenizers
torch
torchdiffeq
torchtnt
torchvision
tqdm
transformers
截图