类库
› CLIP
openai/CLIP
CLIP是OpenAI开发的对比语言-图像预训练模型,能根据自然语言指令从图像中预测最相关的文本片段。它具备零样本学习能力,无需针对特定任务优化即可实现高精度图像分类与图文匹配,广泛应用于计算机视觉领域。
技术栈
根目录 python
查看全部依赖 (6)
依赖
ftfy
packaging
regex
torch
torchvision
tqdm
截图