类库 › SteerViT
manugaurdl

manugaurdl/SteerViT

SteerViT是一个框架,可为任何视觉Transformer(ViT)模型添加通过自然语言指令来灵活调控其全局和局部视觉表征的能力。它基于预训练的ViT模型,使用户能够用文本描述指导模型关注特定的视觉特征或区域,增强模型的可解释性和控制性。

评论

trang chủ - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-23 20:46
浙ICP备14020137号-1 $bản đồ khách truy cập$