类库
› ViTEraser
shannanyinxiang/ViTEraser
ViTEraser是AAAI 2024论文官方实现,利用Vision Transformers和SegMIM预训练进行场景文本去除。支持推理、模型权重下载及训练代码,旨在提升文本移除效果。
技术栈
根目录 python
查看全部依赖 (10)
依赖
NumPy
Pillow
imageio
matplotlib
opencv_python
pytorch-fid
scikit_image
scipy
timm
tqdm