Inpaint-Anything是一个强大的图像处理工具,支持在图片、视频和3D场景中智能去除或替换对象,满足用户的多样化图像编辑需求。
Jupyter Notebook
7,368
632
Apache License 2.0
7个月前
Bark是一个开源的文本到音频生成模型,能生成真实感强的多语言语音及其他音频,包括音乐和背景噪音,适用于研究和商业用途。
Jupyter Notebook
38,409
4,601
MIT License
7个月前
Grounded-Segment-Anything仓库结合了Grounding DINO和Segment Anything,旨在自动检测、分割和生成任何对象,提供强大的图像处理能力。
Jupyter Notebook
16,820
1,529
Apache License 2.0
7个月前
Segment Anything 是一个用于图像和视频分割的基础模型,提供代码、训练模型下载链接及示例,便于用户快速上手。
Jupyter Notebook
51,622
6,057
Apache License 2.0
7个月前
该仓库实现了“按顺序着装:用于姿态转移、虚拟试穿和服装编辑的人物图像生成”的研究,主要用于虚拟试穿和服装修改的研究和实践。
Jupyter Notebook
551
131
Other
8个月前
PIDM是一个通过去噪扩散模型进行人像合成的项目,提供了基于Google Colab的演示,便于用户生成高质量的人像图像。
Jupyter Notebook
496
60
MIT License
7个月前
该仓库提供CVPR 2021论文《运动表示用于关节动画》的源代码,旨在实现基于驱动视频的动画生成。
Jupyter Notebook
1,266
355
Other
8个月前
这个仓库提供了《第一阶运动模型图像动画》的源代码,主要用于将视频中的运动转移到静态图像上,适用于各种数据集的图像动画生成。
Jupyter Notebook
14,917
3,285
MIT License
7个月前
N46Whisper是一个Google Colab笔记本工具,用于快速生成日本字幕文件,旨在提高Nogizaka46等团体翻译者的生产力。
Jupyter Notebook
1,696
144
MIT License
7个月前
pyannote.audio是一个基于Python的开源工具包,主要用于说话人分离,提供语音活动检测、说话人变化检测及重叠语音检测等功能。
Jupyter Notebook
8,136
928
MIT License
7个月前
BLIP是一个基于PyTorch的库,用于统一的视觉-语言理解和生成,支持图像标注、视觉问答等任务,现已整合进LAVIS库。
Jupyter Notebook
5,446
713
BSD 3-Clause "New" or "Revised" License
7个月前
“让爷康康”是一款安卓手机应用,通过AI技术实时监测用户坐姿并提供语音提示,帮助改善不良坐姿习惯。
Jupyter Notebook
2,604
389
Apache License 2.0
7个月前
JoJoGAN是一个基于PyTorch的单次人脸风格化实现,旨在通过参照风格图像生成高质量的风格化人脸图像。
Jupyter Notebook
1,434
204
MIT License
7个月前
Disco Diffusion是一个结合多种笔记本和模型的AI艺术和动画生成工具,支持用户创造丰富的视觉作品。
Jupyter Notebook
7,451
1,111
Other
7个月前
pytorch-kt是一个便捷的知识追踪模型库,旨在帮助用户评估和实现知识追踪相关算法。
Jupyter Notebook
7
1
1年前

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-04 13:18
浙ICP备14020137号-1 $访客地图$