该仓库使用预训练的U2NET模型进行服装解析,将人像中的衣物划分为上身、下身和全身三个类别,并生成相应的alpha图像。
这是一个用于动漫角色高精度分割的仓库,支持多种模型,提供在线演示,并可下载训练好的模型。
StyleSelectorXL是一个Automatic1111扩展,允许用户使用SDXL 1.0选择和应用不同的样式,增强输入的表现力。
Kohya's GUI是一个基于Gradio的图形用户界面,旨在简化扩散模型的训练,支持多种训练方法和参数设置,适合图像生成模型自定义及风格训练。
这是一个基于PyTorch的音频生成库,通过扩散模型实现无条件和文本条件的音频生成,适合多种格式,灵活可定制。
Bert-VITS2是基于多语言BERT的自回归语音合成框架,旨在提供高质量的文本到语音转换,适合开发者进行自定义训练和应用。
这个仓库提供了一个基于Streamlit和HuggingFace API的零-shot分类器应用,便于用户进行分类任务。
ER-NeRF是一个高效的区域感知神经辐射场模型,专用于高保真说话人像合成,适用于生成动态表情视频。
FaceFusion是一个行业领先的人脸处理平台,支持多种人脸操作和批处理功能,适合技术用户使用。
ProPainter是一个用于视频修复的工具,旨在改善视频中的传播和变换效果,提升修复质量。