XHS-Downloader是一个小红书链接提取与作品采集工具,支持提取账号作品、下载无水印文件及采集作品信息。
SMPLer-X是一个用于人类姿态和形状估计的框架,基于最新的深度学习技术,旨在提高估计精度和表现力。
vits_chinese是基于BERT和VITS的最佳实践文本转语音(TTS)项目,具有自然语音特性,支持ONNX流输出,适合TTS算法学习。
Audio Slicer 是一个简单的图形界面应用程序,能够通过静音检测切割音频文件,方便用户处理音频素材。
RAD-NeRF是一个实时神经辐射合成工具,通过音频空间分解生成动态人像,基于PyTorch实现,适合实时应用与研究。
sd-webui-fastblend 是一个无模型算法,旨在使视频平滑流畅,可去除视频中的闪烁或通过关键帧渲染流畅视频。
Autolabel是一个Python库,利用大型语言模型为文本数据集进行自动标注、清洗和丰富,提高机器学习的效率。
InSPyReNet是基于PyTorch的高分辨率显著性目标检测模型实现,利用图像金字塔结构提升检测效果。
SegFormer是一个基于Transformer的简单高效语义分割方法的官方PyTorch实现,提供训练、评估代码及预训练模型。
该仓库使用预训练的U2NET模型进行服装解析,将人像中的衣物划分为上身、下身和全身三个类别,并生成相应的alpha图像。