LightGlue是一个轻量级的特征匹配工具,利用深度神经网络快速匹配图像对中的局部特征,具有高准确率和快速推理能力。
vid2vid是一个基于Pytorch的视频翻译实现,能够将语义标签图转化为高分辨率照片级真实感视频,支持多种输入形式,例如边缘图和姿态图。
XHS-Downloader是一个小红书链接提取与作品采集工具,支持提取账号作品、下载无水印文件及采集作品信息。
SMPLer-X是一个用于人类姿态和形状估计的框架,基于最新的深度学习技术,旨在提高估计精度和表现力。
vits_chinese是基于BERT和VITS的最佳实践文本转语音(TTS)项目,具有自然语音特性,支持ONNX流输出,适合TTS算法学习。
Audio Slicer 是一个简单的图形界面应用程序,能够通过静音检测切割音频文件,方便用户处理音频素材。
RAD-NeRF是一个实时神经辐射合成工具,通过音频空间分解生成动态人像,基于PyTorch实现,适合实时应用与研究。
sd-webui-fastblend 是一个无模型算法,旨在使视频平滑流畅,可去除视频中的闪烁或通过关键帧渲染流畅视频。
Autolabel是一个Python库,利用大型语言模型为文本数据集进行自动标注、清洗和丰富,提高机器学习的效率。
InSPyReNet是基于PyTorch的高分辨率显著性目标检测模型实现,利用图像金字塔结构提升检测效果。