Devon 是一个开源的配对编程工具,旨在帮助开发者提高协作效率,支持多种编程任务。
LLM4Decompile是一个利用大语言模型反编译二进制代码的工具,主要用于逆向工程和代码分析。
Fish Speech是一个开源的多语言文本转语音(TTS)工具,支持语音克隆,提供最新的技术水平,方便开发者集成和使用。
ComfyUI-segment-anything-2是一个使用segment-anything-2的ComfyUI节点,功能正在开发中,提供模型下载及节点测试,助力用户进行图像分割。
AudioNotes是一个音视频转结构化Markdown笔记的系统,利用大模型快速提取和整理内容,便于阅读与记忆。
FLUX是一个开源模型推理库,支持图像生成和编辑,提供简单的本地安装和TensorRT支持。
MinerU是一款高质量的开源工具,将PDF文件转换为Markdown和JSON格式,便于数据提取和处理。
CatVTON是一个高效的虚拟试穿扩散模型,具备轻量网络和简化推断,适用于图像合成与虚拟试衣应用。
VideoFusion是一款轻量化视频批量处理软件,支持自动去黑边、拼接、补帧等功能,方便无经验用户快速优化视频。
EchoMimic是一个基于音频驱动的人物动画生成工具,通过可编辑的地标条件创建栩栩如生的肖像动画,适用于各种应用场景。