VideoPainter是一个用于视频修复和编辑的工具,支持任意长度的视频处理,具有插件式上下文控制功能。
Proxy Lite 是一个精简版的开源代理助手,用户可以通过它轻松执行任务,如市场查询和评级。适合开发者和研究人员使用。
BlenderMCP是一个将Blender与Claude AI通过模型上下文协议连接的工具,使得用户能够直接在Blender中进行3D建模和场景创作,从而提高建模效率。
VisionSub 是一款高效的视频硬字幕提取工具,支持从视频中提取字幕并导出为多种格式,如 SRT 和 JSON,具有实时预览和强大OCR功能。
Wan2.1是一个开放的先进视频生成模型套件,支持多种生成任务,如文本转视频、图像转视频等,性能优越且适用于消费级GPU。
MM-StoryAgent是一个多代理框架,通过文本、图像和音频生成富有表现力的叙事视频,用户可定制工作流程以提高生成质量。
本仓库是一个用于扩散模型的并行训练脚本,提供Gradio界面和Docker镜像,支持在多种环境中轻松训练模型。
diffusion-pipe是一个用于扩散模型的管道并行训练脚本,支持多种模型并提供高效的训练和评估功能。
DiffSynth-Studio 是一个开源扩散模型引擎,旨在推动技术创新和生成模型的探索,支持学术研究及前沿模型能力的开发。
DdddOcr是一个开源的Python库,用于离线识别通用验证码,旨在提供简单易用的OCR解决方案,支持自定义模型和HTTP API服务。