Goku是基于流动变换器的新型图像和视频生成模型,旨在实现行业级性能,适用于视频生成任务。
Python
2,878
312
2个月前
SUPIR旨在开发实用的算法,以实现自然场景中的真实感图像恢复。该项目还提供了在线演示,支持用户体验其强大的图像处理能力。
Python
5,193
442
Other
2个月前
DeepSeek Engineer v2是一个强大的AI编程助手,提供交互式终端界面,支持智能文件操作和代码分析,帮助用户实现自然对话和函数调用的开发辅助。
Python
2,250
387
MIT License
2个月前
FireRedTTS是一个开源的文本转语音系统,利用大型语言模型技术,旨在提供高质量的语音合成服务。
Python
765
67
Mozilla Public License 2.0
2个月前
FireRedASR是一个开源工业级语音识别模型,支持普通话、方言和英语,具有优秀的歌词识别能力,已在公共普通话 ASR 基准上达到最新的性能水平。
Python
1,272
94
Apache License 2.0
2个月前
DeepEraser是一个文本擦除工具,利用深度迭代上下文挖掘技术,支持图像中文本的智能去除。
Python
43
7
MIT License
2个月前
Chipper是一个为开发者提供AI接口的工具,支持RAG管道、文档拆分和查询工作流,增强生成AI模型的信息检索能力。
Python
467
43
MIT License
2个月前
Vimo是一款革命性的桌面应用程序,利用先进的AI技术让用户与视频进行智能对话,能够处理任意长度的视频内容并准确回答问题。
Python
1,032
149
Other
2个月前
DiffSplat是一个生成框架,可以从文本提示和单视图图像中合成3D高斯点,速度为1~2秒,适用于图像扩散模型的重用。
Python
396
25
MIT License
2个月前
maestro 是一款用于加速多模态模型微调的工具,简化配置、数据加载和训练流程,支持常用视觉语言模型如Florence-2、PaliGemma 2和Qwen2.5-VL。
Python
2,630
217
Apache License 2.0
2个月前

Accueil - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-04 06:00
浙ICP备14020137号-1 $Carte des visiteurs$