类库 - 온라인도구

Open-Magic-Video/Magic-1-For-1

Magic 1-For-1是一个高效的视频生成模型，通过文本生成图像，再将图像转换为视频，旨在优化内存使用和减少推理延迟。

Python

751

55

Other

2个月前

Saiyan-World/goku

Goku是基于流动变换器的新型图像和视频生成模型，旨在实现行业级性能，适用于视频生成任务。

Python

2,878

312

2个月前

Fanghua-Yu/SUPIR

SUPIR旨在开发实用的算法，以实现自然场景中的真实感图像恢复。该项目还提供了在线演示，支持用户体验其强大的图像处理能力。

Python

5,193

442

Other

2个月前

Doriandarko/deepseek-engineer

DeepSeek Engineer v2是一个强大的AI编程助手，提供交互式终端界面，支持智能文件操作和代码分析，帮助用户实现自然对话和函数调用的开发辅助。

Python

2,250

387

MIT License

2个月前

FireRedTeam/FireRedTTS

FireRedTTS是一个开源的文本转语音系统，利用大型语言模型技术，旨在提供高质量的语音合成服务。

Python

765

67

Mozilla Public License 2.0

2个月前

FireRedTeam/FireRedASR

FireRedASR是一个开源工业级语音识别模型，支持普通话、方言和英语，具有优秀的歌词识别能力，已在公共普通话 ASR 基准上达到最新的性能水平。

Python

1,272

94

Apache License 2.0

2个月前

fh2019ustc/DeepEraser

DeepEraser是一个文本擦除工具，利用深度迭代上下文挖掘技术，支持图像中文本的智能去除。

Python

43

7

MIT License

2个月前

TilmanGriesel/chipper

Chipper是一个为开发者提供AI接口的工具，支持RAG管道、文档拆分和查询工作流，增强生成AI模型的信息检索能力。

Python

467

43

MIT License

2个月前

HKUDS/Vimo

Vimo是一款革命性的桌面应用程序，利用先进的AI技术让用户与视频进行智能对话，能够处理任意长度的视频内容并准确回答问题。

Python

1,032

149

Other

2个月前

chenguolin/DiffSplat

DiffSplat是一个生成框架，可以从文本提示和单视图图像中合成3D高斯点，速度为1~2秒，适用于图像扩散模型的重用。

Python

396

25

MIT License

2个月前

类库

文库