intelli-video是一个基于OpenAI API和Whisper的视频翻译项目,支持视频下载、音频提取、字幕生成与翻译,及字幕嵌入,助力多语言视频制作。
Python
74
11
1个月前
Open-AnimateAnyone是Animate Anyone的非官方实现,旨在为用户提供基于小规模数据集的动画生成工具,适合研究和开发使用。
Python
2,935
240
2周前
AnyDoor 是一个零样本对象级图像定制的实现方案,旨在帮助用户对图像中的特定对象进行定制化处理。
Python
4,176
372
MIT License
2周前
ComfyUI-Marigold是一个用于深度估计的工具,旨在提升ComfyUI的功能,使其在3D建模和视觉特效中更具实用性。
Python
550
25
GNU General Public License v3.0
2周前
Marigold是一个计算机视觉项目,旨在利用扩散模型生成单目深度估计和图像特征分析,支持高分辨率深度图提取。
Python
2,904
187
Apache License 2.0
2周前
Cloth2Tex是一个定制化的布料纹理生成管道,旨在为3D虚拟试穿提供支持,提升用户体验。
Python
503
141
GNU General Public License v3.0
2周前
srt-gpt-translator是一个基于OpenAI API的字幕翻译工具,支持多语言srt文件翻译及双语字幕输出。
Python
146
23
MIT License
1个月前
Marker是一个快速准确地将PDF及多种文档格式转换为Markdown和JSON的工具,支持提取图像及格式化复杂内容。
Python
28,147
1,832
Other
2周前
LiteLLM是一个Python SDK和代理服务器,支持调用100多个以OpenAI格式提供的LLM API,如Azure、OpenAI和HuggingFace等,方便用户接入各类语言模型。
Python
27,843
3,912
Other
2周前
clone-voice是一个基于web界面的声音克隆工具,用户可以使用特定音色合成语音或将不同声音转换为特定音色,支持多种语言。
Python
8,703
934
Other
2周前

- 위키
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-09-07 17:05
浙ICP备14020137号-1 $방문자$