VoiceStreamAI 是一个基于 Python 和 JavaScript 的解决方案,支持近实时音频流和转录,利用 WebSocket 实现高效的语音识别和处理。
Python
901
131
MIT License
2周前
YuzuMarker.FontDetection是首个中日韩字体识别以及样式提取模型,旨在提供高效的字体识别服务,适用于多种场景。
Python
502
24
MIT License
1个月前
AppAgent是一个基于大语言模型的多模态代理框架,旨在模拟智能手机用户操作应用程序。
Python
6,096
681
MIT License
2周前
Onyx是一个开源AI聊天平台,能够连接企业文档、应用和人员,支持团队知识搜索与定制AI代理,提升工作效率。
Python
13,337
1,843
Other
2周前
autocaption是一个Python工具,可为任意视频自动添加字幕,方便用户提升视频可视性和理解度。
Python
202
37
2周前
TikTokDownloader 是一款开源的工具,支持批量下载 TikTok 和抖音的各种内容,如视频、音乐和评论等数据。
Python
11,361
1,938
GNU General Public License v3.0
2周前
intelli-video是一个基于OpenAI API和Whisper的视频翻译项目,支持视频下载、音频提取、字幕生成与翻译,及字幕嵌入,助力多语言视频制作。
Python
74
11
1个月前
Open-AnimateAnyone是Animate Anyone的非官方实现,旨在为用户提供基于小规模数据集的动画生成工具,适合研究和开发使用。
Python
2,935
240
2周前
AnyDoor 是一个零样本对象级图像定制的实现方案,旨在帮助用户对图像中的特定对象进行定制化处理。
Python
4,176
372
MIT License
3周前
ComfyUI-Marigold是一个用于深度估计的工具,旨在提升ComfyUI的功能,使其在3D建模和视觉特效中更具实用性。
Python
550
25
GNU General Public License v3.0
3周前

trang chủ - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-09-10 05:41
浙ICP备14020137号-1 $bản đồ khách truy cập$