该工具是一个快速命令行工具,可将音频/视频文件转录为SRT字幕,支持直接从YouTube链接转录,简化了OpenAI Whisper API的使用。
TypeScript
12
1
MIT License
19小时前
Pied是一款简化Piper语音安装和管理的工具,使其能够与Speech Dispatcher结合使用,方便用户下载不同的语音。
Dart
226
6
GNU General Public License v3.0
19小时前
Elleo/pied cover
这是一个NodeJS的Instagram私有API SDK,使用TypeScript编写,提供丰富的功能和易于集成的接口。
TypeScript
6,303
1,176
MIT License
19小时前
MusicGPT 是一个基于自然语言提示生成音乐的应用,支持本地运行最新的音乐生成 AI 模型,无需安装繁重的依赖。
Rust
1,175
129
MIT License
19小时前
Pixelix是一个用于Android和iOS的Pixelfed客户端,用户可以随时随地浏览、发布和互动,提供流畅的使用体验。
Kotlin
269
19
GNU General Public License v3.0
19小时前
X-Pose 是一个用于检测任意关键点的实现,基于ECCV 2024论文,适用于多种姿态估计任务,包括人体和动物。
Python
737
36
Other
19小时前
autoComplete.js 是一个简单的纯原生JavaScript自动完成库,设计上注重速度和灵活性,适合与各种项目无缝集成。
JavaScript
4,011
245
Apache License 2.0
22小时前
这个仓库用于构建和部署本地视觉语言模型,以实现高速且准确的图像分类,适用于边缘AI设备。
Jupyter Notebook
277
35
22小时前
Paulescu/image-classification-with-local-vlms cover
chatless是一款轻量级本地AI聊天客户端,支持多种云端和本地AI服务,数据存储于本地,提供文档解析与向量检索。
TypeScript
228
22
MIT License
20小时前
这是一个基于本地模型的中文语音智能助手,支持关键词唤醒、语音识别、大模型对话和语音合成,适合智能家居和日常语音交互。
Python
13
0
21小时前

ホーム - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.0. UTC+08:00, 2025-10-28 11:42
浙ICP备14020137号-1 $お客様$