该工具是一个快速命令行工具,可将音频/视频文件转录为SRT字幕,支持直接从YouTube链接转录,简化了OpenAI Whisper API的使用。
Pied是一款简化Piper语音安装和管理的工具,使其能够与Speech Dispatcher结合使用,方便用户下载不同的语音。
这是一个NodeJS的Instagram私有API SDK,使用TypeScript编写,提供丰富的功能和易于集成的接口。
MusicGPT 是一个基于自然语言提示生成音乐的应用,支持本地运行最新的音乐生成 AI 模型,无需安装繁重的依赖。
Pixelix是一个用于Android和iOS的Pixelfed客户端,用户可以随时随地浏览、发布和互动,提供流畅的使用体验。
X-Pose 是一个用于检测任意关键点的实现,基于ECCV 2024论文,适用于多种姿态估计任务,包括人体和动物。
autoComplete.js 是一个简单的纯原生JavaScript自动完成库,设计上注重速度和灵活性,适合与各种项目无缝集成。
这个仓库用于构建和部署本地视觉语言模型,以实现高速且准确的图像分类,适用于边缘AI设备。
chatless是一款轻量级本地AI聊天客户端,支持多种云端和本地AI服务,数据存储于本地,提供文档解析与向量检索。
这是一个基于本地模型的中文语音智能助手,支持关键词唤醒、语音识别、大模型对话和语音合成,适合智能家居和日常语音交互。


