类库
› MisoTTS
MisoLabsAI/MisoTTS
Miso TTS 是一个拥有80亿参数、情感丰富的文本转语音模型。用户可通过本地运行Python脚本或使用Hugging Face模型进行推理,生成高质量音频文件。该项目主要面向开发者,提供基于Python的命令行工具以实现高效、自然的语音合成体验。
技术栈
根目录 python
查看全部依赖 (10)
依赖
bitsandbytes
huggingface_hub
moshi
silentcipher
tokenizers
torch
torchao
torchaudio
torchtune
transformers
截图