类库 › LongCat-AudioDiT
meituan-longcat

meituan-longcat/LongCat-AudioDiT

LongCat-AudioDiT是一个基于扩散变换器的高保真文本转语音模型,通过波形潜在空间生成高质量语音。该仓库提供预训练模型和推理代码,支持文本到语音的生成任务。

meituan-longcat/LongCat-AudioDiT

技术栈

查看全部依赖 (8)

依赖

NumPy unknown einops unknown librosa unknown safetensors unknown soundfile unknown torch unknown torchaudio unknown transformers unknown

截图

image

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-02 09:42
浙ICP备14020137号-1 $访客地图$