类库
› tada
HumeAI/tada
TADA是一个开源的语音语言模型,通过文本-音频双重对齐框架,实现高保真语音合成和生成。它采用创新的分词器与架构设计,将语音和文本同步为统一流,显著降低计算开销,适用于多种语音处理任务。
截图
TADA是一个开源的语音语言模型,通过文本-音频双重对齐框架,实现高保真语音合成和生成。它采用创新的分词器与架构设计,将语音和文本同步为统一流,显著降低计算开销,适用于多种语音处理任务。