类库 › tada
HumeAI

HumeAI/tada

TADA是一个开源的语音语言模型,通过文本-音频双重对齐框架,实现高保真语音合成和生成。它采用创新的分词器与架构设计,将语音和文本同步为统一流,显著降低计算开销,适用于多种语音处理任务。

HumeAI/tada

截图

figures/CER.png
figures/real-time.png
figures/naturalness.png
figures/speaker-sim.png

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-04 01:49
浙ICP备14020137号-1 $访客地图$