类库
› scenema-audio
ScenemaAI/scenema-audio
Scenema Audio是一个零样本情感语音克隆与生成工具,支持从10秒参考音频克隆声音。它基于扩散Transformer模型,能根据文本提示生成具有真实情感、节奏和呼吸控制的语音,适用于电影配音和有声书等场景。
截图
Scenema Audio是一个零样本情感语音克隆与生成工具,支持从10秒参考音频克隆声音。它基于扩散Transformer模型,能根据文本提示生成具有真实情感、节奏和呼吸控制的语音,适用于电影配音和有声书等场景。