类库
› Mel-Band-Roformer-Vocal-Model
KimberleyJensen/Mel-Band-Roformer-Vocal-Model
这是一个基于Mel-Band Roformer架构的语音分离模型,用于将音频文件分离为人声和伴奏。通过Python脚本运行,输入WAV文件后可输出独立的人声与器乐文件,适用于音乐处理场景。
技术栈
根目录 python
查看全部依赖 (13)
依赖
NumPy
Pandas
beartype
einops
librosa
ml_collections
omegaconf
rotary_embedding_torch
segmentation_models_pytorch
soundfile
timm
torch
tqdm