类库 › Mel-Band-Roformer-Vocal-Model
KimberleyJensen

KimberleyJensen/Mel-Band-Roformer-Vocal-Model

这是一个基于Mel-Band Roformer架构的语音分离模型,用于将音频文件分离为人声和伴奏。通过Python脚本运行,输入WAV文件后可输出独立的人声与器乐文件,适用于音乐处理场景。

技术栈

根目录 python

查看全部依赖 (13)

依赖

NumPy Pandas beartype einops librosa ml_collections omegaconf rotary_embedding_torch segmentation_models_pytorch soundfile timm torch tqdm

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-24 14:36
浙ICP备14020137号-1 $访客地图$