人声伴奏分离
如果你使用的是带伴奏的歌曲作为数据集,那么请一定要将人声从伴奏中分离出来。分离伴奏和人声推荐使用 Ultimate Vocal Remover 5 (UVR5), 并下载对应的处理模型。一些推荐的处理模型和功能如下:
MDX-Net | Kim_Vocal_1
: 分离人声及伴奏VR Architecture | 5_HP-Karaoke-UVR
: 分离和声VR Architecture | UVR-DeEcho-DeReverb
: 去除混响和回声
⏩上述所有模型均可在 UVR5 软件选择模型处 —— Download More Models 下载(可能需要科学上网)
需要注意的是,没有任何一种方法能够做到无损分离人声。当歌曲中的伴奏越复杂,分离后的人声失真越严重。较差的人声质量会显著影响模型训练的结果。
除了传统的 UVR5 工作流,你还可以试试来自字节跳动火山引擎的 SAMI 技术分离人声。在人声伴奏分离方面 SAMI 可能有比 UVR5 更好的效果;且可以通过 WebUI 请求远程服务器,无需本地硬件推理。
暂无评论内容