SVC科普 使用火山引擎的 SAMI 技术分离人声

SVC科普 使用火山引擎的 SAMI 技术分离人声

除了传统的 UVR5 工作流,你还可以试试来自字节跳动火山引擎的 SAMI 技术分离人声。在人声伴奏分离方面 SAMI 可能有比 UVR5 更好的效果;且可以通过 WebUI 请求远程服务器,无需本地硬件推理。以下是 UVR5 和 SAMI 分离效果的对比:

UVR5 – Kim_Vocal_1:

SAMI:

SAMI 可以平替 UVR5 的人声伴奏分离过程,但后续的去和声、去混响需要自己继续处理。

使用方法

创建应用

  1. 前往火山引擎控制台,注册账号并完成实名认证
  2. 前往 SAMI 服务列表,在 API 能力列表中找到“音源分离”,启用该服务

image

  1. 在左侧的“应用管理”中,创建一个新的应用,并勾选“音源分离”接入 API 能力

image

  1. 此时你会获得一个 APPKEY, 将其妥善保存好,不要泄露image.png

    image

创建 API 访问密钥

  1. 回到火山引擎控制台,点击右上角的头像 —— API 访问密钥,创建一个新的密钥

image

  1. 此时会生成一个Access Key和一个Secret Key,妥善保存这一密钥,不要泄露

通过密钥调用 SAMI 服务

在 WebUI 中集成了 SAMI 服务接口,在创建完 SAMI 应用和密钥后即可调用服务。

⚠ 每个火山引擎账号拥有 100 分钟的免费调用额度,超过 100 分钟额度后将开始产生费用,请参考 SAMI 文档了解价格明细。

  1. 打开 WebUI —— 小工具/实验室功能 —— 歌曲人声分离
  2. 上传待分离的音频(最好不要超过 10 分钟和 50 MB),选择使用的分离模型:
    1. 2track_vocal 用于提取人声;2track_acc 用于提取除人声之外的伴奏
    2. bs_4track_vocal 也可以用于提取人声;bs_4track_acc 也可以用于提取伴奏,区别于 a,这两个模型会对除了音乐和人声之外的部分做适当降噪,效果比 a 更好。
  1. 输入刚才获取的 Access Key, Secret KeyAPPKEY,然后点击开始分离
  2. 如果本机启用了梯子,且转换过程中出现连接错误(目标计算机积极拒绝),尝试启用 WebUI 中的代理选项并正确输入代理端口(默认为 7890)

 

© 版权声明
THE END
点赞12 分享
评论 共1条

请登录后发表评论