2024年5月10日金曜日

RVC を使って自分の音声を使ってモデルを生成する方法 (リベンジ編)

RVC を使って自分の音声を使ってモデルを生成する方法 (リベンジ編)

概要

前回 最新のコミットから起動してみましたが今回はリリースの安定版を動かしてみました

環境

  • macOS 14.4.1 (M2Pro Mac mini)
  • Python 3.9.18
  • RVC WebUI (updated1006v2)

事前準備

  • brew install aria2 ffmpeg

プロジェクトのダウンロード

https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/releases/tag/updated1006v2 から Retrieval-based-Voice-Conversion-WebUI-updated1006v2.tar.gz をダウンロードします

プロジェクトのセットアップ

  • tar zvxf Retrieval-based-Voice-Conversion-WebUI-updated1006v2.tar.gz
  • cd Retrieval-based-Voice-Conversion-WebUI-updated1006v2
  • pyenv local 3.9.18
  • python -m venv .venv
  • . ./.venv/bin/activate
  • pip install -r requirements.txt
  • deactivate

RVC WebUI 起動

  • ./run.sh

初回はモデルのダウンロードがあります
起動すると http://localhost:7865/ で起動します

音声の学習

前回同様です
ディレクトリがないエラーが出た場合は手動で作成します

動作確認

前回はモデル生成時にセグメンテーションエラーになり RVC WebUI が落ちる挙動があったのですがそれがなく正常に終了します

モデルは ./assets/weights/mi-test.pth に作成されます

最後に

最新のコミットではなくリリースにある安定版を使うほうが今のところは良さそうです
次回は作成できた pth モデルを使って別の音声情報と音声を交換してみたいと思います

参考サイト

0 件のコメント:

コメントを投稿