概要
Retrieval-based-Voice-Conversion-WebUI というツールを見つけたので使ってみました
自分の音声から音声モデルを使って喋らせることができるようです
環境
- macOS 14.4.1 (M2Pro Mac mini)
- Python 3.8
- RVC WebUI (fb16ba3)
起動
- git clone https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI.git
- cd Retrieval-based-Voice-Conversion-WebUI
- sh ./run.sh
自動で Python3.8 がインストールされます
試しに Python 3.10 以上で試したのですがライブラリのインストールでエラーになったので3.8を使います
http://localhost:7865/ で起動します
モデルのダウンロード
なぜか hubert_base.pt やらいろいろ足りていないのでモデルをダウンロードします
https://github.com/RVC-Project/RVC-Models-Downloader/releases から rvcmd_darwin_arm64.tar.gz をダウンロードします
展開し Retrieval-based-Voice-Conversion-WebUI のルートに配置します
- tar zvxf rvcmd_darwin_arm64.tar.gz
- mv rvcmd Retrieval-based-Voice-Conversion-WebUI
- cd Retrieval-based-Voice-Conversion-WebUI
- ./rvcmd assets/all
警告が出る場合は一度 Finder からクリックで起動して Open を選択することでターミナルからも実行できるようになります
実行すると必要なモデルを必要なパスに自動でダウンロードしてくれます
assets/hubert/hubert_base.pt がない場合は https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/hubert_base.pt こちらからダウンロードして配置してください
フォルダの作成
なぜか足りなかったので作成します
- cd Retrieval-based-Voice-Conversion-WebUI
- mkdir logs/mi-test/2a_f
- mkdir logs/mi-test/2b-f0nsf
音声の準備
何でも OK です
音声の学習
パラメータはいろいろとチューニングできますが今回はデフォルトのままでいきます
まずは Train タブを選択します
UI 上にステップが記載されているのでそのステップ通りに進めます
ステップ1では名前とパラメータを設定します (基本はそのままで OK)
準備した音声ファイルを「Enter the path of the training folder」に入力し「Process data」を実行します
ステップ2の部分はそのままで OK です
あとはステップ3の「One-click training」を実行すれば OK です
これでモデルが生成できます
Segmentation fault 対策
- cd Retrieval-based-Voice-Conversion-WebUI
-
. ./.venv/bin/active
-
pip install faiss-cpu==1.7.3
最後に
とりあえずモデルは生成できたので次回はこのモデルを使って話をさせてみます
0 件のコメント:
コメントを投稿