RVCでずんだもんの声にボイスチェンジする方法
まず、RVCとは何か紹介していきます。
RVCはAIボイスチェンジャーで、従来からあるMMVCと違いボイチェン感がなく、本当に違和感がなくなめらか。導入も簡単です。
では早速導入していきます。
まず、RVCを使うために必要な前提ソフトを入れていきます。
前提ソフトは、Python 3.10.7と、Microsoft C++ Build Toolsという2つのソフトです。
まずpythonのほうからダウンロードします。
pythonは、互換性のないバージョンもあるので、必ず3.10.7をダウンロードしてください。
Python Release Python 3.10.7 | Python.org
リンクからページに飛んで、自分のosに合わせたインストーラーをダウンロード。
(win10,11は大体の場合一番下のでOK)
選択肢が出てきたら一番上をえらび、設定はそのままで導入してください。
(できなかったら管理者権限で実行してみてください)
次に、Microsoft C++ Build Toolsをダウンロードしていきます。
Microsoft C++ Build Tools - Visual Studio
インストーラーをダウンロードしたら、実行。
C++ によるデスクトップ開発にチェックを入れて、ダウンロードしてください。
これで前提ソフトの導入を終わります。
次に、RVCに学習させる音声ファイルをダウンロードします。
研究者向け マルチモーダルデータベース ログインページ (zunko.jp)
X(Twitter)でログインします。
ITAコーパスマルチモーダルデータベースからお好きなボイスデータをダウンロードして解凍します。
(私はノーマル 感情100をダウンロード)
それでは、RVC本体をダウンロードしていきます。
RVC-beta-v2-0528.7z · lj1995/VoiceConversionWebUI at main (huggingface.co)
リンクからページに飛んで、ダウンロードします。
解凍する前にプロパティから一番下のセキュリテイ項目にチェックを入れて、適応しておいてください。
また、解凍には7zなどのソフトが必要です。
解凍先は、cドライブ直下が良いです。
これで導入は終わりです。
いよいよRVCを実行していきます。
go-web.batを実行します。
少し待つとwebサイトが開きます。
ここで学習していくのですが、datファイルを閉じないでください。動かなくなってしまいます。
トレーニングタブに移動します。
たくさん項目がありますが、注目してほしいのは
「モデル名」
「トレーニング用フォルダのパス」
「総エポック数」
モデル名は自分のわかりやすい名前に変更してください。
例えば、zundaとかですね。
トレーニング用フォルダのパスは、ダウンロードした音声ファイルのパスをコピー&ペーストして入れます。
(右クリックメニューからコピペ可能)
総エポック数は、簡単に言うと、どれだけ学習させるか。
多すぎても機械感が増えるので、20から50くらいにしておきます。
その他の項目についてはそのままで大丈夫。
ワンクリックトレーニングを押下。
しばらく待って「全工程が完了!」と出たら完了。
できたモデルはweightsフォルダーに入っています。
モデル推論タブに移動し、音源リストの更新をして、モデルを選択。
処理対象音声ファイルのパスを入力欄に入れ、変換ボタンを押すと音声が変換されます。
これで、RVCモデルの作成を終わります。
次に、このRVCモデルをリアルタイムで使えるようにします。
Koemake Project
リンクから飛んで、ログインして「koemake_v01_02_04」をダウンロードします。
プロパティからセキュリテイ項目にチェックを入れて、適応。
解凍したらmodelsフォルダにフォルダーを作ります。
そうしたら、RVCのweightsフォルダからモデルをコピー。
(上のコピーマークから可)
koemakeのほうに戻り、新しく作ったフォルダーにペーストします。
koemakeを起動してモデルをロード。
マイクの設定をすればリアルタイムボイスチェンジが可能です。
筆者の環境
CPU 12th Gen Intel(R) Core(TM) i7-12700H 2.30 GHz
RAM 16.0 GB
システムの種類 64 ビット オペレーティング システム、x64 ベース プロセッサ
エディション Windows 11 Home
バージョン 22H2
GPU 0 Intel(R) Iris(R) Xe Graphics
GPU 1 NVIDIA GeForce RTX 3050 Laptop GPU