resampler,wavtoolとは | チラシの裏 ~UTAU調声メモ~

チラシの裏 ~UTAU調声メモ~

UTAUの調声の話を中心に、初心者向けの使い方からうまく歌わせるコツ・ニッチなネタまで、独断と偏見で書いています。

初稿:2015年以前

 

 

ページタイトルはわかりやすいように「resampler,wavtoolとは」にしたけど、本当は
resamplerなど=伸縮器(=UTAU合成エンジン)=ツール2
wavtoolなど=結合器=ツール1
と呼ぶらしい。詳しいことは@Wikiに書いてある
ここではWikiに書いていない、私が知っている限りの伸縮器・結合器の仕様をメモしておく。あまりあてにならないけど。

ツール1・2という名前になってはいるが処理の順番は伸縮器が先。
伸縮器が加工(音程、フォルマント、flags、ノート長、音量のノーマライズと音量パラメータの反映など)した音はキャッシュファイル(cacheフォルダ内wav)となっているので聴くことができる。この段階ではノートごとにひとつずつ、まだバラバラ。
それを繋ぎあわせてひとつのトラックにするのが結合器の役目。繋ぐときに先行発声・オーバーラップ(を子音速度や周りのノート長に合わせて計算しなおしたもの)、STPを参考にして音を並べ、エンベロープの反映もこの時点で行う。
(ちなみにpresampはUTAUが伸縮器や結合器に渡すはずのデータを横取り・書き換えてから渡すソフトなので、名前はツール1・2に入力するが合成は行わない。中間業者的ポジション。)


エンジン(伸縮器)には色々種類があるんだけど、音源との相性がかなりあるので気をつけられたし。
おすすめのエンジンまとめはこちら
ここでは大まかに引き伸ばし型・ループ型の違いだけ紹介。

引き伸ばし型のエンジンは、伸縮範囲(原音設定の子音部分以降、白い部分)をびよーんと引き伸ばす。UTAUは原音を直接加工するタイプのソフトなので、加工が大変だとそのぶん音質が落ちる。つまり、伸縮範囲が短い音をたくさん引き伸ばすと音質が劣化する(とくにTIPSだと顕著)。伸縮範囲をできるだけ長めに設定すると良い。
UTAU標準のresampler(実はバージョンがいくつかある)やfresamp(個人的によく使う)、TIPSやvs4uなど。種類が多い。

一方引き伸ばさないエンジンというのがあって、有名どころはtn_fnds(他人の褌)。こちらは引き伸ばさずに伸縮範囲をループするタイプで、長い音符でも音はとても綺麗。
ただしだんだん音が小さくなっていく音源とかだと音量が大きくなったり小さくなったりを繰り返し、とにかく凄まじい事(通称うわんうわん)になるので注意。伸縮範囲が安定していると綺麗に合成できるが、発音が不安定な音源には壊滅的に向かない。原音設定である程度うわんうわんを回避できるので、tn_fndsでしか使わないわーって音源は直してみるといいかもしれない。
ちなみにループといっても左から右、右から左を繰り返すらしい。


結合器はあまり開発されていないらしく数が少ない。
UTAU標準のはwavtool。
masaoさんが作られたwavtoolexは5点以上のエンベロープに対応している。他にもクロスフェード最適化の機能を積んだやつが試験的に?公開されている。(詳しい話はクロスフェード最適化についてに書いたのでそちらをどうぞ)