おすすめエンジンまとめ | チラシの裏 ~UTAU調声メモ~

チラシの裏 ~UTAU調声メモ~

UTAUの調声の話を中心に、初心者向けの使い方からうまく歌わせるコツ・ニッチなネタまで、独断と偏見で書いています。

初稿:2015年11月


resampler,wavtoolとはの記事にて、エンジンとはなんぞや?という話をしたので、今度は実際にどれが使いやすいのかというのを書きたい。

エンジンは音源との相性が激しいので、いろんなエンジンを試して合うものを使ったり、部分的にエンジンを切り替えて使ったりすると良い(ここでMacユーザーが白目になります)
ust内のエンジン切り替えはUTAU標準機能ではないので、このプラグインを使う。

ひとつのustの中で複数のUTAU合成エンジンを切り替えられるようにしてみた


なお、地味ーに切り替えの番号を変えたりエンジンを増やしたりできます。
C:\ユーザー\All Users\UTAU Plugin\resampler wrapperの中のengine.iniを編集。詳細はここ
OSによって場所が違うので、エクスプローラ開いて適当に検索かけたほうが早いかも。
うちはWin10だけどC:\ProgramData\UTAU Pluginだった。


前置きはこのへんにして、おすすめエンジン解説。

☆引き伸ばし型

・resampler系
UTAU標準のエンジン。何も知らない人はこれを使っていることになる。
実はバージョンがいくつかあって、私は色々試したことはないから詳しくないんだけど、resamplerマスターみたいな人もちょいちょいいるっぽい。

UTAU最新版にデフォルトでついてくるやつについて、
特徴:
出音は少し強めの声になる。
単音階で息っぽくなく、明るくて単純なパワー系女声音源(テトさんとかテイ様とか)と相性がいい。
メリット:
音程の加工(原音より高くしたり低くしたり)に比較的強い。
1音階しかない音源はresamplerを使うことが多い。
デメリット:
ピッチの急な変化に弱い。ビブラートを強くかけた箇所で変なノイズが鳴ることも。

・fresamp系
個人的によく使うのがこれ。こちらもバージョンがいくつかあって、音が全然違う。
一般配布されているのは11と14。

fresamp11の特徴:
それなりに量のある多音階音源と相性が良い。
メリット:
かなり綺麗に合成できる。出音は割りと原音に近い。
デメリット:
音程の加工が苦手。歌わせたいピッチが原音の収録音階から離れすぎると発音(母音の感じとか)がかなり変わってくる。

fresamp14の特徴:
11よりも出音は若干強め。音圧高めの曲に合うかも?
メリット:
音程の加工に強い。超高音とかにしても比較的耐えられる
デメリット:
子音(と母音の変わり目?)にノイズが乗りやすい。

どちらも引き伸ばしにはそこそこ強く、CVVCの子音をめっちゃ伸ばすとかでなければロングトーンもそんなに気にならない。ウィスパー系音源の引き伸ばしはちょっと苦手かも?
結局一長一短になるので、最近は「fresamp11をメインのエンジンにして、部分的に(超高音域)fresamp14に切り替えて使う」ことも多い。

・TIPS
囁き系の音源や、男声音源など収録音階の低い音源に特化している印象。

メリット:
音源との相性によってはかなり生々しい出音を実現できる。
デメリット:
引き伸ばしに非常に弱い。
TIPSで使ってほしい音源を配布するときは、BPM低めのガイドBGMで収録したり、原音設定を工夫したり、ロングトーン音素を用意するなどの配慮が必要。


☆ループ型

・tn_fnds(他人の褌)
声質よりも発声の安定感によって向き不向きが異なるエンジン。
ループ型エンジンの特徴についてはこちらに書いたので割愛。
特徴:
音符にeフラグを設定すると、そこだけループではなく引き伸ばし処理にできる。引き伸ばし部分の音質は良くないので短めのノートにしか使えない。
メリット:
原音に近いリアルな声を再現できる。ガサガサしがちな男声音源にもおすすめ。
ループ部分に違和感がなければバラードやアカペラにも使える。
また、生成が鬼早いので耳コピ段階での暫定エンジンに最適。
デメリット:
ループ型特有のうわんうわん現象に適切に対処できるスキルが必要。
resamplerやfresampに比べて弱めの出音になるため曲によっては迫力が足りない。
音源との相性によってはすごい変な音が出る(素材の音程の解析系事故)。


☆その他

・Moresampler
ループ型と引き伸ばし型を自動で切り替えてくれる。どちらかの出音に固定する設定も可能
モーフィング技術を使っているらしく、位相合わせのあれこれでクロスフェード箇所が不自然になることはないらしい。従来の音量クロスフェード式ではできなかった機能がついていたり、やたら幅広いサンプリングレートに対応していたり、独自フラグが大量にあったりと新世代の技術感が凄まじい。
開発中なので色々怪しい。私もまだ検証できていない部分が多いので詳細は割愛。

・グロウルエンジン
他のエンジンと組み合わせて、グロウル(がなり)っぽい音を作るソフト。VOCALOID4のグロウル機能に対抗してる感じ?


※音程がない部分の仕様について

発音のうち、サ行のsやカ行kなどの無声子音は音程がない。
(音程とは~とか、F0がどうとか、そういう細かい定義は置いておいて、ピッチを操作する必要がない部分の話)

今回紹介したエンジンのうち、音程がない部分のピッチを操作するものはresampler,fresamp,TIPSで、操作しないのがtn_fnds。
前者は音程をいじってほしくない子音やブレスの出音があまり良くない。

TIPSとtn_fndsはループ・引き伸ばしの違い以外はあまり音質に大きな差がないんだけど、この無声子音の綺麗さが全然違うので、個人的にはtn_fnds押し。

また、UTAU上でブレスを鳴らす場合はtn_fndsがおすすめ。
Direct=trueで原音を鳴らせば綺麗にはなるけど、音量の操作など色々めんどくさい。
比べてtn_fndsは、どの音程でもいいので音符を置いて鳴らせば、音量いじるのも楽だし子音速度で息の長さを微調整できるし、gフラグかければ表情もある程度コントロールできる。
ただし、激しく吸い過ぎて声っぽいのが入ってるブレスには向かないので注意!