連続音、CVVC、単独音のメリット・デメリット比較 | チラシの裏 ~UTAU調声メモ~

チラシの裏 ~UTAU調声メモ~

UTAUの調声の話を中心に、初心者向けの使い方からうまく歌わせるコツ・ニッチなネタまで、独断と偏見で書いています。

初稿:2014年以前

大幅改定:2019年5月

 

 

○はじめに

 

・CVVCをぜんぜん知らない人にはこちら

CVVCって何?~ア行が連続音でそれ以外が単独音のやつ+α~

 

 

・連続音、CVVC、単独音といった「収録形式」の性能は単純には比較できません。

中の人から見たメリット、技術屋から見たメリット、

調声初心者に合う音源・上級者に合う音源はそれぞれ違うからです。

 

また「良音源」の基準は収録形式だけではないので、音質や発音、発声、「昔から親しまれてきたキャラクター性」など、様々な影響で収録形式の差は覆ります。

 

以上のことを念頭に置いて会話しないとTwitterとかでよく燃えますここの古いコメント欄も燃えてm(ry

 

 

・再三書いてますがこのブログは中級者~向けです。

 


-----------------------

○収録形式ってどんなのがあるの?

今回紹介するのは、日本語の以下の形式。

 

・単独音(CV)

UTAU界最古の形式。

シンプルだが、技術の進歩によってよりコスパの良い収録方法が色々出てきたため、選ばれる機会は減ってきている。


・連続音(VCV)

大量に録音すれば綺麗な音で出力できるよね!!!!

つまり力技、脳筋。


・CVVC

単独音と特殊な音素がセットになったやつ。

理屈は複雑だが、単独音としても使えるので使い方は難しくない。

完成品のクオリティがピンキリになりがち。

うまいことやればコスパが良い。


・れんたんじゅつ&切り出し単独音

両方とも、単独音の派生というか亜種?

フレーズの頭(連続音でいう[- ○])とフレーズ中は違う素材なのでは?という考え方。

(この理論はeve式CVVCなど様々なところで応用されている)

一般的にれんたんじゅつというと、「連続音やCVVCに似た複数モーラリストで収録し、頭用と途中用の素材を用意した単独音」を指すことが多いが、

頭用しかない普通の単独音と比較して「途中用しかない単独音(切り出し単独音)」もれんたんじゅつと呼ぶことがある。

この記事では両方とも軽くフォローする。

 

 

その他の収録形式は、いずれ「特殊な収録方法まとめ」を書く予定。


-----------------------


○中の人目線の比較


・収録量
連続音:とてもいっぱい
CVVC:連続音の1/5~1/3ぐらい(少ない)
単独音:1音の長さによる(CVVCより多かったり少なかったり。たいして変わらない)
れんたんじゅつ: [- ○]を録るなら単独音と同じ~倍ぐらい

[- ○]がいらなければ連続音の1/6(最軽量、待ち時間が減るため単独音以下)

(参考:外国語CVVCは日本語連続音の数倍かかることもざら。外国語連続音はさらにそれ以上になるため、滅多に存在しない)

※収録時間について

リストのモーラ数やガイドBGM、さらには中の人の慣れとかで大きく変わってくる。

基本的にモーラ数が多いほど・BGMのテンポが早いほど、早く収録が終わる。



・録り方
連続音:ガイドBGMを用意して「ああいあうえあー」と繋げて読む
CVVC:録音リストは違うが録り方は連続音といっしょ
れんたん:〃(参考:UTAU音源制作wiki
単独音:あー、いー、とひとつずつ録る

 

※単独音は録ったあとの整音作業を自分でやろうとして失敗して使えなくなってしまうケースが多い(ソースは私。原音設定依頼を受けていた時の経験より)


・原音設定の難易度と量
連続音:

簡単。誰がやってもあまり変わらない。ただし量が膨大

(CVVCや単独音と違って、ある程度の「正解」がある)
CVVC:

原音設定者のスキル・好みによって出音が大きく変わるため、ハードルが高い。初心者は最初に手を出すべきじゃない。

量的には単独音の倍以上、連続音の半分ほど?
単独音れんたんじゅつ

地味にスキルがいる(CVVCの半分は切り出し単独音と同じもの)。

連続音よりは難しいと思う。単独音とれんたんの原音設定方法はほぼ同じ。

量は少ない(単独音・切り出し単独音)。れんたんは単独音の倍。

 

※当サイトでは、中の人初心者は録音するだけでいっぱいいっぱいだと思うので、心が折れないように難しい技術的なことは詳しい人に頼ることを推奨しており、頼り方解説記事を準備中です。


-----------------------

 

○使う人目線の比較


・それぞれの関係性
単独音の録り方を工夫してちょっと綺麗にしたのがれんたんじゅつ。
CVVCはれんたん+繋ぎ目なめらかにするや~つ。

連続音は連続音。っょぃ。

 

↓例として「_ささすぃさすせさ(連続音)」の冒頭
VCVorCVVC6

単独音れんたんはCV(さ、- さ)、CVVCはCV(さ)とVC(a s)、連続音はVCV(a さ、i さ…)で主に構成されている。

VCVからはCVとVCを錬成できる。

(=連続音を録ると原音設定によってはCVVCとしても使える)


※- CVとCVを両方用意するCVVCもある(eve式など)
※母音部分は単独音なら- VからV(実質- V)と* V(母音結合用)を切り出す。連続音なら- VとVV(a い等)を切り出す。CVVCはリストによってまちまちだが、配布リストにこだわらず自分で母音連続音を録るかどうか選択するといい


VCVorCVVC5
連続音は他3つの上位互換、CVVCは単独音の上位互換といえる。

 

 

・使い方(ベタ打ちで音が出るまで)


連続音:プラグインで一括変換。簡単。
VCVorCVVC1

CVVC:

①presampを使う方法

単独音ustを用意すれば、再生するときだけCVVCに自動変換してくれる
見た目はこう↓
VCVorCVVC2

再生されるときは裏でこうなっている↓
VCVorCVVC4

②autoCVVCを使う方法

プラグインでこの状態に変換する↓VCVorCVVC4
※VC(e 4, e mなど)の長さが音源ごとに違うので、違う子に歌ってもらいたい時めんどくさいことになる

③単独音として使う方法

CVVCには単独音が含まれているので、単独音だけを使うこともできる

(母音は単独音の子も連続音の子もいる)

単独音れんたんじゅつ

音を出すだけなら簡単。出すだけなら・・・

単独音と切り出し単独音は同じ使い方。

れんたんは頭の音だけ変える必要がある(プラグインもある)
VCVorCVVC3


・使い方(調声の自由度)
連続音:

・先行発声やオーバーラップをいじって色々できる

ex) [a た]の音が微妙なので、[u た]のパラメータをいじってu部分を削り、「た」として使う 等

・原音設定すればCVVCを作り出すことができる

(CVVCの利点は連続音も持っている!)


CVVC:

・発音を細かく調節できる。超楽しい。

子音の長さを変えたり、母音を省略したり等

※子音の長さを一番かんたんに変えられるのはCVVC!

(子音速度をいじるのとVCで子音を伸ばすのとではちょっと違う出音になる)

単独音れんたんじゅつ:素材が少ないため色々できない。

綺麗に歌わせる、思い通りに歌わせることを目標にするなら一番難しい

(れんたんはリストによっては原音がほぼCVVCだったりもするので、原音設定でVCを錬成できることも)


・出音の特徴
連続音:

・中の人の生き写しみたいな、良くも悪くもリアルな音になる。

 中の人のスキルが顕著に出る。

・滑舌は原音のwavそのままのため、ダントツで良い。

 (逆に発音をぼかした音源も作ろうと思えば作れる)

・原音設定による出音差は少ない。

 (差が出るのはタイミングぐらい。発音はほとんど変わらない)

・収録量が鬼のように多いので、録り始めと録り終わりで声が変わってしまうリスクがある。

・収録量が鬼のように多いので、いろんな表情を録ろうと思うと大変。

 単表情になりがち

・繋ぎ目のなめらかさ:

 繋ぎ目は母音にくるので、安定して発音できてれば綺麗に繋がるが、逆もまたしかり。
・多音階音源だと、低い音符から高い音符へ(逆も)一気に音程が変わるときに、収録音程の差によって劣化・繋ぎ目の違和感が出る

 (連続音にしかない欠点)

 (そこだけCVVC化してしまえば解決する)

↓ex) 低いC4と高いG4を繋ぐため、声質の差が出る
 また、G4音源の前半をC4まで下げる加工によって音が劣化する
VCVorCVVC7

CVVC:

・原音設定によって発音が大きく変わる。

 収録時の発音・原音設定ともにうまくやればそこそこ綺麗な音源になる一方、下手すると単独音と大差ない出音に。

・繋ぎ目の回数が連続音の倍もあるため、発音が不自然になるリスクも倍といえる

・リアル寄りかキャラ声寄りかと言われると、中間ぐらい
・収録音階差の問題は母音以外起こらない↓

VCVorCVVC8

・連続音だと子音長がいじりづらい(子音速度で変えられるけど発音のスピード感まで変わってしまうから嫌)が、

 CVVCだとそのあたりはかなり自由にいじれるため歌わせ方の幅が広がる。

れんたんじゅつ・切り出し単独音:

・CVVCほどでないにせよ、原音設定によって出音が大きく変わる。

・単独音よりちょっとマシかなって音。
単独音:

・理論的には一番滑舌が悪い(不自然な発音になりやすい)

・原音設定によって出音が大きく変わる。

・独特の癖のある音だが、界隈最古の収録形式ゆえにこれが「UTAUらしさ」と受け取られることもある

・でも技術ブログなので、性能的な面からは劣っていると言わざるを得ない

・「単独音でしか録れない特殊な音」があるため、拡張音源などの収録に使えるという利点はある(鬼難しい発音の収録など)


-----------------------

 

○技術屋目線の比較

 

・原音設定師の感想

連続音:量多いからめんどくさいなぁ

CVVC:量は少ないけど1エイリアスごとに時間かかるからめんどくさいなぁ

単独音:初心者さんがよくわからずに録ってるケースが多いので、原音が不十分だったり変な加工がしてあったり中の人の態度がでかかったり地雷案件率が高くてめんどくs(ry

 

原音設定って大変なんだよ!依頼するときは気を遣ってあげてね!!

てか、わからないなら録る前に連絡してくれ!!

※個人の感想です!!

※これらを苦労と思わない変態もいます!

 


-----------------------

 

○まとめ


連続音

・収録・原音設定ともに量が膨大。

・使う時は簡単。工夫すれば自由度も高い。

・一番綺麗。

・昔こそ「連続音化プラグインの導入がめんどくさい(わからない)」という声もあったが、今となってはそんなに気にしなくていいと思う


→現在のUTAU音源のスタンダード的存在。

量だけが欠点(量が多いせいで発音が安定しないこともあるのでけっこう深刻)


CVVC
・中の人に優しい。収録量:綺麗さのコスパが良い。お手軽な割にはそこそこ綺麗。

・しかし仕上がりはピンキリ。

・出音の綺麗さでは、音をつなぐ仕組みの観点からは連続音にかなわないが、原音の収録しやすさを考えると中の人のスキルによってはCVVCのほうが安定する(向き不向きがある)。
・連続音の欠点である量と音階差の問題をほぼ完璧にカバーできる。

 

・CVVC=なんか難しいと思われがちなため、初心者ユーザーには敬遠されやすいかも。(イメージ改善したい!)

・実際は使い方が何通りもあるため、初心者から上級者まで誰にでもおすすめしやすい形式だったりする。

(半分切り出し単独音だから、単独音使用でも普通の単独音よりは綺麗)


単独音

・古い形式であり、技術が色々進化した現在ではメインの音源(拡張じゃない)として録るメリットはあまりない。

(収録量はCVVCと大して変わらない。使い方は簡単だが連続音だってそんなに難しくはない。CVVCの中にも単独音は入ってる。出音もあまり良くない。原音設定はちゃんと使おうと思ったら連続音より難しいし、CVVCを録って単独音だけ原音設定するほうがまだ拡張性が高い。)

 

・1音ずつ録れる、あーーと伸ばして録れる、という独自の特徴を活かして、特殊な収録に利用できる。

(連続して言いづらいエッジボイスや鼻濁音などの難読リスト、1音の間に声質や音量が変わる拡張音源(ダイナミクス音源など)、エンジンを通したくない(=音符を伸ばせない)ひそひそ声などをロングトーン単独音で録るなど。
ポップノイズが乗りそうな超強い単独音を1音ずつ丁寧に録って、強CVVCと組み合わせるとかもあり。)

 

・連続音が出た当初、単独音だったキャラクターたちが連続音verを出したときに、中の人寄りの出音になってキャラクターらしさが失われてきたという経緯があり、綺麗な音だけがすべてじゃないよね!と単独音を擁護する声は未だ多い。

(UTAU文化はオリキャラ創作文化と距離が近いため、キャラ観の統一が重視されやすい。うちの子の新音源、キャラの維持と表情の拡張どっち重視がいいと思う~?みたいなTwitterアンケートが度々見受けられる)

 

→歴史的・文化的に支持されている

→でも今から中の人を始めるならあまり関係ないのでは?

 


切り出し単独音

・実質「短い収録時間で綺麗な単独音が作れる方法」
・最軽量を生かして妖怪オンゲントロするのに向く。こんなに簡単に録れるよ!とそそのかすのにもってこい。
・テスト録音など実用しない音源の収録にも向く。

・8モーラとかのCVVCリストで録って、単独音部分だけ原音設定すれば、コストを増やさず玄人のファンにも優しい切り出し単独音が作れる

 

れんたんじゅつ

・CVVCが流行る前に誕生した、試行錯誤の産物みたいなもの。

よって、れんたんリストそのものより、れんたんのロジックに価値があるような気がする。

・語頭にエッジが乗りがちな人とかはれんたん向き。

でもれんたんロジックのCVVCもあるので、それで良いじゃん?と言えないこともない。

・eve式CVVCリストで録って、れんたん部分だけ原音設定すれば、コストを増やさず玄人のファンにも優しいれんたんが作れる


○補足

 

Q.初心者です!使うならどれがおすすめ?

A.音を出すだけならどれでも簡単。気に入った子でok!

勉強的な意味でなら、緋惺(あけさと)の連続音など。連続音だけダウンロードすれば同時にCVVCと単独音も使える優れもの。

 

Q.一番思い通りに歌ってくれるのは?

A.表情や表現力を重視するなら、CVVCでも単独音でもなんでもいいから表情音源の種類が多い子や、エッジボイスなどを搭載している子が良い。

リズムやタメの調声をガンガンできるのはCVVC搭載の子。

とくに緋惺や空花ルアのような「連続音にCVVCの原音設定もしてある」音源は音素材の選択肢が豊富なのでいくらでも遊べる。

 

Q.初心者です!中の人になりたい!

A.はじめての録音!ページ準備中って言いながら数年経っててごめんな

 

Q.ベーシックでおすすめの録音リストは?

A.巽式8モーラ連続音とか?

 

Q.一番コスパを突き詰めた収録形式は?

A.連続音とCVVCをハイブリッドにしたリストがあります!

(不自然になりやすいラ行などは連続音で、雑でいい発音はCVVCで~等)
まいこ製リストくろ州製リストなど。

 

てか録音リストは自分で改造していいんだぜ!!

連続音と単独音のハイブリッドとかもできるし、

ヴぁ行を録るかどうか、鼻濁音ガ行を録るか(発音できるか)どうか、喉きり母音を録るかどうか、など自分に合わせてカスタマイズしたり、ロングトーン母音や子音単体をプラスしたり。

拡張用リストもあるので好きなものを足してください!

 

 

○ダメ押しで補足(マジで燃えやすいのでこの話題…)

ここで紹介してるのは「収録時・使用上の理論上の利点と欠点」であって、今世に出てる音源のどれが優れているか、どれを使うべきかという話ではないです。

実際に出来上がった音源がCVVCより単独音のほうが良かったなんてざらにあります。

連続音よりCVVCのほうが良かったなんてもっとあります。

それは録った時のコンディションとか色んな問題が絡むせいであって、収録形式が全てではないのは冒頭に書いたとおりです。