こんばんはー青い流星です。

 

近日中に「弦巻マキ」を買おうと思います!(宣言)

 

今回は、マキを選ぶに至った過程をメモする記事を書きます。

自分でも頭おかしいんじゃね?と思うくらい比較検討したので、せっかくの苦労をこの記事に()

 

ことの発端は、可不(KAFU)を歌わせるコンテストを目にしたこと。

なにやら、可不(KAFU)をイメージしたオリジナル楽曲を投稿して選ばれると賞金がもらえたりMV制作への道が拓けるらしい…

 

可不(KAFU)とは、花譜(KAF)さんの声をもとに作られた音声合成ソフトです。VOCALOIDみたいなやつです(叩かないで…!)

花譜さんはYoutubeで55万人を超える登録者が居る人気のシンガーさん。

 

全く存じ上げなかったんですが、ツイッターで知り合いの方からオススメの曲を教えてもらったり、なんやかんやあって音声合成ソフトを真面目に選ぶことになりました。

 

さて、ボカロという言葉がだいぶ定着してきた昨今ですが、この語源はVOCALOIDという音声合成エンジン。

最近では別の種類の音声合成エンジンもあります。種類は以下の通り。

  1. VOCALOID(ボーカロイド)
  2. CeVIO(チェビオ)
  3. Synthesizer V(シンセサイザー ブイ)
  4. 初音ミクNT
  5. UTAU
  6. NEUTRINO(ニュートリノ)
全てに共通するのは、いわゆる中の人が居ることです。つまり声のもとになった人がいらっしゃいます。
録音した波形を編集して、組み合わせて自由な声を再現するわけですね。
 
1~3については録音した人ごとにパッケージ化されており、イメージキャラクターが設定されています。
VOCALOIDから順に1,2,3とキャラ数が多いです。
 
4 初音ミクNTは少しややこしいです。
元々初音ミクはVOCALOIDのパッケージとして発売されました。アップデートを重ねていくうちに、ソフトを売る会社と
VOCALOIDエンジンを開発する会社で、目指す方向にズレが出てきましたようです。
そこで、初音ミクNTは別の団体とともに開発した新しいエンジンを用いて2020年に発売し、今後進化を遂げようとしています。
 
5 UTAUは、フリーソフトとコミュニティです。
飴屋・菖蒲(あめや・あやめ)氏が2008年に公開したフリーソフトで、一般人が自分の声を録音してVOCALOIDのような音源に出来ます。
現在ではたくさんのライブラリ…声をもとに作られた音源がネット上に公開されており、また便利なツールも有志の方々が制作している大きなコミュニティです。ニコニコ動画に使い方や、歌わせた動画動画がたくさん投稿されています。
 
6 NEUTRINOは、人工知能(AI)を使ったフリーソフトです。
2020年に公開されました。楽譜と歌詞のデータを渡して処理させると、自動で抑揚をつけて自然な歌声を出力してくれます。
記事執筆時点で7種類のライブラリが存在します。
 
と、これだけ種類があり、その分類の中に様々なキャラクターが居ます。
 
 
自分は音にこだわるDTMerを自称しているので、Wikipediaの製品リストをもとに全てのキャラの声を聴きました。
こんな声が良いなというキャラをメモしていき選択肢を絞っていきました。
もちろんキャラごとに声色は異なるのですが、エンジンの違いによる声の特性もあるようです。開発側の姿勢にも違いがあるような気がします。以下に、個人的な見解をまとめます。
 
※割と長いので、パパっと読み進めたい方は終わりラインまでスクロール
 
----- 長考エリア 始まり -----
1 VOCALOID
素の状態から作り手が自由に作り上げられる余地がたくさんある。
しかし、知識がないと難しい部分も多いことから、最新のVOCALOID5ではたくさんのプリセットを用意したりカンタンに調整できるパラメータを用意したりして敷居を下げようとしている。
声は、低音域から高音域まで、破綻しにくい感じ。ただ、自然に歌わせるのは大変
 
2 CeVIO
手軽さを意識している。CeVIO AIとCS(Creative Studio)が存在するが、どちらもベタ打ち状態でも自然に歌ってくれる(はず。ごめんなさい、エアプです。)
人が調整出来るパラメータは少なめ。カンタンに歌わせられる・喋らせられる、を意識しているのでは。
随分前にさとうささらフリー版を使った時に、それなりのパラメータがあったので、やろうと思えば色々出来るかもしれない。
音は、低音が弱め。発音が明瞭で自然。
 
3 Synthesizer V
人工知能による自動調声と人間がこだわって作ることの両立を目指しているように思う。
ソフトの売り方がちょっと複雑だが、無料お試しの敷居が低く、カンタンなことならお金を払わずに出来るようす。超良心的。
プロ版のソフトでは、レスポンシブな環境を目指しているそうで、快適にグリグリいじるのを楽しめそうだ。スクリプトを書いて自分なりに作業を効率化させることも出来る。
声は若干軽めだけどリアル。
 
4 初音ミクNT
2020年秋に発売し、現在エディターはアップデートを重ねている。初期は重すぎて使い物にならないなどと言われていたが、だんだん改善されるだろう。まだ情報が不足している。
声はよく知る初音ミクの声。VOCALOIDとは声質が異なるらしく、VOCALOIDで出たV4XとNTのどちらを選ぶかは迷うところだと思う。
 
5 UTAU
2008年にUTAUがリリースされてから、急激に進化を遂げ、編集を楽にするプラグインが多数存在する。
元々は単独音音源だったが、その後連続音音源が登場し、母音を繋げることで自然な音の移り変わりを実現した。
エディタは多少があるため、別のソフトで下準備をしてUTAUに持ち込み、調声に励むこととなる。
声はライブラリによる。連続音音源とプラグインにより、機械的に手順をこなすことで結構自然な歌唱になる。(実際に試した)
 
6 NEUTRINO
有志の方が簡易エディタを公開しており、ピッチや音の長さを調整出来る。ただし、編集結果は処理実行後に反映されるので
少しの編集なら可能だが、こだわって編集しようとすると毎回待たされる苦痛を味わうこととなる。
NVIDIA GPUを使うことで、多少快適な環境を手にすることが出来る。
声は、この手軽さでここまで歌うのか、すごい、と思える。ただし、楽譜に歌詞を打ち込む作業が独特で、その手間はかかる。
 
 
というところである。
自分で、こういう歌唱を!というのを突き詰めるならVOCALOIDが良さそうだ。しかし、同様のアプローチで「自分で気に入った音色を作るんだ!」と意気込んだ割にはMOXFやKORG M3といったハードシンセを持て余している現状がある。
理想はそうだけど、出来る自信は…風呂敷広げすぎに注意である。
 
たいていのDTMerの方々は、曲作りの作業は作曲・編曲・作詞に重きを置く。
当たり前のことだけど、そこから考えれば、歌わせる手間は少ない方が良い。手軽さ大事!となる。
実際見かけた記事でボカロPの方のVOCALOIDエディタ作業ファイルを覗くと、あまりEDITされてなかった話があった。(もちろんMIXの方で手間を掛けていると思うけれど)
 
しかし、自分は曲よりもその音色にこだわるDTMerなのだ。
どんな風に歌うか、もし歌詞を考えるんだったらそこを突き詰めてみたい。しかし上記の理想と現実も無視できない(頓挫するもの
 
そう考えて、人工知能と人間のEDITの共存を目指していそうな、Synthesizer Vが最も適切だと考えた。
UTAUで行く可能性はここで外しました。ある程度お導きがある方が、自分も勉強になって良いんじゃないかなと思って。
 
----- 長考エリア 終わり -----
 
長々と書いてしまいましたが、まとめるとこんな感じです。
自分は音にこだわるDTMer(自称!)
  • 歌唱もこだわりたい!
  • でも、絶対扱える自信はないので、人工知能から学びながら良い歌唱をにこだわりたい!
  • 自分で調声するなら、手につくような感覚で扱えた方が嬉しい!(レスポンシブ・カスタマイズ可能な環境
その結果、Synthesizer V 弦巻マキに決定したというわけです。いや~長かった。実際2,3日音声合成限界オタクやってましたからね。
実際にUTAUも導入してマニュアルみたり動画見ながら打ち込んで歌わせたりとかやってました。
 
 
それで、めっちゃ真面目に調べて試して選んだんですが、今のところ強い欲求として歌を作りたいって想いはないんですよね…
(ここで前提ひっくり返る
 
でも前に作ったとき楽しかったので、たぶん始めるとだんだん軌道に乗ってくると思います。やってみて考えよー
 
 
次回は、導入しました!はじめまして1本目の曲&動画!という記事になりそうです。
お楽しみに!でも期待しないで待っててね(どっち)
 
それじゃ、また~
 
P.S.
今回UTAUについて調べて面白いと思ったのは、2008年にリリースされてから、年内に連続音音源が登場し、
様々なプラグインが登場してたみたいなんですよ。コミュニティが活発だとすごい勢いで進化していくんだな…という盛り上がりの強さを垣間見ました。