久々にボーカロイド曲を作ったので
思ったことを書いてみたい。
今回は初音ミク・アペンドの「sweet」を使って
バラード調の曲を書いてみた。
曲はこちらです。↓
http://www.nicovideo.jp/watch/sm21481962
「九ノ花」
前回の「STAR☆BIRD」同様に手間が掛かったのがリップノイズで
意外と「プチュ!」とか「クチュゥ」みたいなノイズがある。
もちろん人間でも普通にあることなので、
リップノイズがあること自体は問題ではないのだけれど、
ミクの場合は「違うテイクを使う」とか「歌い直してもらう」とか
そういうことが難しい。
同じ歌詞を歌わしてバウンス(書き出し)するならば
特定の歌詞で入るリップノイズは
設定を変更しても歌詞が同じである限りなかなか消すことが難しい。
歌詞が「例えばほら~わりと近くに~」の部分
上の画像は今回の曲のBメロの歌詞が「例えばほら~割と近くに~」の部分だが、
冒頭の「た」の部分をよく見ると(黄色い四角で囲ってある部分)
明らかにノイズっぽい波形が見える。
このように歌詞の中から分離している部分は
地道にフェーダーを下げるか、波形ごとカットするなどの
作業を行えば綺麗にしていける。
面倒ではあるけれど5分程度の曲であれば
十分に頑張れる範囲だ。
注意しなければならないのは
タ、マ、パ、etc…のように一度舌を口内に触れさせたり、
唇と閉じないと発音出来ない音は
「ここノイズだなぁ~」と思ってカットし過ぎると
子音の頭部分をカットしてしまうことになり
「たとえばほら~」が「あほえばほら~」になってしまう場合があること。
(TATOEBAの「T」がカットされてAHOEBAになってしまう)
この辺りも程度問題だが、地道に何度も聞いて
フェーダーを下げたり、カットしていくしかない。
問題は完全に波形の中に埋まっているリップノイズだ。
完全に波形の中に埋まっている場合は除去が難しい
上の画像の赤い四角の中のように完全に波形の中に
埋まってしまっているリップノイズはほとんど絶望的で
もし除去しようとするとかなり根気のいる作業になる。
ミクの場合はこちらの例はほとんどないけれど、
人間のボーカリストさんの場合は
大抵何十分か作業した後に「無理!」という結論に到達し
時間を無駄にすることが多い。
(そしてほかのテイクに差し替えたり、良いとこ取りで切り貼りして対応する)
大抵の場合はノイズっぽい箇所は
波形がギザギザになっていることが多いので
100ms単位で聴き込んでその部分をペンシルツールで補正するという
技もあるけれど非常に面倒で上手くいかない場合もある。
スタジオなんかで時間が限られている場合は
さっさと見切りをつけて違うテイクを選んだ方が賢いと思うが、
自宅で時間制限がない場合は地道に頑張ってみてもいいかもしれない。
次に声質なのだが、
アペンドのsweetはノーマルミクよりも
倍音が豊富で使いやすかった。
人間の女性、ミク(SWEET)、ミク(ノーマル)を見比べて
検証してみた。
人間の女性ボーカルのスペクトラム
初音ミク(SWEET)のスペクトラム
初音ミク(ノーマル)のスペクトラム
前回の記事同様に
分かり易いように各倍音の●に色を付けてマークしておいた。
●基音、●2倍音、●3倍音、●4倍音、のように印が付いているが、
ミクのSWEETはノーマルに対して2倍音がかなり豊富なのがわかる。
クリックで拡大できます。
並べて比較画像を作ってみたが、
●3倍音、●4倍音よりも、●2倍音が多い。
これは聴くだけでも十分にわかるのだが、
声質的に豊富な倍音を持つという点で人間に近いので
扱いやすいと言えば扱いやすかった。
人間の女性ボーカリストのスペクトラムを見ると
基音よりも2倍音のが多く、
それ以上の高次倍音も非常に豊富だ。
その分ディエッサーを上手く掛けてやる必要が出てくるが、
ノーマルミクのように基音が突出していて倍音が少ないよりも
(それがミクの丸みのある可愛らしい声の理由)
人間に近づけるという目的ならば、個人的には扱いやすい。
人間が歌っている曲をお手本にボーカロイド曲を作ろうとすると
上のスペクトラム画像を見てわかる通り、
声質を同じようにすることはほとんど不可能に近いので
この辺りも色々試行錯誤したが、
結局は「ボカロはボカロでいいんじゃね。」という結論に達した。
イコライザーやエンハンサーを使って
無理に人間っぽくするよりも
ボカロらしさを活かした方が現時点の技術レベルでは良いと思うので、
以後はその方向性でいこうと思う。
(初音ミクの周波数スペクトラム研究の記事参照)
今度リリースされる初音ミクV3では声も録り直しているというし、
V4、V5…と進歩していけば
もっともっと良くなると思うのでこの辺はYAMAHAの製作者さんに期待するしかない。
そのうちミクにも「ヒューマナイザー的な機能」がついて
人間が持っている「ゆらぎ」みたいなものが表現できるようになったりするだろうし
一番初期のミクに比べれば格段に良くなっているので、
ひょっとしたら将来は人間と聴き比べが出来ないレベルのものが
もしかしたら出来るのかもしれない。
過去作
【初音ミク】STAR☆BIRD 【オリジナル】
http://www.nicovideo.jp/watch/sm19961290
【IA】 コトノハ 【オリジナル】
http://www.nicovideo.jp/watch/sm21140605
////////////////////////////////////////////////////////////
作曲・DTMの個人レッスンの生徒を募集しています。
このブログの書き主の自宅&skypeでマンツーマンレッスンをしています。
詳しくはこちらをどうぞ。
【パソコンで始める日本一簡単なDTM作曲本】
作曲基礎理論~専門学校のカリキュラムに基づいて~
販売ページへのリンクです。
思ったことを書いてみたい。
今回は初音ミク・アペンドの「sweet」を使って
バラード調の曲を書いてみた。
曲はこちらです。↓
http://www.nicovideo.jp/watch/sm21481962
「九ノ花」
前回の「STAR☆BIRD」同様に手間が掛かったのがリップノイズで
意外と「プチュ!」とか「クチュゥ」みたいなノイズがある。
もちろん人間でも普通にあることなので、
リップノイズがあること自体は問題ではないのだけれど、
ミクの場合は「違うテイクを使う」とか「歌い直してもらう」とか
そういうことが難しい。
同じ歌詞を歌わしてバウンス(書き出し)するならば
特定の歌詞で入るリップノイズは
設定を変更しても歌詞が同じである限りなかなか消すことが難しい。
歌詞が「例えばほら~わりと近くに~」の部分
上の画像は今回の曲のBメロの歌詞が「例えばほら~割と近くに~」の部分だが、
冒頭の「た」の部分をよく見ると(黄色い四角で囲ってある部分)
明らかにノイズっぽい波形が見える。
このように歌詞の中から分離している部分は
地道にフェーダーを下げるか、波形ごとカットするなどの
作業を行えば綺麗にしていける。
面倒ではあるけれど5分程度の曲であれば
十分に頑張れる範囲だ。
注意しなければならないのは
タ、マ、パ、etc…のように一度舌を口内に触れさせたり、
唇と閉じないと発音出来ない音は
「ここノイズだなぁ~」と思ってカットし過ぎると
子音の頭部分をカットしてしまうことになり
「たとえばほら~」が「あほえばほら~」になってしまう場合があること。
(TATOEBAの「T」がカットされてAHOEBAになってしまう)
この辺りも程度問題だが、地道に何度も聞いて
フェーダーを下げたり、カットしていくしかない。
問題は完全に波形の中に埋まっているリップノイズだ。
完全に波形の中に埋まっている場合は除去が難しい
上の画像の赤い四角の中のように完全に波形の中に
埋まってしまっているリップノイズはほとんど絶望的で
もし除去しようとするとかなり根気のいる作業になる。
ミクの場合はこちらの例はほとんどないけれど、
人間のボーカリストさんの場合は
大抵何十分か作業した後に「無理!」という結論に到達し
時間を無駄にすることが多い。
(そしてほかのテイクに差し替えたり、良いとこ取りで切り貼りして対応する)
大抵の場合はノイズっぽい箇所は
波形がギザギザになっていることが多いので
100ms単位で聴き込んでその部分をペンシルツールで補正するという
技もあるけれど非常に面倒で上手くいかない場合もある。
スタジオなんかで時間が限られている場合は
さっさと見切りをつけて違うテイクを選んだ方が賢いと思うが、
自宅で時間制限がない場合は地道に頑張ってみてもいいかもしれない。
次に声質なのだが、
アペンドのsweetはノーマルミクよりも
倍音が豊富で使いやすかった。
人間の女性、ミク(SWEET)、ミク(ノーマル)を見比べて
検証してみた。
人間の女性ボーカルのスペクトラム
初音ミク(SWEET)のスペクトラム
初音ミク(ノーマル)のスペクトラム
前回の記事同様に
分かり易いように各倍音の●に色を付けてマークしておいた。
●基音、●2倍音、●3倍音、●4倍音、のように印が付いているが、
ミクのSWEETはノーマルに対して2倍音がかなり豊富なのがわかる。
クリックで拡大できます。
並べて比較画像を作ってみたが、
●3倍音、●4倍音よりも、●2倍音が多い。
これは聴くだけでも十分にわかるのだが、
声質的に豊富な倍音を持つという点で人間に近いので
扱いやすいと言えば扱いやすかった。
人間の女性ボーカリストのスペクトラムを見ると
基音よりも2倍音のが多く、
それ以上の高次倍音も非常に豊富だ。
その分ディエッサーを上手く掛けてやる必要が出てくるが、
ノーマルミクのように基音が突出していて倍音が少ないよりも
(それがミクの丸みのある可愛らしい声の理由)
人間に近づけるという目的ならば、個人的には扱いやすい。
人間が歌っている曲をお手本にボーカロイド曲を作ろうとすると
上のスペクトラム画像を見てわかる通り、
声質を同じようにすることはほとんど不可能に近いので
この辺りも色々試行錯誤したが、
結局は「ボカロはボカロでいいんじゃね。」という結論に達した。
イコライザーやエンハンサーを使って
無理に人間っぽくするよりも
ボカロらしさを活かした方が現時点の技術レベルでは良いと思うので、
以後はその方向性でいこうと思う。
(初音ミクの周波数スペクトラム研究の記事参照)
今度リリースされる初音ミクV3では声も録り直しているというし、
V4、V5…と進歩していけば
もっともっと良くなると思うのでこの辺はYAMAHAの製作者さんに期待するしかない。
そのうちミクにも「ヒューマナイザー的な機能」がついて
人間が持っている「ゆらぎ」みたいなものが表現できるようになったりするだろうし
一番初期のミクに比べれば格段に良くなっているので、
ひょっとしたら将来は人間と聴き比べが出来ないレベルのものが
もしかしたら出来るのかもしれない。
過去作
【初音ミク】STAR☆BIRD 【オリジナル】
http://www.nicovideo.jp/watch/sm19961290
【IA】 コトノハ 【オリジナル】
http://www.nicovideo.jp/watch/sm21140605
////////////////////////////////////////////////////////////
作曲・DTMの個人レッスンの生徒を募集しています。
このブログの書き主の自宅&skypeでマンツーマンレッスンをしています。
詳しくはこちらをどうぞ。
電子書籍ですがDTM関連の書籍も書いています。
宜しければどうぞ。
DTMマスタリングのやり方
【パソコンで始める日本一簡単なDTM作曲本】
作曲基礎理論~専門学校のカリキュラムに基づいて~
販売ページへのリンクです。