ボカロはその仕様から、音声学的考察がなされているようだ。 | ユリウス・グールド・フォン・ロイメルのブログ

ユリウス・グールド・フォン・ロイメルのブログ

ボカロ等DTMの調声におけるアレコレ。楽理や言語学に発展する
こともあるかも(笑

n'Abend/Bonsoir☆

 

上記の件ですが、前々から制作しててそう感じる事象を少し。

 

(今までの例)

ドイツ語の uns(我々Wir の与格と対格(われわれに、我々を))、これをカタカナに音写する場合、

nの後にsを無意識に発音したら舌先が歯茎につくため、ウンスではなくウンツとするのが常識。

eins等も同じです。

ところで、ボカロ(日本語)ではウンスと入力すると大概ウンツと発音されます。

 

今回、例のミサ曲ロ短調、クレドの8番のConfiteor歌唱で、しばしば in remissionem peccatorum

の歌詞が出てきますが、in remissionemのところ、カタカナで書くと…

イン レミスィオーネム? ナイ!

イン クレミスィオーネム ヤー!

そう、大概の盤でイン ”ク”レミスィオーネムって聞こえるのです。あたしも発音してみたら…あっ

rで巻き舌にしようとして軟口蓋破裂音(K)が先に挟まるからかなと。(音声学のwikiの表参照)

他のパートのpe"cc"aと重なってそう聞こえたわけではなかったようです。

 

ボカロで同様にスペル通りに入力すると…(日本語英語問わず)

おお…弱いけどイン クレミスィオーネムと聞こえます。(特に英語ボカロ)

 

ではCeVIOではどうなるか… (日本語及び英語で)

 

シーン…Kが挟まりません。カタカナ通りです。

 

そこでボカロとCeVIOの特徴を思い起こして(WIKIより抜粋)…(下記)

波形接続型(Vocaloid)の特徴
  • 実際の音を基にするためリアル
  • 音自体の加工に弱い
  • 実際の波形データを持つため音源データの容量が巨大
統計的パラメトリック型(CeVIO)の特徴
  • シミュレートして音を生成するためややリアルさに欠ける
  • 音自体の加工に強い
  • 実際の波形データを持つわけではないため音源データの容量が軽量
…妙に納得しました(笑
 
ではCeVIOではどうしたらいいかですが…ボカロ、CeVIO、SynthesizerV共通事項で
聞こえたように訂正入力せよ。が鉄則ですので音素にKを加えてしまおう、と。
かなり自然に聞こえるようになりました(笑
 
因みにSynthesizerVではどうなるか確認したところ…

ボカロと同じで弱いけどKが入っているように聞こえます。AIだから統計的パラメトリックタイプ

に部類される筈ですが、音声学的考察がなされているのでしょうか。ちょっと謎です(謎

でも、推しているp様が多いのも分かる気がしますね。

 

とはいえ、結論を言えば、ボカロもまだまだ十分使えそうと再認識致しました。

 

以上。