[NHKスペシャル] AIでよみがえる美空ひばり | 新曲 あれから | NHK


・番組も見ました。音声再現チームの苦闘が興味深かった。この新曲「あれから」には長めな語りが入っている。ところが、美空ひばりの曲にはまず現れない。「悲しい酒」に暗~く出てくるくらい。これをAIに学習させると、暗い再生音しか出てこない。

・これ、面白いなあ。忠実すぎるところが、まず。現在の音声合成のレベルなら、歌音声から暗さ/明るさを解析して差分を析出し、それを語りに掛け合わせて何とかできそうなものなのに。素人の私が考えつくくらいだから、もうやってはみたが、失敗したということか。

・にしても、とてもよく再現できていると思います。音声再現チーム、がんばったんだなあ。でも、欲をいえば、テンポをゆらしたり、タメを使ったりもしてほしい。また、低い音から高い音へ跳躍するとき、高い音の入りばな、わずかに音程を高くして直後にあるべき音程にもどすなど、より生っぽくみせる技術はありそうです。

・しっかし、CGは生硬ですねぇ。もう、よっぽど蓄積があるかと思ってましたが、ディズニーアニメの足元にも及ばない。何でしょうねぇ。デジタル化を導入していない、昔のアニメの方が、よっぽど勉強してるように思います。もちろん、それは「どう見えるか」という受け手の心理を勉強している、ということです。枚数少ない動画で、いかに自然に効果的に印象的に見せるか、を追求する。そのためには、「見る側の心理」つまり「どう見えるか」を考えないといけない。

・「どうせ、こういうところは見ないのだから、省略してよい」「こういうところは目につきやすいから、丁寧に描ききる」とか、見る側の心理を忖度したうえで、処理するという過程が、ひばりCGにはなかったように思うわけです。

たとえば『風の谷のナウシカ』の巨神兵のビームの威力の描出。左から右にビーム砲の光が動く。一瞬何も起こらない。が、瞬間、大規模な爆発。この「何も起こらない」瞬間がタメになっていて、爆発的な火炎を、よりいっそう引き立て、爆発の巨大さ、ひいては巨神兵の恐ろしさを演出しているわけです。

・そのほか、さまざまな技法があるものと思います。こうした「見る側の心理」まで想像して演出しないことには、CGが感動を与えることはできないでしょう。研究者・オペレーターと絵心のあるもの共同作業が必要なわけですが、研究者が絵心を学べば、話は早いかもしれませんけれども。もちろん、逆でもいいけれど、何かを見せて人を楽しませるレベルにまで引き上げるとか、エンターテインメントに舵を切るなら、「見る側の心理」を考えないと、と思うわけです。知らんけど。(^_^;