#AI技術の進化がすごい

最近、youtube投稿は非常にスローとなっていますがもう、この話題につきます。

AE86のLINK　ECUにしてもECUチューニングのスタンダードとなる価格の実現と

速い処理。これはこれで素晴らしいものですが、単にそれはごく単純といっても悪いが

PC的なハード的な話であってそういったデバイスが少なかっただけに過ぎない。

しかし、動画編集していると、編集ソフト内で去年から

本当に様々なAI技術の編集操作がバージョンアップされてきました。

当YouTubeコンテンツの【異臭の森】（一部の方にはオオウケだが、不人気ｗ）では

ナレーション生成が使えるレベルだったので早速取り入れるとこれがまた面白い。

（ナレーション生成の活用によりAIを使うことでより面白い感じに出来ています。）

当初　YouTubeを始めるにあたっては顔出しはしなくても、頑張ってしゃべって、

テロップを入れたほうがいいのであるが、それが苦手で躊躇している人も多いのである。

私もしゃべるのは得意ではなかったのだが、頑張ってしゃべっているのである。

そこでナレーション生成が登場しこれがまた、少し前の機械的な音声ではなくより

人物感がでているので、今後は活用幅が大きい。

またしゃべりが苦手という人にもナレーション生成がカバーできるので動画コンテンツ制作において、自由度も高く、敷居も下がったのではないだろうか。

人間とナレーション生成との掛け合いなども面白い。

少し届かない点といったら、日本語の難易度がある、漢字を正しく読んでくれなかったり、

イントネーションがおかしかったりすることも少々見受けられる。

そこは人間サイドでひらがなにして読んでもらったり、スピードや音の高低を変化を

部分的に変更して幾分かは対処できる。

画像生成、動画生成、文章生成など使える用途は多様である。

いわば、単体で頑張っていた生命体に補助脳みたいなものが

増えてマネージメントしてくれるのである。

そして２０２３年の年末から沸いているのが楽曲生成AIこれがまた、いよいよ日本語を

いいレベルで歌ってくれだしたのである。

（AIで歌詞生成して楽曲生成AIと合わせて、歌詞を再構成、添削、楽曲ブロックを好みに編集）

94年頃の私の高校生バンド時代に遡れば、アマチュアミュージシャンといえば、

すでに世の中はCDの普及が成功し高音質な音楽が出回っているにもかかわらず、

カセットテープがまだ主流で多重録音ができるMTR（マルチトラックレコーディング）機材

であった。

これは、市販のカセットテープ（タイプ２ポジション）を使用して

テープを市販プレーヤーより高速で回すことで、音質を上げる。

VHSにもあった録画の標準と3倍、3倍で録画すれば画質ボロボロになるやつ。

それと同じで、理屈を簡単に言うと、ゆっくり進むテープ面に書き込める録音テープ面積と

高速でテープ面に書き込める録音テープ面積では、高速のほうが多くの録音テープ面積が

使えますんで、早回しするほど音質は良くなるのです。

で、A面の左右LRチャンネルと、B面のLRチャンネルを一方通行同時進行にさせる。

これで合計4チャンネル（4トラック）を各トラックごとに録音して

作品やデモテープを作るという手法が90年代までは多かった。

しかし、やったことがある人ならわかるであろうが、最終的にミキシングして

トラックダウンするころには音飛びや劣化、低音がすっきり減ってしまうのである。

テープ宅録といわれたこの方法には難点があり、中には8トラックの上位機種もあったが、

4トラックでは全くトラックが足りないのである。

そこで行われたのがピンポン録音という手法。

例えば1トラックと2トラックに録音されたものを、まとめて3トラックにダビングするというもので、そうすれば、2in1できてまた使えるトラックができる。しかし、テープの特性上、

やればやるほど音質は劣化する。

加えてステレオサウンドを作りたいともなれば、さあ大変、最初に録音されるであろうセクション（ドラム）はステレオだ。これをLRっステレオで録ると、残り2トラックしか使えない！

ギターダビングしたい、コーラスだのやってると最終的にはボロボロの音源の完成である。

そしてまとめてしまったトラックはもう後でレベル調整が出来ないのである。

独りでやるのは本当に大変だったのである。

当時は打ち込みでオケを作りこみ、オケと同時に自分でギターを弾いて、一気に2トラックステレオで撮り、残った2トラックに、ボーカル、コーラス、ギターなどを差し込んで、極力ピンポン録音はせずにやるという技を使っていた。

もう一つおもしろい話だが、MTR機が買えなかった頃。

市販のオーディオやラジカセの録音をガチャ！と押して録音である。

床の物音、足音などを録音しないようにひもでラジカセを天井から吊り、

いい感じのバランスで撮れる場所を探し、みんなで演奏する。

最終的にはドラムスの天井からマイクをつるして録ったりしていた。

こうして苦労の末、できたカラオケテープをオーディオコンポで再生させ、

もう一つレコーダー機能があるコンポを用意して、

そこに再生側機からRCAケーブルで録音入力させる。

レコーダー側コンポにマイクをつなぎ、重ね録りしたい、

ボーカルやギターを演奏して多重録音を行っていた。

これを繰り返せば多重録音ができるのであるが、

二度目の多重録音をやれば、ベースなんて全く聞こえなくなっていたのだｗｗ

そんな時代だったのでプロ（セミプロ）かアマチュアなのか？というのは、

楽曲がどうこうの前に持ってきた音源の音質で一発で区別がつくもので、

バンドの音源音質が悪いというのは僕たち素人と言ってるような感覚があったものだ。

そういった苦労で音質問題と時間効率の悪い作業でやっていたものが、

手の平に収まるスマートフォン一つでなんでも、

一流なことはできないが、それなりなことが出来てしまうのである。

これは感動である。

また楽器や楽曲に取り組みたく、ボーカルは入れたいけど歌えない、苦手といった

状況にも最適である。

AI技術がここまでのレベルに来ればプロユースとしても使える機能も装備してくるのは

もうはやいと思うそうなれば、センスと感覚的なものだけで、今まで聴く側だった人たちが

すごい作品を作る可能性は無限大である。

しかし、いろいろ試行錯誤してきた経験、技術、知識は無駄にはならないと信じている。

それはAIのみでやらせて、仕上げるとどうもおかしな点は多々でてくるのはあるし、

そこが進化はするだろうが、やはりネット上にある既存のものを食ってきたAIが生成するので、

人間による加筆というか添削、編集でAIと上手にタッグを組めないと今一つしょっぱい作品しか

出てこないからである。

そこは前回書いた　大切なことはネットにも本にもないという推察が

私は正しいと思っているしAIの持ってきたアイデア、作ってきたものを基にしていっても

最終的には素晴らしい例えば、構成作家、監督が仕上げることが必要である。

その仕事は人間であってほしいし、そうでないと心はつかめないのかなと思っている。

生成した曲に人間による演奏や歌唱、再構築、歌詞の手直しやそこからのイマジネーションで

仕上げるとこれまた新しいものが生まれるだろう。

だから人間は絶対必要でレベルもそれぞれの作者で差が出るはずである。