生成AIと日本の未来

今日はちょっとコラム的な記事で

これからは生成AIじゃー
となっているわけですが
画像はね勝手に進んでいくと思います
もうフェイク画像動画はすぐには見抜けないレベル

でもね
文章は日本だけあんまり進んでいないと思います
何故なら言語が難しすぎるから

たまに迷惑メールや広告メール
変な翻訳～これ絶対スパムとか
私達レベル直感で切り分けできるのも
言語の難しさによるもの

AIといっても歴史があって

最近のAIは深層学習といって
ビックデータを読めば

高スペックマシンが

勝手に理解してくれるようになったから
発展した

その前までは機械学習
といって一生懸命人がコンピュータに
揃えた問題集や回答集を与えてたんです

これからは自然言語を深層学習して
すぐに対応できるようにするため、
より自然に人間の考えに沿うようにすること
最近のOpenAIはこれにあたる

自然言語とは言葉です
まぁ人間がアウトプットするものが言葉になるので
当たり前なんですが

その言葉をまず自然言語処理の「形態素解析」っと言って
単語レベルに分ける作業が必要。
英単語がスペースで区切られているように文章を区切る「分かち書き」が
必須になってくる。

でも日本語の文章はどこが区切りかあいまいさがあり、
同じ漢字でも読み方で意味が異なったりもします。
否定語も単語によって異なる

例えば平仮名で書かれた

「きょうはいしゃにいく」は「分かち書き」にすると

「きょう/はいしゃ/に/いく」

=>今日歯医者に行く

この文脈には何となく強い意志が感じらるし

「きょう/は/いしゃ/に/いく」

＝＞今日は医者に行く

何となく明日は？昨日は？と何かと比較するニュアンスさえある

文章をコンピューターちゃんに理解させるためには
人の手が必要、それらの蓄積が必要で
膨大なパターンが用意されなければ
違和感のある文章が生成される

意味は通じるけど。。。ってことになる

でも一般的なフォーマットにのっとった文章は

簡単に出力されてしまうけど

日本の活路はここにあると思う
AIにまだ追いつけさせない
難解な言語、そして全国民の識字率の高さ
まだまだAIに凌駕されない
日本だけに残る仕事はたくさんあると思う

っで

ChatGPT3.5に同じお題を渡して書いてもらいました

何かそれらしいことをツラツラと言っているけど

全然中身がない。テスト記述の回答だったら怒られるよね

人間の「倫理」で何とか調整しろや

ってこと見たいですよ