今日はちょっとコラム的な記事で
これからは生成AIじゃー
となっているわけですが
画像はね勝手に進んでいくと思います
もうフェイク画像動画はすぐには見抜けないレベル
でもね
文章は日本だけあんまり進んでいないと思います
何故なら言語が難しすぎるから
たまに迷惑メールや広告メール
変な翻訳~これ絶対スパムとか
私達レベル直感で切り分けできるのも
言語の難しさによるもの
AIといっても歴史があって
最近のAIは深層学習といって
ビックデータを読めば
高スペックマシンが
勝手に理解してくれるようになったから
発展した
その前までは機械学習
といって一生懸命人がコンピュータに
揃えた問題集や回答集を与えてたんです
これからは自然言語を深層学習して
すぐに対応できるようにするため、
より自然に人間の考えに沿うようにすること
最近のOpenAIはこれにあたる
自然言語とは言葉です
まぁ人間がアウトプットするものが言葉になるので
当たり前なんですが
その言葉をまず自然言語処理の「形態素解析」っと言って
単語レベルに分ける作業が必要。
英単語がスペースで区切られているように文章を区切る「分かち書き」が
必須になってくる。
でも日本語の文章はどこが区切りかあいまいさがあり、
同じ漢字でも読み方で意味が異なったりもします。
否定語も単語によって異なる
例えば平仮名で書かれた
「きょうはいしゃにいく」は「分かち書き」にすると
「きょう/はいしゃ/に/いく」
=>今日歯医者に行く
この文脈には何となく強い意志が感じらるし
「きょう/は/いしゃ/に/いく」
=>今日は医者に行く
何となく明日は?昨日は?と何かと比較するニュアンスさえある
文章をコンピューターちゃんに理解させるためには
人の手が必要、それらの蓄積が必要で
膨大なパターンが用意されなければ
違和感のある文章が生成される
意味は通じるけど。。。ってことになる
でも一般的なフォーマットにのっとった文章は
簡単に出力されてしまうけど
日本の活路はここにあると思う
AIにまだ追いつけさせない
難解な言語、そして全国民の識字率の高さ
まだまだAIに凌駕されない
日本だけに残る仕事はたくさんあると思う
っで
ChatGPT3.5に同じお題を渡して書いてもらいました
何かそれらしいことをツラツラと言っているけど
全然中身がない。テスト記述の回答だったら怒られるよね
人間の「倫理」で何とか調整しろや
ってこと見たいですよ