ブログランキング・にほんブログ村へ
にほんブログ村
ぽちっとしていただけると張り切ります。


【あいろぼっと】

20世紀の始め、ある議論がなされていた。

多くのサルたちにタイプライターを打たせればいつかは意味のある文書が生まれ、

やがては、シェークスピアの悲劇と寸分違わないもの(すんぶんたがわない)が

打ち出されるであろうと。

多くの人がこの問題に取り組み、その結論が導き出された。

それは、時間が無限にあるならばその命題は正しいであろうとされた。

しかし、そのような文章が打ち出されるにはあまりにもたくさんの時間が

かかりすぎるというものだ。

宇宙が開闢して138億年経過したがおそらく1ページの意味ある文章もできていまい。

そしてそれが結論とされた。

それ以来、確率論に時間的なパラメータを加えてその期待値を評価するというのは、

いまでは、基本的な工学的センスとなっている。


21世紀になった。

ある科学者がこの問題を改めて評価した。

この仮定の中でサルを使わずにコンピュータを使えばどうだろうか。

現在のコンピュータは、サルよりもたぶん数億倍速くタイピングできるだろう。

もちろん実際にタイピングするわけではなく32bitで規定される

文字テーブルからランダムに抜き出すという意味であったが。


これで相当な改善がなされた。

1時間ほどコンピュータを走らせるだけで、

なんと『I love you.』という文章が生成された。

そう、これはもはや生成ということばを使ってもいいレベルになった。

科学者は、次に考えた。

あらかじめ意味のある単語を登録しておいてそれを選ぶ方法にしたらどうか。

32bitでは、たかだか65535個の単語しか登録できない。

これでは小説に必要な単語は網羅していない。

そこでこれを64bitに拡張することで184京(けい)個の単語登録を可能とした。

世界中の言語から抜き出した単語を合わせても絶対に到達しない。


実際は、英語で実験が行われた。

そして1時間ほどコンピュータを走らせると、4行の意味のある文章が出力された。

それは、

Mary had a little lamb
Little lamb, little lamb,
Mary had a little lamb
Its fleece was white as snow.

という有名な歌詞だった。


科学者は、これに文章出力エンジンという名称を付けた。

そしてさらに最適化を図った。

ひとつの単語が選ばれたときにその次に現れる確率が高い単語が選ばれるようにした。

これによって意味のある文章である確率がとても高くなった。


この段階で新たなブレークスルーがなされた。

過去に出版された英語の書物すべてがコンピュータに登録され、

ひとつのセンテンスと次のセンテンスの繋がりの構造が解析された。

文章出力エンジンは、定型文であればなんら違和感を感じさせないまでの文章が

作られるようになった。


そしてさらに新しいアイデアが盛り込まれた。

評価システムである。

これは、英語圏の学生のべ20万人の学生が参加して行われた。

コンピュータが1つのセンテンスを提示して、次のセンテンスを作成したときに、

学生たちがそのおかしな点を指摘するというもの。

20万台のコンピュータが相互に接続され、指摘事項をノウハウとして共有していった。


1年後、もはやコンピュータは大学生レベルの文章力を持つようになった。


科学者は、考えた。

そろそろ時期だろうな。


そして彼は政治家としてデビューした。

実は、文学と政治は、親和性がいいのであった。

(了)

【2015年1月記】





ブログランキング・にほんブログ村へ
にほんブログ村
お読みいただいてありがとうございました。ぽちっとしてくださると喜びます。


http://blog.ameba.jp/ucs/outsideservice/outsideserviceinfo.do
Copyright (C) 2011-2015 jube_lion All Rights Reserved.