先日、思考の解読というブログ記事をアップしたので、その続きです。
暗号の解読と思考の解読は共通する部分があります。
前回、暗号の解読の基本的な部分を省略していたのでそこを補います。
簡単な暗号の解読を説明します。
シーザー暗号、別名、換字式暗号の解読です。
シーザー暗号はアルファベットを一文字とか三文字とかずらします。
例えば abc という平文があったとき、
1文字ずらして、暗号文が bcdになります。
あるいは3文字ずらして、暗号文がdefになります。
この暗号文をどのようにして解読するかということです。
1文字とか3文字ずらすという簡単な暗号なので、
目で見ただけでも簡単に解読するかもしれませんが、
体系的な暗号解読の手法を紹介します。
この手法では暗号文が三文字だけだとか解読が難しいのですけれど、暗号文をたくさんたくさん入手できるとします。
そして暗号文の統計的性質を解析するのです。
まずアルファベット文字の頻度分布を求めます。
具体的にはaが何回現れたか b が何回、現れたか、cが何回現れたか、
aからzまでのそれぞれのアルファベットについて、現れた回数を数えるのです。
英語の文章では、eが最も現れやすく約13%であり、次にt が現れやすく、約10%であり、3番目にaが現れやすく、約8%であり、 4番目にoが現れやすく、約8%であり、5番目にnが現れやすく、約7%です。
暗号文でアルファベットが現れる頻度を解析して、最も現れる文字が13%であり、2番目に現れる文字が10%であり、3番目に現れる文字が8%であり、4番目に現れる文字が8%であり、5番目に現れる文字が7%とします。
このようにアルファベットの頻度分布が一致した場合、最も現れる文字がeであり、2番目に現れる文字がtであり、3番目に現れる文字がaであり、4番目に現れる文字がoであり、5番名に現れる文字がnと解読できます。
シーザー暗号では暗号文のアルファベットの頻度分布、文字の頻度分布が暗号の前後で変わらないという特徴があります。
この特徴から暗号が解読できるわけです。
次にシーザー暗号で、暗号文の文字の頻度を解析する代わりに、暗号文の単語の頻度を解析します。
英語の文章では、最も使われる単語が the であり、2番目に使われる単語がofであり、3番目に使われる単語がandであり、4番目に使われる単語がtoです。
するとシーザー暗号の暗号文でも、最も使われる単語が the になり、2番目に使われる単語がofになり、3番目に使われる単語がandになり、4番目に使われる単語がtoになります。
暗号文をたくさんたくさん集めて、単語について頻度を解析すると、その頻度分布から暗号が解読できるということです。
このような単語の頻度解析の手法は脳波の暗号解読にも使えます。
脳波を計測して脳波を8000に分類します。そして脳波が現れる頻度を解析するのです。
最も頻繁に現れる脳波が the になり、2番目に現れる脳波がofになり、3番目に現れる脳波がandになり、4番目に使われる脳波がtoになります。
このような頻度解析に成功するためには膨大な脳波計測データが必要になります。
統計的に確率を求めて確率から解読しているのですから確率を正確に求める必要があるのです。そのためには膨大なデータが必用になるのです。
例えばコインを何回も投げ、裏になるか表になるかという確率を求めます。
この確率は2分の1になるのですけれど、1/2になるということをデータの蓄積から求めるということです。
すると、コインを10回投げても、1024分の1の確率で全て表ということがあり得ます。また1/1024の確率で全て裏ということもあり得ます。
10回コインを投げただけでは、確率は1/2に収束するとは限らないのです。
10回でなく、20回、30回、40回、50回とコインを投げる数を増やしていくと確率は1/2に収束して行きます。
データの数が多くなればなるほどデータから正確に確率を求めることができるということです。
同様に脳波を計測して、膨大な脳波計測データを求めると、脳波の頻度分布を解析できるのです。