囚人のジレンマ | 白黒のブログ

囚人のジレンマ

【囚人のジレンマ】 とは、個々にとって最良の選択が、全体にとって最良の選択とはならない状況のこと。

1回限りの囚人のジレンマにおいては、お互い裏切りあうというのが答え。しかし、それが際限なく繰り返される場合(「繰り返し囚人のジレンマ」)であれば、話は別。裏切らずに協調する可能性が生まれる。そして、その協調を実現するのに有効なのが「しっぺ返し戦略」。まずは協調でのぞみ、後は前回相手がとった行動をとるというもの。相手にしてみれば、裏切れば裏切り返されるので協調したほうが得ということになる。


相手が「しっぺ返し」戦略をとっている時に自分が「常に裏切り」戦略を取る利得がなくなり、(しっぺ返し,しっぺ返し)がナッシュ均衡となる。


また、ノイズあり「繰り返し型の囚人のジレンマゲーム」というものが、考えられる。ここでノイズとは、「相手が協調しているにも関わらず、なんらかの理由で、裏切ったと解釈されてしまう」(あるいは逆に、裏切っているにも関わらず協調していると思い込む)というものである。

ノイズあり「繰り返し囚人のジレンマゲーム」では、しっぺ返し戦略はもはや最強ではなく、パブロフ戦略が強くなる。これは、前回うまくいったら今回も同じ行動を、前回失敗したら今回はその反対の行動をとるという戦略である。


しっぺ返し戦略とパブロフ戦略は、前回の行動のみから今回の行動を決定するというタイプの戦略であるが、これをもっと以前の情報をもとに今回の行動を決められるように、戦略空間を拡大することを考える。

すると、社会全体がある戦略に収束するのではなく、さまざまな戦略が誕生しては滅んでゆくような終わりなき進化がおこりうることがリンドグレーンによって示された。



                                  ~出社が楽しい経済学 第9回(NHK)