Pa/Pb B1 B2 B3
A1 (5, 2) (2, 4) (4, 5)
A2 (4, 6) (3, 6) (2, 5)
A3 (3, 3) (1, 2) (7, 2)
wikipediaナッシュ均衡見て来たけど
戦略を与える側の視点
Pa視点から(A1,B3)一組、Pb視点から(A2,B2)一組
PaPb視点からは(A2,B1)一組
他のプレーヤーの戦略を所与とした場合なので、
どちらからも所与とした場合である
(A2,B1)均衡(先後対称)じゃないのかこれは
ナッシュ均衡ではない何かの(枷無しの)均衡かもしれない
(A2,B2)均衡と書いてあるけど
「ナッシュ均衡の定義によれば他のプレイヤーの戦略を最適反応であると仮定したうえで自身の最適反応を求めればよい」
後で動いていいとしても、Pbが(A2,B2)に動くとPaはA3(後に(A3,B1)になるということ)に動いてもいいしむしろ(A1,B2)→(A1,B3)がいい
(A1,B3)に動くとPbはB1に動くと負けみたいなもの(移行を促す事は出来る)だし、B3に戻るだけとすると最初から(A2,B1)から動いてはいけない
さらに、Paが(A1,B3)から動かなければPbは(A1,B2)に戦略を変更し、(A2,B2)への移行を促す事が出来る
Paが(A3,B3)に動けば、Pbは(A3,B1)に、お互いに動くと動かれるということで結局(A2,B1)収束がいいと気付く
PaはA2を選択しておくといい、同様にPbも(A3,B1)、(A1,B3)収束より(A2,B1)収束がいいと気付く
Pa/Pb B1 B2
A1 (5, 2) (2, 4)
A2 (4, 6) (1, 6)
Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更して A2 をとれば利得が 2 から 1 へ減少してしまうため、戦略を変更する誘因を持たない。
同様に Pb も、戦略を変更して B1 をとれば利得が 4 から 2 へ減少してしまうため、戦略を変更する誘因を持たない。
→Paは戦略を変更してA2をとれば、Pbが気付いていれば(A2,B1)に移行する可能性があるので戦略変更の誘因を持つ、(A2,B1)に移行しなければ(A1, B2)に戻れる
→Pbは戦略を変更して B1 をとれば、Paが気付いていれば(A2,B1)に移行する可能性があるので戦略変更の誘因を持つ、(A2,B1)に移行しなければ(A1, B2)に戻れる
つまり、PaPb共に一時的移行誘因を持つ
ナッシュ均衡(偽ナッシュ均衡)において一時的マイナス移行への誘因(整合解)を持つ事が出来るのではということ
(非協力ゲームにおいては、ある主体が他の主体と協調せずに、自らの利益を最大限にすることがその目的とされる)
プレイヤーは提携しないのであって、非協力ゲームにおいては一手先しか見えないという前提はない(情報前提がない以上、不完全情報から完全情報まで考察してよい)
ナッシュ均衡はお互いがお互いの戦略を知っている場合の戦略であり完全情報をお互いに持っているとすると(A2,B1)で安定(真ナッシュ均衡)である、動くと例えばPaがA1に戦略を変更するとPbに即座に戦略を変更され(A1,B2)に移行すると(A2,B1)に戻るには他力本願になる、元々動かない方がいい
完全情報近くの情報をお互いに持っているとするとプレイヤー全員の最適戦略解としてのナッシュ均衡において、そこから(A1,B2)に移行するとした場合(あるいは(A1,B2)が支配戦略均衡とする場合)は、自らの利益を最大限にするという非協力ゲームの解としては論理的破綻解となる(支配戦略より上の戦略概念を持っていてよい)
自分のみしか動けないとしておいて、動いたあとに実は他も動けましたではない(先に考慮対象となる)
(加えて、自分が戦略を与えた後相手のみが1回だけ動ける相手についても同様とすると、相手に対して戦略を与えた後の相手の選択は戦略を与えるものであり、相手にさらに戦略を与えることが出来る、この場合についても(A2,B1)から動かない方がいい
利益最大解に到達出来ない枷かけはいくらでも出来るが、自分以外動けない相手についても同様では、元々誰も動けないそれは均衡というのと同義)
構想
現世一切浄格と迦楼羅物語は8年半前に構想したもの
その7年半前には仏教の真髄(涅槃に至る道)をバランスオブパワーと見切った
現世の顕れを均衡の顕れ、鏡として把握し、ある均衡状態から次の均衡状態へと
家畜が人間の10倍、排気ガスがどうこういうレベルではないらしいけど