情報構造

非協力ゲーム展開形で表記する際に特有な構成要素として情報構造がある。情報構造はしばしば情報分割information partition)と呼ばれる概念を用いて表現される。情報分割 {\displaystyle U=[U_{0},...,U_{n}]} はプレイヤー分割 {\displaystyle P=[P_{0},...,P_{n}]} の1つの細かな分割であり、プレイヤーi の情報分割 Ui に含まれる集合 u をプレイヤー i の情報集合information set)と呼ぶ。すなわち、ゲームの中で情報集合 u に属する手番 x に到達したとき、プレイヤー i は情報集合 u に含まれるある手番に到達したことを知るが、情報集合 u に含まれるどの手番に到達したかは知らない。したがって情報集合の概念を用いることによって、各プレイヤーが各手番において何を知り何を知らないかを数学的に定義することが可能となる[90]。過去の手番で選択された戦略が全てのプレイヤーから知られているゲームを完全情報ゲームgames with perfect information)と呼び、そうでないゲームを不完全情報ゲームgames with imperfect information)と呼ぶ[91]情報構造の詳細については展開形ゲームの項目を参照。

特性関数

プレイヤー集合 N の部分集合の集合 2N 上に定義される実数値関数特性関数characteristic function)と呼ぶ[55]。各提携 S ⊆ N に対して v(S) は提携 S のメンバーが協力することによって得られる便益の総計を表している[55]。特性関数について仮定されることの多い性質として、優加法性super-additivity)や凸性などが挙げられる[92]。特性関数はプレイヤー間での効用の譲渡が可能な提携形の協力ゲームを構成するルールである。特性関数の詳細については提携形ゲームおよび協力ゲームの項目を参照。

ゲームの解概念

ゲーム理論においてsolution)とは特定の性質を持ったゲームにおいて現れる可能性のある結果を体系的に記述したものである[60]。現実の多様な状況を分析するためにさまざまな解の概念が考案されている[93]戦略形展開形の表現形式で定義されたゲームの解概念に対してはエダクティヴな解釈とエヴォルティヴな解釈がなされる[† 16]。まずエダクティヴeductive)な解釈とは、ゲームの解が特定の状況におけるプレイヤーの行動を予測するという解釈である[94]。この解釈において、プレイヤーはゲームのルールを熟知しており十分に理性的に行動した結果として均衡に到達すると考えられる[95]。他方、エヴォルティヴevoltive)な解釈とは、ゲームの解が何らかの性質を持った状況において観察される規則性を説明するという解釈である[94]。この解釈では人々が最適化問題を間違えずに解く能力を持っていることすら仮定されておらず、長期に渡って低い利得を生む戦略が淘汰されより優れた戦略が選別されていく進化論的な過程の結果として均衡に到達すると考えられる[96]後述する通り生物学では、明らかに思考を持たない動物の行動をゲーム理論の解概念によって予測・説明することに成功しており、生物学から逆輸入する形でエヴォルティヴな均衡解釈が体系化されている。以上が非協力ゲームの解概念の解釈であったのに対し、協力ゲーム理論における解概念とはプレイヤーが提携によって得た便益の分配方法を表すものである[55]。本節ではこれらの解の概念について解説する[† 17]

強支配戦略均衡

プレイヤー i にとって他のプレイヤーの全ての戦略の組に対してある戦略 si が他の戦略 ti の与える利得よりも常に大きいとき、すなわち

{\displaystyle \forall s_{-i}\in S_{-i},f_{i}(s_{i},s_{-i})>f_{i}(t_{i},s_{-i})}

が成り立つとき、戦略 si は戦略 ti を強支配すると定義され、si が他の全ての戦略を強支配するとき、すなわち

{\displaystyle \forall t_{i}\in S\setminus \{s_{i}\},\forall s_{-i}\in S_{-i},f_{i}(s_{i},s_{-i})>f_{i}(t_{i},s_{-i})}

が成り立つとき、si を強支配戦略と定義する[98]。さらに、全てのプレイヤーが強支配戦略をとっているとき、そのような戦略の組を強支配戦略均衡と呼ぶ[99]。強支配戦略の定義は強い条件を課しており、強支配戦略均衡には非常に限られたタイプのゲームにしか存在しないという欠点がある[100]

被支配戦略逐次排除均衡

強支配戦略均衡に対して被支配戦略逐次排除均衡とは、「相手プレイヤーが被支配戦略を選ばないと仮定した際に、新たに強支配される自分の戦略を自分が選ばないと仮定した際に、新たに強支配される相手プレイヤーの戦略を相手プレイヤーが選ばないと仮定した際に、……」という推論を繰り返して残った戦略の組である。被支配戦略逐次排除均衡は強支配戦略均衡よりも戦略組が存在するケースが多い均衡概念であるが、被支配戦略逐次排除均衡が実現するためにはすべてのプレイヤーの利得関数が共有知識であり、なおかつ各プレイヤーが無限の推論能力を持っている必要がある[101]。さらに、すべての戦略組が被支配戦略逐次排除均衡の条件を満たしてしまうケースすらあり、被支配戦略逐次排除均衡は多くのゲームにおいて予測の役に立たないという欠点がある[101]

ナッシュ均衡

詳細は「ナッシュ均衡」を参照

前述の強支配戦略均衡と被支配戦略逐次排除均衡がそれぞれ持つ欠点に対して、以下に定義されるナッシュ均衡は支配戦略均衡とは異なり混合戦略の範囲では必ず存在することが知られており、また、被支配戦略逐次排除均衡よりも強い概念であるため[† 18]、経済分析にとってナッシュ均衡は非常に都合がよく、実際にほとんどの非協力ゲームの分析においてナッシュ均衡が応用されている[102][103][37]ナッシュ均衡Nash equilibrium)は次の条件を満たす戦略の組 s* として定義される[104]

{\displaystyle \forall i\in N,\forall s_{i}\in S_{i},f_{i}(s^{*})\geq f_{i}(s_{i},s_{-i}^{*}).}

この条件は、各プレイヤーが自分を除く全てのプレイヤーの戦略を所与とした際に最適な戦略を選択していることを意味しており、自分以外の全てのプレイヤーの戦略の組 si を所与とした際にプレイヤー i にとって最適な戦略の集合を BRi(si) で表すと、ナッシュ均衡s*は

{\displaystyle s_{i}^{*}\in BR_{i}(s_{-i}^{*})}

を満たす戦略の組として定義することも可能である[105]。したがってナッシュ均衡において、「自分が行動を変えると相手がそれに反応するのではないか」という予想をする必要がどのプレイヤーにも無く、ナッシュ均衡によってゲーム理論誕生以前のクールノー均衡やベルトラン均衡、シュタッケルベルグ均衡といった雑多な均衡概念を統一されたと評価される[106]。ナッシュ均衡は数学的には最適反応対応 {\displaystyle \mathbf {BR} :=(BR_{1},...,BR_{n})} の不動点に相当するため、ゲーム理論においては不動点定理が多用される。ゲーム理論における不動点定理の役割についてはゲーム理論#不動点アプローチの節を参照

サブゲーム完全均衡

詳細は「サブゲーム完全均衡」を参照

上で定義されたナッシュ均衡は静学的な均衡概念であった。これに対して、動学的なゲームを考える際には上述のナッシュ均衡条件に加えて「信頼できない脅しやはったり」を排除するための条件が必要となる[† 19]。「信頼性のない脅し(incredible threat)」を排除するためには実際にプレイされることのないサブゲーム[† 20]においても各プレイヤーの戦略が正当化されている必要がある。このような発想からラインハルト・ゼルテン[109]は、動学的なゲームの戦略の組 s* が全てのサブゲームにおいてナッシュ均衡となっているとき、それをサブゲーム完全均衡subgame perfect equilibrium)と定義した[110]。サブゲーム完全均衡は通常のナッシュ均衡が抱えるチェーンストア・パラドックス英語版)のような問題点を解消しており、さらに計算が容易であるため、展開形ゲームの基本的な解概念として受け入れられている[111]

展開形ゲーム後方の最小のサブゲームのナッシュ均衡を先に求め、そのサブゲームをそのナッシュ均衡から得られる利得の組に置き換えることによって得られるゲームを縮約ゲームtruncated game)と呼ぶ。縮約ゲーム自体がそれ自身以外にサブゲームを持たないゲームになるまでこの操作を繰り返して得られるナッシュ均衡はサブゲーム完全均衡と一致することが知られている。このようなサブゲーム完全均衡の求め方は、後ろ向き帰納法: backward induction)と呼ばれる[112]