戦略集合

戦略形ゲームにおいて戦略strategy)とは各プレイヤーがとり得る選択肢を意味し、行動action)と同義である[41]。プレイヤー i にとって選択可能な戦略の集合を i の戦略集合strategy set)とか戦略空間strategy space)と呼び Si などによって表すが、一般に戦略集合はプレイヤーごとに異なるため、 n 人ゲームでは n 個の戦略集合の組 {\displaystyle \{S_{i}\}_{i\in N}} を定義する必要がある[43][74]。戦略集合が有限であるようなゲームを有限ゲーム、そうでないゲームを無限ゲームという[75]

2人じゃんけんゲーム[76]
1, 2 グー チョキ パー
グー 0, 0 1, −1 −1, 1
チョキ −1, 1 0, 0 1, −1
パー 1, −1 −1, 1 0, 0

上記の意味における戦略には純戦略pure strategy)と混合戦略mixed strategy)とがある。前者は確定的にある一つの行動を選択する戦略であり、後者はある確率分布に従って選択を行う戦略である[77]。例えば、右に掲げた双行列が示す2人有限ゲームはじゃんけんを表しているが、この「2人じゃんけんゲーム」における各プレイヤーの純戦略とは、「戦略グー」、「戦略チョキ」、「戦略パー」である。他方、この「2人じゃんけんゲーム」における各プレイヤーの混合戦略とは、例えば「戦略グー、チョキ、パーをそれぞれ3分の1の等確率で選択する」といったものである。戦略集合 Si の混合拡大 Qi は Si 上の確率分布として定義される[78]

展開形ゲームでは戦略と行動とが厳しく区別され、ゲームの歴史から行動を指定する関数として戦略が定義される[79]。すなわち展開形ゲームにおける戦略とは、完全な行動計画のことであり、そのプレイヤーが行動を起こすことになるかもしれないそれぞれの事態でどの実行可能な行動をとるかをすべて漏れなく指定したものである[80][† 14]。このように定義される展開形ゲームにおける戦略を行動戦略と呼び、他方、個々の手番における行動を局所戦略と呼ぶこともある[82]

 

利得関数

ゲームの重要な構成要素である利得関数payoff function[† 9]は戦略集合の直積定義域とする実数値関数 {\displaystyle f_{i}\colon \times _{k\in N}S_{k}\to \mathbb {R} } として定義される[† 15]。一般に利得関数はプレイヤーごとに異なるため、 n 人ゲームでは n 個の利得関数の組 {\displaystyle \{f_{i}\}_{i\in N}} を定義する必要がある。利得関数の値である利得payoffs)とは各プレイヤーが実行した戦略によって決定されたゲームの結果に対する評価値であり、したがって、利得関数は効用関数、評価関数、損失関数などと呼ぶこともある[84]。ただし、ゲーム理論における利得関数は、従来の価格理論における効用関数とは異なり、定義域に自分の選択した戦略だけでなく他のプレイヤーが選択した戦略が含まれる。これは意思決定の相互依存的状況を重視するゲーム理論の本質的な側面を反映している[84]

社会科学では、利得とは通常、企業利潤profit)や個人の効用utility)に該当する。他方、生物学の文脈では、利得とは個体の適応度fitness)に該当し、生存する子孫の個体数の期待値を意味する[85]

ゲームには偶然の要素がしばしば加わり、また相手の行動の予測が困難な場合も多いため、リスクや不確実性の下での意思決定の基準たり得る利得関数を考える必要がある[84]。このような要請に応える理論的枠組みとして、フォン・ノイマンモルゲンシュテルンによる期待効用理論があり、ゲーム理論においても多く応用されている[86]。彼らによって考案された期待利得関数expected utility function)は混合拡大mixed extension)された戦略集合の直積集合 {\displaystyle Q:=\times _{k\in N}Q_{k}} 上の実数値関数であり、プレイヤーiの期待利得関数 Fi は

{\displaystyle F_{i}(q_{1},...,q_{n}):=\prod _{j\in N}\sum _{s_{j}\in S_{j}}\left\{\prod _{k\in N}q_{k}(s_{k})\right\}f_{i}(s_{1},...,s_{n})}

と定義される[78]

なお、戦略形ゲームにおいては各プレイヤーが選択した戦略の組がゲームの帰結を表すのに対して、展開形ゲームにおいてはゲームの木game tree)を構成する頂点terminal nodes)がゲームの帰結に相当する。そのため、展開形ゲームでは頂点の集合を定義域とする実数値関数として利得関数が定義される[87][88]

非協力ゲームにおいては、各プレイヤーがすべてのプレイヤーの利得関数を知っているかどうかは分析において大きな問題であり、あらかじめ知っている場合や経験によって次第に知る場合、何らかの推定値として知っている場合など、さまざまな場合が仮定される[89]