こんにちは。
キャッチーな(?)タイトルを考えてみましたが、そんな大それた内容でもないですが・・・。
前の記事に書いた通り、電通大)伊藤穀志先生の発表を聞いて、これまでの囲碁プログラムないしAlphaGoが導入しているモンテカルロ木探索なる技術を、AlphaGo VS イ・セドルの第4局をネタに可視化してみようかと思います。
少し長いですが、がんばってね!
内容に間違いあれば、ぜひご指摘ください。
■モンテカルロ法とは?
乱数を用いたシミュレーションを何度も行うことにより、近似解を求める計算手法です。
例 円周率(π)を計算する
図1
・半径1の正方形(面積は4)に内接する半径1の円(面積はπ)を描きます。
・この正方形の中にぶわ~っとランダムに点を打ちます。図1は1000個。
・円の中に入っている点の数を数えます。図1は786個。
・πの値は以下の数式で計算できます。
π=4×(786/1000)=3.144
オウ、なんかそれっぽい数字であるよ。
これは試行回数を多くすれば、精度があがります。(大数の法則)
■モンテカルロ法のゲームへの応用
ある局面を起点(図2の0)として、いくつかの候補手(*)に対してモンテカルロ法を使って終局までプレイアウトします。
*モンテカルロ法ではない他のテクニックを使って、囲碁っぽい手を集中して考えるようになってるみたいです。
どう見てもありえなさそうな手を考えるのは無駄だもんね。
図2を見ると、1-3が一番よさそうで、次点で1-2ですね。
ただ、試行回数が10回ずつなので、精度がいまいち。
では、1-1から1-4まで平等に100回ずつ試行してみるかと言うと、そうではなく・・・
1-3の試行回数を増やしてみたら、図2よりちょっと勝率が落ちました。
でも、今のところまだ1-3が最有力候補。
さて、でもこれだけじゃまだなんとも言えないよね。
1-2をもうちょい試してみたら、1-3より良くなった!
しかし、びみょーなところである・・・。もっとよく考えてみよう。
コンピュータも当然リソースは有限なので、うまーく考える必要があります。
ここまでが、モンテカルロ木探索のざっくりイメージ。
■モンテカルロ法の強み、弱み
図1を用いて説明した通り、モンテカルロ法は確率的手法です。
したがって、「ああ打っても1局、こう打っても1局」というような布石~中盤始めくらいの段階では、モンテカルロ法は強みを発揮します。勝率60%と59%の手があったとして、仮に59%の方を選んだとしても、有利は有利ですよね。
逆に、死活や攻め合いなど、分岐がたくさんあっても正しい手順が1つだけ(一本道)というのが苦手です。
人間なら、動物的な嗅覚で読みのルートを絞り、脳のリソースを集中投下しますが、コンピューターはどれだけ効率的な技術を用いても、いくつもの候補手をフラットに探索かけざるを得ない仕様になっていますから。
これ、良くあるコンピューターイメージの「計算ができるヨセや読み合いが強い」「感性や大局観が求められる布石は苦手」とは逆なので、ここを腑に落とすのは重要です。
■盤面をプロットして可視化する
さて、ようやっと本題に入ります。
図3~5のイメージに、AlphaGo VS イ・セドル 第4局の盤面図をプロットします。
まずは図6~図9まで。
図10(プロットその1) 注:勝率はてきとうです
AlphaGo:(どの進行でもワイが良さそうやけど、図8ルートが一番やばそうやな・・・)
(図7もちょい気持ち悪いわ・・・一応考えておくか・・・)
(図9はないな。考えるのも無駄やし、ポイーや)
図11(プロットその2) 注:勝率はてきとうです
AlphaGo:(あれ、図9打ってきたんか・・・考えてへんかったで)
(まあええわ、これでなんとかなってるやろ。パシー)
さて、ここから図12,14、16。
図13(プロット3) 注:勝率はてきとうです
AlphaGo:(あれ、?けったいなとこに切ってきたわ。)
(あれ?あれ・・・?)
図15(プロット4) 注:勝率はてきとうです
図17(プロット5 完) 注:勝率はてきとうです
AlphaGo:(わかるかボケ!20手先まで1本のルートしかないって無理やんけ)
とまぁ、こんな感じだったんじゃないのかな~。
対コンピューターに対して、こういう展開に持ち込むことは、至難ではあるけど、不可能ではない。
イ・セドルの棋風というのは、こういう展開に滅法強いはずなので、きちんと認識できていたら、相性は悪くないような気もしてきます。
やはり、事前に囲碁プログラムに強いセコンドをつけておくべきだったか・・・。
風の噂で、対AlphaGoで中国でも動きが見えてきているようなので、しばらく静観でしょうかね。













