第2回電王戦を振り返る~情報処理①GPS将棋 | タマネギの流氷漬け

タマネギの流氷漬け

将棋を中心に、長男・次男の少年野球等、子供たちの日々の感じたことに対して書いていきます。

最近、第2回電王戦の振り返りとして、情報処理(Vol.54 No.9 Sep.2013)という専門誌にミニ特集「現役プロ棋士に勝ち越したコンピュータ将棋」が紹介されていましたので、それを取り寄せて読み込みました。結構読み応えがあったので、中でも今までの特集記事や書籍に紹介されていなかった部分に焦点を当てて書いてみようと思います。




まずはGPS将棋の開発者:金子さんと田中さんによる『2,多数の計算機を活用したゲーム木探索技術の進歩-三浦弘行八段とGPS将棋との対局を振り返って-』から




冒頭に渡辺竜王VSボナンザ以来6年ぶりのトッププロ棋士との待望の再戦として本戦を語り始めています。そして、そのためにはこちらも最高のコンピュータ将棋を準備するとして以下述べられています。




 『チェスのDeep Blueはスーパーコンピュータにチェス専用のハードウェアとソフトウェアで臨みたいと、筆者らは考えていた。理由の1つは、「日本の情報科学者は、将棋の場合はチェスより劣るハードウェアでも人類の知性を超えられると考えた」などの誤解を避けるためである。また、家庭用のパーソナルコンピュータとは異なる圧倒的な性能のコンピュータが登場するほうが、人間と人工知能が特別に対局するという夢の舞台に相応しいという考えもあった』




つまり、この対局を必ず将棋史に大きな足跡を残す出来事になるはずだと予見していたことになります。


また以下の箇所に評価関数について他のプログラムより工夫をこらした点が書いてあります。




 『多数の計算機を活用して対局する場合においても、各計算機でワーカーが行う仕事の質、すなわちマスタに伝える最善手や評価値の正確さが依然として重要である。そのためには評価関数の正確さが重要で、近年の将棋プログラムの強さの向上には、評価関数の正確さの向上が大きく寄与した。そして、それには、Bonanzaの開発者である保木邦仁が実用化した、評価関数の自動学習の果たした役割が大きい。




GPS将棋では、チーム内の数少ない有段者である林芳樹の洞察と試行錯誤により、大駒の利きや攻め駒の組合せ、挟撃などの人間の考え方に近い特徴を、ほかのプログラムより積極的に取り入れている。




GPS将棋は時間をかけて読ませるときちんと強くなる、終盤に楽観が少ない、1台でも強いなどと棋士の方には評価していただいている』




他にもGPS将棋に勝ったら100万円進呈という電王戦事前プロモーションイベントで序盤の弱点がいろいろと発見され、いつも同じ序盤を辿ってしまうために、全国のアマチュア強豪の方がGPS将棋より序盤は上だと認めた上で、その企画後、序盤を重視して評価関数を学習し直していたようです。



その評価関数のおかげで以下のように手を絞り込めたようです。

『対局前の12月の記者発表の質疑において、筆者の一人は約700台を用いる効果として「約4手深く読むことができる」と発言している。その時点では、データをとれていなかったので個人的な予測に基づく発言であったが、幸いにも実際の対局での実績も予測とおおむね一致した。約700台で4手読むためには、平均分岐数を約5.1に抑える必要がある。何も工夫しなければ、分岐数は将棋の平均手数である約80となるので、それを5.1まで小さくできたことが技術的な成果である』

さて、実際の指し手の中で34手目△1四歩と55手目▲6七金を特に注目すべき点として上げています。

『前者は、先手の端攻めを誘発するので損と言われている。思考記録からは、普通の手である△4三金右や2二王に多数のワーカーを投入して調べた評価があまり良くなかったことから、1台だけの探索ながら△1四歩が選ばれたと解釈できる。ただし、この手も tree pipeline を活かして2手前の段階から先行して探索をした評価であるので、1台だから捨てるべきなどと機械的には結論できない。

後者の▲6七金は三浦八段の指し手で、GPS将棋はまったく予想していなかった。・・・後日のインタビューで三浦八段は、▲7四歩と指して得た歩得を活かすには、このように盛り上がって制圧することが唯一の道と判断した旨を述べられている。長期的なビジョンに基づく指し手であるとするなら、GPS将棋が予測できなくともやむを得ないだろう』


詰み探索専用ワーカーについてこう述べられています。

『記録によると詰探索は3台の合計で32,433種類の局面を探索し、6回詰みを見つけ、60回は時間制限で timeout し、残りは詰みがないことを証明した。数少ない詰みの中では、本筋から離れた局面ではあるが40手以上の詰みを1つ見つけていた。全体としてこの対局では、先手の抑え込みが成立するかどうかが焦点となり、どちらが先に相手の玉に迫るかという戦いではなかった。そのために、詰み専用探索が活躍する機会は少なかったのではないかと考えている』

最後にこの対局を大変名誉だったといった内容で締めくくられています。

 『プロ棋士の方々からは、先手の三浦八段に悪手があって勝敗が決まったのではなくGPS将棋が少しずつ良い手を指したと評価していただいた。コンピュータ将棋が指した将棋の内容に関して、ここまでの言葉をいただいて、大変名誉なことと受け止めている。

・・・取材に訪れた人数は、普段の対局よりずっと多かったと聞く。・・・GPS将棋が準備した約700台という特別な構成も、その一部に貢献していたら、とても嬉しく思う。

・・・言葉にしきれない数々の場面の記憶が残る。この第2回電王戦に参加できたことを大変光栄に思っている』


このGPS開発者の記事を読んでみると、ソフトウェア単体の戦いである電王トーナメントにはピクリとも食指を動かされなかったんだろうということが容易に推察されます。

GPS将棋とは何者か?という問いに対しては、『優れた評価関数をもったソフトウェアが巨大なハードウェアで読みを深めることによって、あたかも魂を宿すことのできる知的生命体』。これが最も正答に近いのではないでしょうか。

電王戦当日、GPSの思考内容をリアルタイム動画(青が先手優勢、赤が後手優勢)にて開示していましたが、あの風景はまさにその得たいの知れぬ奇っ怪な生き物の操る多くの触手のように見え、半ば恐怖さえ感じました。

残念ながら次回の電王戦には出場できませんが、その圧倒的なまでの存在感の穴を埋め合わせることが出来るのは、やはりGPS将棋だけでしょう。取り敢えず来年の第24回コンピュータ将棋選手権で、またその勇姿を拝めることを期待してやみません。