コンピュータに涙は流せるか | 東部福祉情報専門学校オフィシャルブログ

東部福祉情報専門学校オフィシャルブログ

静岡県福祉系専門学校進学希望の方々へ

「新潮45」という雑誌の6月号で、「反ウェブ論」という特集をやっています。
その中に、将棋の塚田泰明九段の『われコンピュータ将棋と引き分けたり』という手記が載っています。
塚田棋士は、先の第2回電王戦の第4局で、「Puella α」という将棋ソフトと対戦し、引き分けました。
対局後の記者会見で、涙を流したのですが、その涙の理由は?


将棋ソフトが一気に人間の強さに近づいたのは「Bonanza」の登場によってです。
「Bonanza」の開発者は、保木邦仁さんという化学反応の専門家です。
「Bonanza」がそれまでの将棋ソフトのレベルを一挙に突破した、言い換えればイノベーションを起こしたのは、保木さんが将棋についてほとんど素人同然だったからです。
将棋でいえば、今までの「定跡」を破って新しい「定跡」を編み出したといえます。


「Bonanza」の開発については、保木さんと渡辺明さんの共著『ボナンザVS勝負脳-最強将棋ソフトは人間を超えるか』角川oneテーマ21(2007年8月)に詳しく解説されています。
渡辺棋士は、永世竜王の称号を持ち、ポスト羽生世代を代表する人と言われています。
東部福祉情報専門学校オフィシャルブログ

保木さんが採用したアルゴリズムの特徴は、2つあります。
「全幅探索」と「評価関数の自動生成」です。


「全幅探索」というのは、「選択探索」に対比される言葉で、1手ごとに指せる可能性のある手をシラミ潰し的に検討するという方法です。
チェスでは常識になっている方法ですが、将棋では探索する対象となる「場合の数」が膨大すぎて効率的はないだろうと考えられていました。
そこでなるべく効率的な「選択探索」、つまり有効な手をいかに選ぶか、ということに主眼が置かれていました。


人間の将棋上達法は、基本的には「選択探索」を洗練させていく、ということになります。
将棋ソフトも、この人間の上達法をいかに真似るか、に主眼が置かれていました。
「Bonanza」は(というよりも保木さんは)、そこを「逆転の発想」で突破したというわけです。


もう1つの「評価関数の自動生成」の「評価」というのは、局面の評価ということです。
言い換えれば、ある局面になったとき、有利なのか不利なのか判断することです。
今までの将棋ソフトは、棋力の強い開発者が、どう評価するかをアルゴリズム化していました。
ところが、「Bonanza」の保木さんは、さほど棋力のレベルが高いとはいえなかったので、過去のデータから1手ごとに評価するという方法を採用しました。
過去のデータというのは、6万局の棋譜です。
こうすることにより、局面ごとに評価し直すことになって、臨機応変に判断ができるようになったということです。


第2回電王戦のプロの5人のメンバーは、去年の6月ごろには内定していて、7月頃から準備を始めたそうです。
塚田さんも、将棋ソフト相手にいろいろ対策を練ってきました。
しかし、実戦では「想定外」のことが起こりました。


将棋には「入玉」という強力で特異な戦法があります。
一方の玉将(玉)または王将が敵陣(相手側の3段以内、自分の駒が成れるところ)に入ることをいいます。

Wikipedia-入玉では、次のように説明されています。


将棋の駒は、玉将・飛車(竜王)・角行(竜馬)以外のほとんどの駒は前方には強いが後方には弱い上、敵陣内では歩兵・香車などを容易に成らせることができるため、相手の玉将が入玉し、後方に陣取られてしまうと、詰めるのが非常に困難になる。このため、両者の玉将が入玉したときは、両者の合意によって対局を中断して点数計算を行う。
点数計算は、自分の盤上の駒と持ち駒を、大駒(飛車・角行)を5点、玉将を0点、小駒(金将・銀将・桂馬・香車・歩兵)を1点として合計する(駒落ち将棋の場合は、落とした駒が上手にあると仮定して計算する。また駒落ち将棋の場合、相入玉した場合は無条件で上手の勝ちとするルールもある)。この方法で点数を計算し、24点に満たないほうを負けとし、両者とも24点以上の場合は引き分けになる。この引き分けを持将棋(じしょうぎ)と言う。


入玉した将棋の実例は少ないので、棋譜がコンピュータに余り入っていません。
塚田さんは、入玉を狙うという戦略をとりました。
しかし、125手目で、将棋ソフトの評価関数からするとあり得ないような手を、「Puella α」が指してきたのです。

東部福祉情報専門学校オフィシャルブログ
「Puella α」も入玉を目指すという展開に、塚田さんは騙されたと思ったそうです。
塚田さんが研究した将棋ソフトにはない発想だったからです。

両者入玉すると、上記したように駒数による点数勝負ということになります。
それまで駒を損しながら入玉作戦をとっていた塚田さんは、一挙に絶望的な状況に追い込まれました。


ところがコンピュータが絶対的に強いはずの終盤に、「Puella α」が変調をきたします。
駒数勝負という評価関数が入っていないため、無意味な「と金」を作り始めたのです。
それは、全体のルールからすると奇妙なものとしか言いようがありませんが、塚田さんに24点獲得という希望が生まれました。
東部福祉情報専門学校オフィシャルブログ

最終的には「引き分け」という結果に終わったわけですが、「人間対人工知能」の現状が象徴的に表れた一局ということになったと塚田さんは総括しています。
それは決して「美しい」とは言えない棋譜でした。


塚田さんが記者会見で、「投了を考えませんでしたか?」という質問に、涙を流したのはそのような事情があったからです。
チームのために負けられないという思いから、人間相手には決して選択をしない筋悪の戦い方を強いられた涙です。
「美学」、「意地」、「自己犠牲」というような「涙」の背景にある思考は、やはりコンピュータにはない人間の特質ではないでしょうか?

(T)