クローズアップ現代「将棋コンピューター こうして名人に勝利する」を見ました。もともとのニュースはこちら(→将棋ソフトが元名人に勝利 )。


将棋を10手指すと、10,730,000,000,000,000,000通りの局面があるため、チェスよりも難しくコンピューターはまだまだ人間に勝てない、とされていました。


後手の名人(正確には、元名人ですが)は、最初の手から奇手。「コンピューターの弱点を突いた」つもりらしいですが、残念ながらコンピューターは感情がありません。「手がいくつもある局面に導く。問題を複雑化する」ことで、混乱を招こうとしたようですが、これはまちがいなく失敗。以前に紹介したように、コンピューターは定跡を覚えていますから、それを使わせないためには「へんな手」を打つしかありません。ところが「へんな手」を打ったところで動揺することなく、評価関数を利用した中盤の思考パターンに移るだけです。逆に、人間の側は直感的に排除できない手が増えるため、考えないといけない手が結果的に増えてしまい、ミスをしやすくなります。わかりやすくいえば「普通にやったら負けるのはわかってるから、どうせならわけのわからないことをしてやれ」という悪あがき。でも、しょせん悪あがきです。実力差があるのなら、最初から負け試合なのは見えていますし、実力差がないもしくは実力で勝っているのに悪あがきを選択するのは理由がありません。


この番組には、しばしば「大局観」という言葉が出てくるのですが、勘違いしてはいけないのはコンピューターに大局観はありません。今のコンピューターが100倍速くなっても1000倍速くなっても大局観を持つことはないでしょう。「大局観があるかのように見えるふるまい」をすることは今でもできますが、それと大局観を持っていることとは明確な差があります。(外からそういうふうに見えるんだから、中身はどうであれ「ある」ことにすればいいじゃん、というのがチューリングテストの考え方ですが)


チェスは10の120乗の局面に対して、将棋は10の220乗の局面があるため、「すべての局面を読み切ることができない」という説明。「プロレベルになるとかなり漠然とした本当によくわからないところが多い。直感よりはだいぶん裏付けがある感じ」で手を選択しているというプロ棋士の言葉。つまり、「どうやって手を絞り込んでるのかはプロでも説明できない」ということ。実験をしたところでは、あるレベルまでは上達すると読む局面の数が増えていくのに対し、プロになると逆に減ってしまうらしい。つまり、「直感的に」いらない手を取り除くことができる、ということ。


コンピューターは「直感的に」考えることはできないので、理論的に考えていきますが、かといって「すべての局面をしらみつぶしに調べている」というのは、まちがい。将棋のようなゼロサムゲーム(零和ゲーム)の場合、α-β枝刈りは基本ですし、いい枝を速く見つけるための「A-B型α-β枝刈り」を使ってるのはまちがいありません。ですから、全部の局面を調べることなく「論理的に」必要ない手を削除しています。番組では「今回使われた、コンピューターが人間に近づくための手法」と紹介していましたが、何十年も前からあるアルゴリズムで決して新しいものではありません。


中盤でコンピューターが飛車を左右に動かすばかりでほとんど何もしてないように見える局面で、別室で見ていた四段と五段の棋士は「名人はじっくり指す方針でうまくいっている」「コンピューターが困っているんじゃないか」と評価していたようですが、名人は「私が襲い掛かるのを待ってカウンターパンチを狙っている指し方。私が挑発に乗るのを待っていた」。


実は、将棋は「しかけた側が負け」というのは、かなり昔から知られていることでパスができない将棋のルールでは、ある局面で「動かさざるを得ない側が不利になる」とされています。つまり、ミスをしたほうが負けるわけですが、こういう場面で多くの局面をつぶさに調べるのはコンピューターが圧倒的に有利。今回もまさにこの理由でコンピューターが勝利しています。もちろん、コンピューターは自分が不利な状況に追い込まれたとしても、じりじりすることもあせることもなく、淡々と進めていきますから、根負けするのは人間の側になります。


この場面、コンピューターは相手の手の予想をほぼ的中させており、結果的に名人はそのとおりに打っただけになっています。42手目から72手目、開始後2時間から3時間の間、ずっとこれを繰り返した結果、名人が先に動いてしまいます。ここで一気に7手先まで読み切ってあっという間に敵の守りを崩します。そして、開始から7時間、113手目で詰みとなります。


「私がまちがうのをじーーっと手待ちしてるわけですね。そういう意味では(昭和の大名人と呼ばれた)大山康晴と指した感じ」と対局後の名人。



今回使われた方法として、またまた「機械学習」が出てきました。過去の棋譜をコンピューターが自分で調べてどういう手がいいのかを「考える」というもの。ただし、どのようにして機械学習をしたのかは番組中では紹介されていません。機械学習については、人間とクイズ対決をして勝利したコンピューターも採用していて、今後の「ゲーム」用コンピューターの開発では大きな武器となるのはまちがいないでしょう。(クイズ対決の話は少しだけこちらから→コンピュータとクイズ対決



ところで、これを「人工知能」と呼ぶのはどうか?コンピューターを「電子頭脳」と呼んでいた時代ならともかく、「将棋しかできないコンピューター」を「人工知能」と呼ぶのは無理があると思います。


ゲームのように現実世界を単純化したもので、ゼロサム(ゼロ和:誰かが得をすれば誰かが損をする)ルールで、終わりが必ずあるもの、の場合、コンピューターの能力が今後も上昇すればコンピューターが人間に勝てるようになるのは当たり前のことで、今後も同様のことが続いていくと思いますが、「知能」と呼ぶにはあまりにも単機能ですし、そもそもその「人工知能」を「人工知能が自ら作る」ことはできそうにありません。