藤井聡太竜王名人の棋戦を見ていて、時どき、「あれ?」と思うことがあります。
藤井竜王名人がAIが示している最善手を指さないのです。しかも、藤井聡太竜王名人は最善手ではないことをわかって指しているような気がします。
わたしのような素人は、AIが示している最善手が一番いい状態を表しているはずだから、それを指すのが一番いいと思ったりしますが、そうではないのかもしれません。
AIは評価値という基準だけで、一番いい値を取る局面を目指して進めようとします。約30数手先ぐらいにある一番よさそうな評価値を目指して進めているのです。その際勝ち負けは関係なく、自分自身の予測の中で一番高い評価値を目指すだけになります。
AIは人間の指した棋譜をもとに評価値を作っていて、ソフトによっては、AIの学習モデルや、計算方法が変わると最善は違うことになるので、AI同士で戦ったとしても、勝ち負けが発生します。しかしAIにとっては勝ち負けはあまり大した問題ではありません。
人間の場合はどうでしょう。人間もトップ棋士にもなるとタイトル戦では30数手先を読んでいるように思えます。そして、その30数手先で最善手を尽くしても、悪い局面しか見えないとしたら、その時、人間は、何かしらの策を講じることになります。
相手が戦略を練って臨んできたのであれば、このまま進めば負けになるということを意味しているのです。このまま進んでもダメなら、評価値的には悪くなることがわかっていたとしても、敢えて違う道を選ぶしかないはずです。相手が知っているルートではなく、相手が知らないルートに持っていかないと勝ち目はないということです。
相手が知っている局面であれば、相手は最善手を指してくるし、知らない局面であれば、最善手を指すことが難しくなるということでもあるのです。相手が知らなくて、自分だけが知っている局面を造り出せれば、評価値が悪くても勝つチャンスは出てくるということだろうと思います。
その選択をいつするかということになるのですが、完全に形勢が傾いてから何かしようとしてもおそらく手遅れです。序盤が定石で進むのだとしたら、中盤に差し掛かったあたりで、それを考えるということになるのでしょう。先手番なら、自分の戦略通りにある程度進められるし、分岐した局面をどれくらい把握しているかで勝敗が決まりそうです。後半に入るとほぼ読みの力が現れることになるのかもしれません。後手番になると、相手の戦略通りに進めても勝てないので、ある程度、先例がある局面が終わったあたりでは、何か手を繰り出さないといけないでしょうし、可能ならもっと早いうちに、手を変えないといけないことになるのでしょう。
人間同士の戦いであれば、より先が読めている人が勝つので、相手が先を読めない状況を作り出すという方法が、人間同士の戦いということなんじゃないでしょうか。