• 感想戦での会話例

    • 「敗着は、あなたが最初に指した3四歩です。」
    • 「何寝ぼけたことを、そんな訳ないだろ。」
    • 詳しく説明すると、「あなたは、私が指した後の2手目に角道を開けたばかりに、飛車先歩の交換後、横歩を取られてしまったじゃないですか。横歩を取らしてはいけない、このことは将棋界の鉄則ですよ。そんなことも忘れてしまったんですか。」
    • 「はい、確かにその通りです。お見それしました。」
    • こんな会話が近い将来聞けるかもしれません。
  • アルファゼロの思考

    • 横歩を取られると即負けに繋がる構図がある
    • エルモとの100番勝負前に3日間の自己対戦を実施
    • 最初の12時間分のデータが公開されている
 
 

アルファゼロは、エルモとの100番勝負をする前に3日間の自己対戦を行っています。
その時の最初の12時間分のデータが公開されております。
折れ線グラフの横軸が時間(0から12時間)で縦軸が出現頻度です。
  • グラフ説明(横軸: 時間、縦軸: 出現頻度)

    • 左上:先手2六歩、後手8四歩
      • 12時間後でも頻度が最も多い
      • この局面は学習が継続されている
    • 右上:先手2六歩、後手3四歩
      • 約5時間で学習終了
      • 先手有利と判断したため、学習する価値がなくなった
    • 左下:先手7六歩、後手3四歩
      • 学習途中で打ち切り
      • 価値のない戦法と判断
    • 右下:先手7六歩、後手8四歩
      • 12時間後も約7%が残る
      • この局面はまだ価値があると判断
  • 結論

    • アルファゼロが後手で最初に3四歩を指さないのは、横歩取りを恐れているから
    • 横歩を取られると負けるという認識がアルファゼロに生まれている
  • エルモとの100番勝負振り返り

    • アルファゼロ先手番初手(50局)
      • 2六歩:33回(66%)
      • 7八金:17回(34%)
      • この初手の割合から見ても、2六歩の方が有利と判断
    • アルファゼロ先手番戦型
      • 相掛かり:33局
      • 横歩取り(青野流):17局
      • 横歩取りの割合が34%と比較的高い
    • アルファゼロ後手番初手(50局)
      • 8四歩:42回(84%)
      • 3二金:8回(16%)
      • 後手では3四歩を一度も指していない
    • アルファゼロ後手番戦型
      • 相掛かり:46局
      • 相雁木:2局
      • 先手雁木 vs 後手右四間飛車:1局
      • 先手左美濃 vs 後手雁木:1局
      • 横歩取りは一度も指していない
  • 重要ポイント

    • アルファゼロは後手で3四歩も横歩取りも一度も指していない
    • 自己学習データと合わせて、アルファゼロ内部では横歩取りは終わった戦法と考えられている
    • コンピューターの思考はブラックボックスであり、途中経過は不明だが、結果からその傾向が読み取れる
    • エルモとの対戦でもその結果が顕著に現れている

まとめ

  1. 横歩取りの回避:アルファゼロは後手で3四歩を指さないことから、横歩取りを極端に避ける傾向がある。
  2. 学習結果の反映:自己学習データからも、横歩取りの価値が低いと判断している。
  3. 戦法の変遷:過去のデータと比較しても、アルファゼロは新しい戦法を取り入れ、古い戦法を排除する進化を続けている。
  4. ブラックボックスの思考:アルファゼロの思考過程は不透明だが、結果として横歩取りを避ける姿勢が明確に表れている。
 
参考文献
 
1.AlphaZero論文のデータから見る将棋界の未来予想図①
https://www.youtube.com/watch?v=VCsXGWV_TN0
 
2.将棋界最強AlphaZeroの論文をざっくり解説
https://www.youtube.com/watch?v=N6MzwqPs1q0
 
3.AlphaZeroの論文PDF
https://arxiv.org/pdf/1712.01815.pdf