強化学習(ボールキャッチゲーム)Deep Q-networkの実装 | python3Xのブログ

python3Xのブログ

ここでは40代、50代の方が日々の生活で役に立つ情報や私の趣味であるプログラム、Excelや科学に関する内容で投稿する予定です。

requrementsのdoom_pyのインストールは回りくどかったです。

pipでもcondaでもだめでした。

そこで、以下のURLを参考にgym-doomをインストールし

間接的にdoom_pyをインストールすることにしますした。

URL:https://github.com/openai/gym/issues/760

 

今回は状況から左、とどまる、右と3択する単純な学習でしたが

ここからAlpha GoやAlpha Zeroと強化学習の進歩はとどまるところを知りません

※これは書籍から知ったのですが、現在は相手の札を見ることのできない

 ポーカーゲームでも、それを強化学習したAIであるLibratusが

4人のトップポーカープレイヤーと対戦し 彼らに圧勝しているそうです。