おはようございます。


今日も読みに来ていただき、ありがとうございます。



今日は、『深層強化学習』について書いていきます。




深層強化学習は、


ディープラーニングと強化学習を組み合わせた


手法です。



エージェント (学習モデル) が


環境との相互作用を通じて学習し、


最適な行動をとるための方策を獲得することを


目指します。



深層強化学習とすることで、強化学習よりも


状態や行動の組み合わせが多い場合の学習が可能


になりました。



これにより、縮約表現の必要性が緩和されました。



縮約表現とは、


状態の重要な情報を取り出しパターン数を減らす


手法です。



深層強化学習の主なものに


Deep Q Network (DQN)


があります。



DQNは、Q学習において、


状態と行動の価値をこれまで得た報酬で近似する


Q関数をニューラルネットワークで表現する手法


です。




DQN、Q学習については強化学習の手法をふまえて、


明日書いていきます。




それでは、また👋