おはようございます。
今日も読みに来ていただき、ありがとうございます。
今日は、『深層強化学習』について書いていきます。
深層強化学習は、
ディープラーニングと強化学習を組み合わせた
手法です。
エージェント (学習モデル) が
環境との相互作用を通じて学習し、
最適な行動をとるための方策を獲得することを
目指します。
深層強化学習とすることで、強化学習よりも
状態や行動の組み合わせが多い場合の学習が可能
になりました。
これにより、縮約表現の必要性が緩和されました。
縮約表現とは、
状態の重要な情報を取り出しパターン数を減らす
手法です。
深層強化学習の主なものに
Deep Q Network (DQN)
があります。
DQNは、Q学習において、
状態と行動の価値をこれまで得た報酬で近似する
Q関数をニューラルネットワークで表現する手法
です。
DQN、Q学習については強化学習の手法をふまえて、
明日書いていきます。
それでは、また👋