強化学習はわかりづらい概念がいろいろ出てくるのでわかりづらいです。
それに加えて数式も難しいので、いろいろな本を読んでも「理解した」と
いう納得感が得られずモヤモヤします。
この本では、そういう人でも納得感が得られるであろう「平均」から始め、
わかりづらい概念を順を追って説明していく、という作りになっています。
そういう意味では、平均に基づいて強化学習の基本概念を解説している
第1章は非常にわかりやすい。ただ第2章以降は「第1章で基本概念は
もう理解したでしょ」というテイで話が進んでいくので、今まで読んだ本と
比べても特にわかりやすいという印象はありませんでした。
経済学でいうところの「価値」がきちんと理解できれば強化学習ももっと
理解しやすくなるとは思うのですがなかなか難しいものです。まあ実際に
使うだけなら理論は理解できなくてもいいのですが…。