PythonによるＡＩ・機械学習のセミナーを５回でやるとしたら・・・

第一回　準備編 numpy,matplotlib
　行列計算と可視化

第二回　機械学習　pandas,scikit learn
　機械学習の一連の流れ

第三回　ディープラーニング kerasまたはPyTorch
　ディープラーニングの流れとモデルの作り方
　(MLP,CNN,RNN,LSTM)

第四回　ネットワーク分析 networkx,python-louvain
　中心性、クラスタ分析、構造的空隙（拘束度）は自分で計算？
　http://cogpsy.educ.kyoto-u.ac.jp/personal/Kusumi/datasem07/nakamoto.pdf

第五回自然言語処理 Janome,gensim（場合によってはBeautifulSoup）
　形態素解析、LDA,などなど（場合によってはWebデータから）

というところでしょうか・・・
時間があったら、ぞれぞれについて、詳しく書いてみたいところです。

PIDの古典・現代制御から強化学習、深層強化学習（ＤＱＮ，Ｒ２Ｄ３）までの出力制御のトレンド

前に
OpenCVとScikit-learnとPyTorch・Kerasの使い分け
https://ameblo.jp/smeokano/entry-12526090552.html
を書いたとき出てきた図の「出力」　のところがキーワードが飛びすぎていて、誤解されそうなので、今回、その部分、つまり

PIDの古典・現代制御から強化学習、深層強化学習（ＤＱＮ，Ｒ２Ｄ３）までの出力制御のトレンド
を書いてみました。上記の図の出力のところを９０度倒して、さらに細かく書くと、こんな感じになります。

以下順に説明しますね。

■ＡＩを使わない制御
　例えば、ラジコンカーをここで走らせて１００ｍ先で止まることを考えます。
　ここでＳＷ－ＯＮ，１００ｍ先で（何らかの手段で）ＳＷ－ＯＦＦすればよいように思えます。

　このようにＳＷ－ＯＮ，ＳＷ－ＯＦＦの切り替えにより、処理を制御していくのが「バチバチ制御」で
　このような制御を実現する場合、ただＳＷ－ＯＮ／ＯＦＦをする順番を書けばいいことになります。
　→このＳＷ－ＯＮ／ＯＦＦ制御がシーケンス制御

　しかし、上記のように１００ｍ過ぎたところでＯＦＦにしても手遅れです。
　実際には車はスピードついているので、すぐに止まりません。
　つまり、速度や摩擦までも考えて、ＳＷ－ＯＦＦしていかなければいけません。
　さらにその場合、現在どのように走っているかの情報が必要です。
　このような、自動運転（自動制御）するために、
　現在のフードバックを受けながら（フィードバック制御）
　位置、速度、摩擦を計算しながら（伝達関数で）モデル化し、制御するのがＰＩＤ制御です。

　ただ、ＰＩＤ制御は外乱に弱く、などいろいろな点を改良し、（伝達関数ではなく）状態方程式で
　制御していくのが現代制御です。

　この古典制御・現代制御で「モデル化できるものの制御」は、まず可能であると考えてよいと思います。
　→ＡＩいらない？

　ちなみに、ＰＷＭ制御というのは、この話とは全く違い、１２Ｖ固定出力の時、８Ｖ出すには
　・・・平均したら８Ｖになるように出力制御する方法です。

■ディープラーニングを使わないＡＩっぽい制御
　としては、ファジイ制御、これにニューロを加えたニューロ＆ファジイ制御があるのですが、
　ここでの話とは関係ないので省略します。

　強化学習というのがあります。これは状況（環境）Ｓを認知し、その認知結果に応じて行動aを行うように意思決定する
　システムを構築して、制御を行うものなのですが、その環境から行動までのモデルを作れるかどうかで解法が異なります。

　モデルが作れる場合
　（古典・現代制御で作ればいいじゃんというツッコミは至極全うだけど、ここではおいといて）
　　　→動的計画法という手法で溶きます：今日の話に関係ないので省略
　
　モデルが作れない場合：
　　テキトーに動いてその結果から考えるという→モンテカルロ法と
　　価値関数を最大化するように努力するＴＤ学習があります。
　　そしてＴＤ学習の中でも、
　　　　方策を直接探しに行く方策ベースの方法：手法として方策勾配法を使う
　　　　価値を中心に考える価値ベースの方法と
　　　　　　このうち、（話が長くなって、わかんなくなってきたと思うので理屈省略）
　　　　　　　　方策オン型のSarsaと
　　　　　　　　方策オフ型のＱ学習
　　　　その両方を合わせた方法：手法としてActor-Critic法があります。

　つまり、ディープラーニングでいうＱ学習とは、
　モデルを作らなくていい（モデルフリー）なとき、ＴＤ学習の中の方策オフ型の一つの手法
　となります（まだ、ディープラーニング出てきません）

■ディープラーニングを使った強化学習による制御
　上記のＱ学習をディープラーニングのＣＮＮを使って行ったのがＤＱＮになります。
　ただ、ＣＮＮを直接使うと、（隣接するデータを使うが、それには相関があるので）
　局所最適解に陥りやすいため、バッチを用いてその中から取り出したものを利用するという
　「経験再生」を行うところが特徴です。

　このＤＱＮ、いろいろ問題があります。たとえば、Ｑの値を求めるのに、値の一番いいやつ
　をとってくる→いいかっこしいになる（過大評価になる）のでそれを抑えるDouble DQN(DDQN)
　などです。ＤＱＮ＋６つの工夫たちを集めたものがＲａｉｎｂｏｗです。

　あたりまえですけど、これ、分散させて並列処理させると早くなります。
　これがGOLIRA,APE-Xです。

　一方、ＣＮＮだけでなく、ＲＮＮも利用する（実際にはＬＳＴＭ）もあります。
　ＤＲＱＮがあります。

　そして、このＲＮＮと並列処理を合わせたものがＲ２Ｄ２，
　Ｒ２Ｄ２に人間によるデモデータを加えて学習させたものがＲ２Ｄ３になります。

　また、上の表では出てきていませんが、前の章で、Actor-Criticがでてきました。
　これを深層学習で実装したのがＡ３Ｃになります。

　また、方策勾配法の深層学習実装としてはREINFORCEになります

　※実は複雑に入り混じっているが、説明の便宜上、キャッチコピー的に、性質のつよいものに
　　割り当てた

【参考サイト・この後は】

参考にしたサイトは、以下のサイト

これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ
https://qiita.com/sugulu/items/3c7d6cbe600d455e853b

深層強化学習アルゴリズムまとめ
https://qiita.com/shionhonda/items/ec05aade07b5bea78081

上のサイトと下のサイトの間に、１年の差があります。
１年間でどれくらい世の中が進むかがわかると思います。

この後見るとすると、上記の話を詳細に説明している本があるみたいです
（みたいです→まだ読んでないですけど・・・買ってはあります）

現場で使えるＰｙｔｈｏｎ深層強化学習入門
https://www.seshop.com/product/detail/22970

上記で描いた内容が詳しく載っているみたい（ソースコードもついて）

OpenCVとScikit-learnとPyTorch・Kerasの使い分け

pythonでＡＩ系をやると、
　　OpenCV
　　Scikit-learn
　　PyTorch（またはKeras）
が出てくるけど、この使い分けとか、疑問に持つ人もいそうなので、述べておきます。

まず、Ａｉっぽいことをやるとき、第二次ＡＩブームの終わりから今までに、
大きく３つのトレンドがあった。これに当てはめて説明すると、上記のモジュール
の違いがすっきり判ると思う。

あ～ちなみに、このトレンドはSES2019の自分の発表の中に出てきて、
その資料はslideshareにあがっている

機械学習によるモデル自動生成の一考察ー　決定表と決定木によるアプローチ　－ https://www.slideshare.net/michitarookano/ss-170001136

の１６枚目の資料。ここでは、それを再掲。

ここでは、話を簡単にするため、画像について考えます。

■OpenCV画像処理に使う（機械学習関係ない）

　画像処理の世界で、ＡＩっぽいこと、つまり画像認識をはじめにやっていたことは、
　テンプレートマッチングという手法だった。
　このテンプレートマッチングは、テンプレート画像と似た画像を見つけるというもの。
　ここに機械学習は必要なく、こういう画像処理の世界にOpenCVは使われる。

　実際、テンプレートマッチングを行うＯｐｅｎＣＶの関数はある。

テンプレートマッチングの原理・計算式・例題（SAD, SSD, NCC）
https://algorithm.joho.info/image-processing/template-matching-sad-ssd-ncc/

■Scikit-learn　統計的機械学習（特徴量＋判別）に使う

その後、特徴量を出してきて、その特徴量から、対象物であるかどうかを判断するという
手法が出てきた。
この代表的な特徴量がSIFTやHaar-like（はーるらいく）。
画像から抽出した上記徳亮量をもとに、対象物であるかどうかを判断するところに
統計的機械学習を使う。

この判別で使われるのは主に２種類。線形判別とＳＶＭ。これらは判別の仕方がとっとちがう。

ＳＶＭは、ＡかＢか判別する境界線（サポートベクター）を直接探すのに対し、
線形判別は、まず分散が最大となる線を探す。境界線は、その分散最大の線に直交する
ことから求める。

しかし、いずれにしても、データをもとに行う統計的機械学習で、これらはScikit-learnを使う

結局：特徴量＋判別を行う場合、
　Haar-like+SVMのような、
・ＯｐｅｎＣＶで画像処理して特徴量を出し、
・Scikit-learnで統計的機械学習による判別を行う

という形で作る。このうち、ＳＶＭがディープラーニングが出るまで最強だった。

■PyTorch(Kerasも）　ディープラーニングに使う
ディープラーニングのソフトを作るのに、PyTorchやKerasを使う。

ただ、ディープラーニングが出てくると、特徴量を出す必要がなくなった。
とはいえ、画像処理は必要なので、画像処理部分（拡大縮小・減色、ノイズ修正等）
をＯｐｅｎＣＶで書く。

そのあとのデータ整理にScikit-learnを使うと便利なこともあり、使ったりする。

ただ、ディープラーニングのモデルは、ふつうPyTorchやKerasを使う。

■このほかのライブラリたち。

TensorFlowPyTorchやKerasよりも低レベルなテンソル（実質行列）を
操作するにに使う。最近Keras風に書けるようにもなった。

numpyはもっと基本的な配列を操作するもの。
pandasはデータ解析。欠測値操作などに・・・使うかなあ（＾＾；）
→Scikit-learnとかぶってる

matplotlabはグラフ表示用。たいてい使う。

こんな感じです。こちらからは以上です。

次ページ >>

コンピューターの勉強会・研修ネタ

コンピューターの勉強会や研修の元になりそうなネタの話を書きます。

PythonによるＡＩ・機械学習のセミナーを５回でやるとしたら・・・

PIDの古典・現代制御から強化学習、深層強化学習（ＤＱＮ，Ｒ２Ｄ３）までの出力制御のトレンド

OpenCVとScikit-learnとPyTorch・Kerasの使い分け