初めまして、今回は自分の知識の定着を目的としたブログになります。
統計的学習入門(An Introduction to Statistical Learning with Applications in R)を読んで、分析でのいろんなツールで何をやっているのかで、
回帰、分類、クラスタリングと次元削減の4つが主に行われているのかな。
本書で紹介されていたものをRを使って、自分で分析するところまでやりたい。つまり、実際のデータを持ってきて、問題提起、分析をして結論を出す。言語はRとPythonを使う。
3章 線形回帰、線形重回帰、K最近傍法
4章 ロジスティック回帰ー多重ー多項、線形判別分析、2時判別分析、K最近傍法
5章 リサンプリングー交差検証(ホールドアウトー1つ抜き交差ーk分割交差)、ブーストラップ
6章 線形モデル選択と正規化ー1部分集合洗濯(裁量部分集合選択ーステップワイズ法ー最小モデルの選択)2縮小推定(リッジ回帰ーLassoーチューニングパラメータの選択)3、次元削減(主成分分析ー部分最小2乗法)
8章 決定木(回帰ー分類)
9章 サポートベクターマシン
10章 Deeplearning、ニューラルネットワーク、CNN、RNN
13章 教師なし学習 (主成分分析ークラスタリング(K平均クラスタリングー階層的スラスタリング)
これらを、アルゴリズムの復習、注意点、実際に分析するという順番にまとめていこうと思う。
ちなみに、このブログを書いている者は、現在サンフランシスコの統計学部3年生で23歳の男性です。
このブログの目的は、分析を自分で出来るようにしたいために、学んだもののアウトプットの場です。
なぜ分析ができるようになりたいのかというと、アメリカでデータサイエンティストとして就職したくて、そのためにまず、インターンを探したいので、そのためのポートフォリオやスキル定着にでもなればいいなということです。また、後々、英語と中国語に翻訳して、それぞれの言語のメディアに載せていこうと思う。それを老ぼれの大学3年生ではメインでやっていきたい。
指摘はいつでも大歓迎なので、ぜひメッセージしてください。
*追記
機械学習おすすめ書籍 | 必読の1冊 『Rによる統計的学習入門(ISL)』
https://totadata.com/book_islr/
こちらのサイトがすごく参考になりそうなので、迷惑にならないようなレベルで参考にさせてもらいます!
多分、UIとか内容の質が全く格が違うから、あくまで自分の思考の生理用のブログということで、おそらく問題にはならない(なれない)ような気がします。