みなさま、こんばんわ🌜
大阪は今日も日差しの強い真夏日でした♨😅
1 | Python 2年生 データ分析 3日目 |
---|
本日は『Python 2年生 データ分析』の3日目の学習日でした。
今日は
- 5章「正規分布」
- 6章「回帰分析」
を学習しました。
今回も前回に引き続いて、Jupyter Notebook を使います。
2 | 正規分布 |
---|
「分散」や「標準偏差」など、統計の基本中の基本からスタートしました。
統計は通信制大学(心理学)でも学んだ領域なので、懐かしいです。
なぜこんな統計の基礎から学び直しをしているのかというと、本によると、この本は「データ分析」の本なので、データを分析できるようになることが目的だから、とのことでした。
3 | 標準偏差のグラフ |
---|
本に沿って、データの「標準偏差」をグラフにしてみました。
数字を入れれば「標準偏差」を計算してくれて、グラフにしてくれる機能は便利ですね❗
アドリブで範囲を示す破線を入れてみましたが、本の141ページに書かれてあった矢印を表示することはできませんでした。
やり方は書いてなかったんですけども…。
テキストをそのまま写経することはできても、アレンジしようとすると、途端に詰まってしまいます😅
4 | ゴルトンボードのシュミレーション |
---|
「ゴルドンボードのシュミレーション」のコードを、そのまま写経してみました。
ゴルドンボードは、ボールが上から落ちてきて、下の仕切りにたまっていくゲームです。
ボールがどこに落ちるかは、計算することができます。
同じような単純な計算を何回もするので、「ニューラルネットワークにちょっと似ているな」と思いました。
5 | 回帰分析 |
---|
続いて、6章の「回帰分析」に進みました。
データにはばらつきがありますが、誤差が最小になるように線を引くことができれば、「横軸のある値(説明変数)のとき、縦軸はどんな値(目的変数)になるか」を予測できます。
これを「回帰直線」と言います。
上の画像では、赤い線とその周りのピンクの部分が「回帰直線」です。
6 | 時空を超えたデータ |
---|
「アヤメの品種」のデータを使って、ヒートマップを作ったりしました。
「アヤメの品種」データは、イギリスの統計学者だった ロナルド・フィッシャー博士 が1936年に発表した有名なデータです。
今では Python の
- scikit-learn ライブラリ(機械学習)
- seaborn ライブラリ
にフィッシャー博士が集めたデータが保存されており、世界中どこからでも活用することができるようになりました。
データの発表からおよそ100年。
研究者とエンジニアの弛まぬ努力により、フィッシャー博士の「アヤメの品種」データは時空を超えたのです。
2023年の今、極東の日本のおばちゃんが「アヤメの品種」データを、コンピュータのプログラミングの勉強のために使っていると知ったら、天国のフィッシャー博士もビックリだと思います(笑)
「アヤメの品種」データを使って、Python で色んなグラフを作ってみました。
わずかな行の簡単なコードで、これだけたくさんの分析が行えるなんて、Python は本当に素晴らしいですね😊️
7 | とにかく前に❗ |
---|
これで、『Python 2年生 データ分析』も終了となりました。
よくわからないところがあったので『Python 2年生 データ分析』をもう1周するか、次の『Python 2年生 デスクトップアプリ開発のしくみ』に進むか悩ましいところですが…。
とにかく前に進みたいと思います😃❗
最後までお読みいただき、ありがとうございました😄
また来てね~😄👋