みなさま、こんばんわ🌜

大阪は今日も日差しの強い真夏日でした😅

 
1 Python 2年生 データ分析 3日目

本日は『Python 2年生 データ分析』の3日目の学習日でした。

 

今日は

  • 5章「正規分布」
  • 6章「回帰分析」

を学習しました。

 

今回も前回に引き続いて、Jupyter Notebook を使います。

2 正規分布

「分散」や「標準偏差」など、統計の基本中の基本からスタートしました。

 

統計は通信制大学(心理学)でも学んだ領域なので、懐かしいです。

 

なぜこんな統計の基礎から学び直しをしているのかというと、本によると、この本は「データ分析」の本なので、データを分析できるようになることが目的だから、とのことでした。

3 標準偏差のグラフ

本に沿って、データの「標準偏差」をグラフにしてみました。

 

数字を入れれば「標準偏差」を計算してくれて、グラフにしてくれる機能は便利ですね❗

 

アドリブで範囲を示す破線を入れてみましたが、本の141ページに書かれてあった矢印を表示することはできませんでした。

やり方は書いてなかったんですけども…。

 

テキストをそのまま写経することはできても、アレンジしようとすると、途端に詰まってしまいます😅

4 ゴルトンボードのシュミレーション

「ゴルドンボードのシュミレーション」のコードを、そのまま写経してみました。

 

ゴルドンボードは、ボールが上から落ちてきて、下の仕切りにたまっていくゲームです。

ボールがどこに落ちるかは、計算することができます。

 

同じような単純な計算を何回もするので、「ニューラルネットワークにちょっと似ているな」と思いました。

5 回帰分析

続いて、6章の「回帰分析」に進みました。

 

データにはばらつきがありますが、誤差が最小になるように線を引くことができれば、「横軸のある値(説明変数)のとき、縦軸はどんな値(目的変数)になるか」を予測できます。

 

これを「回帰直線」と言います。

 

上の画像では、赤い線とその周りのピンクの部分が「回帰直線」です。

6 時空を超えたデータ

「アヤメの品種」のデータを使って、ヒートマップを作ったりしました。

 

「アヤメの品種」データは、イギリスの統計学者だった ロナルド・フィッシャー博士 が1936年に発表した有名なデータです。

 

今では Python の

  • scikit-learn ライブラリ(機械学習)
  • seaborn ライブラリ

にフィッシャー博士が集めたデータが保存されており、世界中どこからでも活用することができるようになりました。

 

データの発表からおよそ100年。

研究者とエンジニアの弛まぬ努力により、フィッシャー博士の「アヤメの品種」データは時空を超えたのです。

 

2023年の今、極東の日本のおばちゃんが「アヤメの品種」データを、コンピュータのプログラミングの勉強のために使っていると知ったら、天国のフィッシャー博士もビックリだと思います(笑)

 

 

「アヤメの品種」データを使って、Python で色んなグラフを作ってみました。

 

わずかな行の簡単なコードで、これだけたくさんの分析が行えるなんて、Python は本当に素晴らしいですね😊️

7 とにかく前に❗
 

これで、『Python 2年生 データ分析』も終了となりました。

 

よくわからないところがあったので『Python 2年生 データ分析』をもう1周するか、次の『Python 2年生 デスクトップアプリ開発のしくみ』に進むか悩ましいところですが…。

 

とにかく前に進みたいと思います😃❗

 

最後までお読みいただき、ありがとうございました😄

また来てね~😄👋