皆さんごきげんようニヒヒ

 

何とかコロナの影響を受けながらも

リモートで授業再開されましたルンルン

 

 

それでは本日も張り切ってデータサイエンスを学んでいきましょう∩^ω^∩

 

 

本日の内容は

 

 

キラキラ平均と中央値と標準偏差キラキラ

 

平均ってなんぞ??

って方は流石に少ないかとは思いますタラー

 

 

おさらいですが、

合計÷(データの)個数

と、おそらく小学生??の時に学んだのかな?

と思います

 

 

これを少しイキった書き方をすると・・・

 

 

  

 

 

こうなりますキラキラ

 

 

なぜ笑うんだい??

 

ここだけ写真でもいいじゃないかアセアセ

 

 

 

と、まぁ少し逸れましたが、

理解の上では小学校の時に習った合計÷(データ)個数

と同じ内容になります

 

 

計算する上での便宜上??

みたいにゴリゴリ文系の私は現状そう噛み砕いています笑

 

 

 

 

さて平均のおさらいはこのくらいにして

 

 

 

 

はて、標準偏差??🤔

 

 

 

となっている方も多いと思います。

 

偏差値という言葉を聞いたことがある方は大半だと思いますが

標準偏差とは何が違うの????

と感じるかもです・・・

 

 

標準偏差の内容をネタバレしてしまうと・・・・

 

 

 

 

分散をルートにしたもの ドヤ

 

はい、

分散の説明がまだでしたタラー

 

 

 

分散とは文字のイメージ通り

データの散らばりみたいなイメージです雷

 

 

それをイキった書き方で表すと・・・

 

 

 

 

 

 

 

 

こんな感じになるんですねキラキラ

 

 

Sの二乗が分散を表す変数で

おなじみのシグマさんの存在感がなかなかイカチー公式ですね

 

 

何故二乗何だい??

と感じた方は私よりデータサイエンスのセンス抜群です・・・。

 

 

そう

この二乗をぶち壊す!!!(幻想殺し)

ためにルートに入れる

 

それが標準偏差の正体だったんですキラキラキラキラキラキラ

 

 

 

公式で表すと

 

 

 

安定のΣさんがイカチーですが、

本当に先程の分散をルートの箱に入れてるだけなんですよプンプン

 

 

あ、中央値の話し忘れてたw

 

まぁそのまま中央に居座っている値ですw

 

 

 

 

と真面目に説明しますと、

 

1、2、3、4、5

 

のデータのまんなかの数値は・・・・

 

3

ですよね??

 

 

なのでこの場合は中央値3

 

 

 

では

 

 

1、2、3、4、5、6

 

 

この場合は幾つでしょう????

 

真ん中の数字は3???4????

 

 

 

となりますよね

 

この場合は数学的お約束で

 

 

真ん中二つの平均が中央値となります!!!

 

 

なのでこの場合は3.5が答えですニヤリ

 

 

 

今回学んだ

 

 

平均、標準偏差、中央値は

今後の基礎になる部分ですので私もしっかりと抑えたいと思います”!

 

 

 

 

私自身も統計初学者なので間違い箇所などございましたら申し訳ございません

そして

ご指摘いただければ幸いでございます!