皆さんごきげんよう![]()
何とかコロナの影響を受けながらも
リモートで授業再開されました![]()
それでは本日も張り切ってデータサイエンスを学んでいきましょう∩^ω^∩
本日の内容は
平均と中央値と標準偏差![]()
平均ってなんぞ??
って方は流石に少ないかとは思います![]()
おさらいですが、
合計÷(データの)個数
と、おそらく小学生??の時に学んだのかな?
と思います
これを少しイキった書き方をすると・・・
こうなります![]()
なぜ笑うんだい??
ここだけ写真でもいいじゃないか![]()
と、まぁ少し逸れましたが、
理解の上では小学校の時に習った合計÷(データ)個数
と同じ内容になります
計算する上での便宜上??
みたいにゴリゴリ文系の私は現状そう噛み砕いています笑
さて平均のおさらいはこのくらいにして
はて、標準偏差??🤔
となっている方も多いと思います。
偏差値という言葉を聞いたことがある方は大半だと思いますが
標準偏差とは何が違うの????
と感じるかもです・・・
標準偏差の内容をネタバレしてしまうと・・・・
分散をルートにしたもの ドヤァ
はい、
分散の説明がまだでした![]()
分散とは文字のイメージ通り
データの散らばりみたいなイメージです![]()
それをイキった書き方で表すと・・・
こんな感じになるんですね![]()
Sの二乗が分散を表す変数で
おなじみのシグマさんの存在感がなかなかイカチー公式ですね
何故二乗何だい??
と感じた方は私よりデータサイエンスのセンス抜群です・・・。
そう
この二乗をぶち壊す!!!(幻想殺し)
ためにルートに入れる
それが標準偏差の正体だったんです![]()
![]()
![]()
公式で表すと
安定のΣさんがイカチーですが、
本当に先程の分散をルートの箱に入れてるだけなんですよ![]()
あ、中央値の話し忘れてたw
まぁそのまま中央に居座っている値ですw
と真面目に説明しますと、
1、2、3、4、5
のデータのまんなかの数値は・・・・
3
ですよね??
なのでこの場合は中央値3
では
1、2、3、4、5、6
この場合は幾つでしょう????
真ん中の数字は3???4????
となりますよね
この場合は数学的お約束で
真ん中二つの平均が中央値となります!!!
なのでこの場合は3.5が答えです![]()
今回学んだ
平均、標準偏差、中央値は
今後の基礎になる部分ですので私もしっかりと抑えたいと思います”!
私自身も統計初学者なので間違い箇所などございましたら申し訳ございません
そして
ご指摘いただければ幸いでございます!


