皆さんごきげんよう😝
今日も張り切ってデータサイエンスの学習しましょう😁
今日は前回さらっと説明した正規分布について
さらに進めていきたいと思います😆
まず今回の重要ポイントである標準化の説明からしていきたいと
思います
データを標準化すると、
統計学における平均と分散を考慮した数字の大きさを得ることができます。
と教科書通り説明するとこうなっちゃいますw
ざっくりイメージですが
様々なデータを見比べる時
数字のばらつき具合も様々異なってきて
一眼で数値の比較がしづらい・・・🥺ぴえん
と言った状況になった時のお助けツールが
標準化![]()
でございます
別名、基準化とも言います
さて次に
分散=0
平均=1
いきなりなんの数値かというと
分散=0
平均=1
の正規分布のことを標準正規分布と呼びます。
ざっくりいうと
様々な正規分布を
このシンプルで分かりやすそうな
標準正規分布さんパターンならどんな感じか
変換して
統一ルールで試合をさせ
データを比較しやすくするといったイメージです!
では皆さん
そんな魔法の方法知りたくなってきませんか??![]()
ここだけの話・・・・
あるんですよ
公式が![]()
ドーーーーーーーーーーーーン
ざわ・・ざわ・・・・・・・・ざわ・・・・
ざわ・・・・・・・ざわ・・・・・・・・・
ざわ・・ざわ・・・・ざわ・・・・・・・・
ざわ・・・・・・・・・・・・・・ざわ・・
何のっこっちゃねん!と思われた方々申し訳ございません
説明おろそかにしていました
Zで求められる数字を標準正規分布表という
偉ぁ〜〜〜い人が計算した表に当てはめるという
ポケモンでいうとこの
🍬ふしぎなあめ🍬
レベルのお助けアイテムを使えるようになります😉
残りの説明ですが
x=確率変数(身長の分布なら身長の値など)
μ=母平均(母集団の平均)
σ=標準偏差
これらのパーツを揃えてエグゾディア(Z値)
を召喚!!!!!!
エグゾディア(Z値)
の効果により
とある正規分布のとある値が
標準正規分布ではどんな値に相当するのか
が計算できるという
コナンくんもびっくりの推理力を発揮します![]()
エグゾディア(Z値)のおかげで
標準正規分布表から確率を読み取ることができ
標準正規分布での確率変数が分かります!
この
公式に当てはめて確率変数を求めることを
標準化と言います(伏線回収)
だから何やねんという話ですが
標準化することにより
ばらつき具合が違うデータでも
比較することができるのでデータ処理が
かなーーーーーり楽になります![]()
では次回は
今回の内容を深掘りしていきたいと思います![]()
このブログは文系の
統計初学者が復習のアウトプットを兼ねて書いているブログです
間違えがあることがあると思いますが
ご指摘いただければ幸いです。

