皆さんごきげんよう![]()
今日も張り切ってデータサイエンスの勉強をしていきましょう![]()
今日のテーマは
95%信頼区間です![]()
95%信頼区間とはなんぞ???(^^;
ってフリーズした方は
私の仲間ですw
95%信頼区間???
知らないの?情弱乙wwwwwww
って思った人、
_,,;' '" '' ゛''" ゛' ';;,,
(rヽ,;''"""''゛゛゛'';, ノr)
,;'゛ i _ 、_ iヽ゛';, お前それサバンナでも同じ事言えんの?
,;'" ''| ヽ・〉 〈・ノ |゙゛ `';,
,;'' "| ▼ |゙゛ `';,
,;'' ヽ_人_ / ,;'_
/シ、 ヽ⌒⌒ / リ \
| "r,, `"'''゙´ ,,ミ゛ |
| リ、 ,リ |
| i ゛r、ノ,,r" i _|
| `ー――----┴ ⌒´ )
(ヽ ______ ,, _´)
(_⌒ ______ ,, ィ
丁 |
| |
ネタが古くてすいません・・・
まぁ何かと言うと
母集団の真の値(母平均等)が含まれることが、かなり確信 (confident) できる数値範囲のことである。例えば95%CIとは、繰り返し信頼区間を求めたときに95%の確率でこの範囲に真値が存在することを意味する
(Wikipediaより)
母集団から取り出した標本
その標本から逆に母集団を推定する際に
仮に100回試験をした場合、
100回中5回くらいは真値を含まないことがある、ということを意味する
といったかんじです(;^ω^)
私なりのかみ砕いた解説ですが
(いつも通りイメージの話しで統計学的に正しいかはお察し下さい。)
餃子の〇将の餃子を食べた際
工場で加工された餃子(母集団)を用いて
マニュアルに沿って店舗で調理(標本)
しているはずですが
5%くらいの確立で少し具の量が多い餃子や
少し具の少ない餃子、焼き時間が長い事や短い事
鉄板の温度の高低
など店の環境等による誤差が生じることもあるよね?
でもその餃子はマニュアルが想定している餃子とは少し異なるので
その5%の餃子をもって〇将の餃子である( ー`дー´)キリッ
とは語れないんじゃないの?
その5%の餃子の味や量はデータとして信頼できるの????
ちがうよね?
95%のほうで語ろうね
みたいなイメージで私はかみ砕きましたwwwwwww
(〇将は架空の飲食店で実際の会社を指すものではありません)
そしてその5%を正規分布で表すと
正規分布の両端の2.5%であり
右の2.5%と左の2.5%の合計5%といった形になります。
正規分布とは以前お話ししたように
データが平均値付近に集積するような分布
(平均値あたりが山になる分布)
なので両端の2.5%となればかなりの少数の異端な数字である事が
視覚的にも理解いただけるかな??と思います。
と長話は嫌われるので
いったんここで区切り
次回計算等のテクニカルな部分のお話を進めさせていただきます。
このブログは文系の
統計初学者が復習のアウトプットを兼ねて書いているブログです
間違えがあることがあると思いますが
ご指摘いただければ幸いです。