ここでは代表的な統計データの取り方、分析の仕方を公開したいと思います。
第一回は非常に便利なのですが、マイナーなメディアンについて解説します。
■メディアンとは
日本語で言うと「中央値」になります。
あるn個のデータを小さい順に並べた時に、中央に位置する値の事を指します。
nが奇数個の場合は、その中央に位置する値そのものがメディアンになります。
nが偶数個の場合は、中央に近い2つの値の平均がメディアンとなります。
また「外れ値(異常値)」の影響をほとんど受けないのも特徴です。
※「外れ値」については、次回解説します。
■どのような時に使うのか
データに偏りがあると認められる場合にはメディアンを使います。
一部のデータが極端に高い数字をだしている場合、標準偏差を用いるよりもデータの有効性があがります。
■具体的な使い方
ここにブリージング商店で商品を購入したことがある人の、購入合計金額表があったとします。
Aさん 25000円
Bさん 34000円
Cさん 12000円
Dさん 135000円
Eさん 7000円
STEP1 まずは購入金額の少ない順に並び替えます。
Eさん 7000円
Cさん 12000円
Aさん 25000円
Bさん 34000円
Dさん 135000円
STEP2 対象人数(n)は奇数なので、真ん中にいるAさんがメディアンになります。
解 メディアンは25000円
■データによっては平均値と同じになるんですけど・・・
はい。もちろん成り得ます。
例えばここに28歳の人が10人しかいない場合は、メディアンと平均値も28になります。
■つまり平均と何が違うの?
先程のデータに、1名だけ85歳の人がいたとします。
すると
平均値 ((9*28)+85)/10=33.7 平均値 33.7歳
メディアン 28 28 28 28 28 28 28 28 28 85 メディアン 28
正確なデータに近いのはメディアンになります。
データをつり上げている、またはつり下げている値がある場合にメディアンは使えることになります。
■具体的にメディアンが有効と思われる分野
・高級品から低価格のものまで幅広く扱っているショップ
・年収分析
・不動産物件
iPad 2 16GB Wi-Fiモデル ブラック MC769J/A