このブログは私の私による私のためのブログである。
今は誰かのためにということよりも備忘録とアウトプットのツールとしてここに書き記す。
SASも普段使うため、知り得た情報をここに残していきたい。
まず初めは尺度について。世の中には様々な数値があり、普段何気なく使っているが統計を学ぶ上でこの尺度という概念が頭にあると良い。なぜ良いのか?現時点でこれを説明できない私はまだまだである。いつかこの一文に二重線を引き、改定できることを夢見て勉強に勤しむばかりである。
名義尺度、順序尺度、比例尺度、間隔尺度の4つについて説明する。
- 名義尺度 他と区別するための尺度 男女、血液型
- 順序尺度 大小の順番に意味がある尺度 順位、大中小
- 間隔尺度 目盛りが等間隔で、数値が倍になっても倍になったと言えないもの 温度、西暦
- 比例尺度 0を基準とし、間隔と比率に意味があるもの 体重、身長
次に代表値について。たくさんの情報の中から統計を使って答えを導きたい時、何から手をつけて良いかわからなくなる。そんな時、代表値というものを見ることで何か別の視点が見えてくる。
- 平均値(算術平均値) データを足し合わせてその個数で割ったもの。全体の真ん中。重心。
- 中央値 データがn個ある場合、昇順(もしくは降順)に並べた時にn/2個目にある値。
- 最頻値 データの中で出現回数が最も多い値。
- 最大値 データの中で最も大きい値。
- 最小値 データの中で最も小さい値。
- 四分位数 すべてのデータを順番に並べた際に、25%、50%、75%の順番に属する値のこと。中央値は50%点の値。
- 分散 データ全体が平均からどれだけ散らばっているかを測る尺度。各データの値と全体の平均の差を2乗し、それらをすべて足し合わせたもの。平均から離れたデータが多いほど値は大きくなり、平均に近い値が多い場合は小さくなる。各データと平均の差を足し合わせたものは0と成ってしまうため2乗している。
- 標準偏差 分散に平方根をあてたもの。単位もデータと同じ。
ここで扱ったもの以外にもありますが、代表的なものをあげた。
初回はこんなところかなぁ。