統計解析道具箱~はじめての統計分析~ -5ページ目

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics

まず、基礎分析として、A群とB群それぞれの平均値や標準偏差を調べておく必要があります
また、最大値や最小値などに注目して、外れ値が存在しないかどうかも吟味しなくてはなりません。

Excel2007での基礎統計量の出力は以下の手順で行います。

1.「データ」メニューを選択します。
2.最右端に出てくる「データの分析」を選択します。
3.「基本統計量」を選択して、OKボタンをクリックします。


統計解析道具箱~はじめての統計分析~

4.入力元の入力範囲を選択します(B2:B31など、まずはA群のみ)
5.「統計情報」「平均値の信頼区間の出力」チェックボックスをオンにして、OKボタンをクリックします。
6.上記2~5の手順をB群に対しても実行します。


統計解析道具箱~はじめての統計分析~

上記の図は、それぞれの出力結果を並べて表示したものです(色の設定は後から変えています)。

この例では、

A群(平均値:67.43、標準偏差:2.15、最大値:89.44、最小値:44.40)
B群(平均値:75.32、標準偏差1.98、最大値:101.20、最小値:52.87)

となっています。注目すべきなのはまず第1に平均値です。
2つのグループの平均値は、約7.89なりB群の平均値のほうが高い数値になっています。

標準偏差は、2グループともほぼ同じです。

この7.89の平均値の違いは、標本平均値の違いです。
統計解析では母集団での違いに着目しますので、この差が有意差になるかどうかを調べるために
t検定を行います。




Excelを利用してt検定(対応のないサンプル )を実行してみます。
(この例ではExcel2007を利用します)
データは架空の練習用データで「AグループとBグループのある数値の比較分析」をします。

Excelには、以下のようにデータを入力します。
グループを記録した列と、数値を記録する列が必要です。
(以下の例では見やすいように色を塗り分けていますが、色の設定は分析には不要です)


統計解析道具箱-t-test1

サンプル数は、AグループとBグループでそれぞれ30です。
数値の平均値に有意な差が認められるかを、t検定で調べて見ます。

t検定を行う前に、数値が正規分布にしたがうといえるかAグループとBグループで散らばりが等しいといえる
などを評価しなくてはなりません。また、当然ですが、それぞれの平均値がいくつで、散らばりがどれくらいなのか、標本を調べる基礎分析が必要です。




比較の対象(3)対応のあるデータ

治療前と治療後における検査値の違い(例)
治療前と治療後のそれぞれの検査値(量的データ)に有意な差があるかどうかを調べます。
治療前と治療後の検査値の差が正規分布にしたがうことが仮定できればt検定を利用します。
対応のあるデータを利用する場合は、等分散性の仮定は問題とはなりません。
比較する対象は、治療前と治療後の検査値です。同じ人が両方のグループに所属することになり、ペアにして比較すべきデータとなります。

前期と後期の理解度の違い(例)
前期と後期のそれぞれの理解度(量的データ)に有意な差があるかどうかを調べます。
前期と後期の理解度の差が正規分布にしたがうことが仮定できればt検定を利用します。
対応のあるデータを利用する場合は、等分散性の仮定は問題とはなりません。
比較する対象は、前期と後期の学力です。同じ人が両方のグループに所属することになり、ペアにして比較すべきデータとなります。

右手と左手の握力の違い(例)
右手と左手のそれぞれの握力(量的データ)に有意な差があるかどうかを調べます。
右手と左手の握力の差が正規分布にしたがうことが仮定できればt検定を利用します。
対応のあるデータを利用する場合は、等分散性の仮定は問題とはなりません。
比較する対象は、右手と左手の握力です。同じ人が両方のグループに所属することになり、ペアにして比較すべきデータとなります。

このように、ペアにして比較するべきものは対応のあるデータとして処理します。