代表値として述べるべきもの | 統計解析道具箱~はじめての統計分析~

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics

t検定分散分析を用いてグループ間の差を調べる場合に、量的変数の代表値として
利用されるのは平均値標準偏差(SD)ですが、この際「量的変数は正規分布にしたがう
ことが前提となっていることに注意をしなければなりません。

「量的変数が正規分布にしたがうといえない」場合には、ノンパラメトリック検定を用いてグループ間の差を調べます。
対応のない2グループ間の検定では「マンホイットニー検定
対応のある2グループ間の検定では「ウィルコクソン検定
といった具合です。

このとき注意をしなければならないのは、論文などに代表値として記載すべき統計量は、 平均値と標準偏差(SD)ではないという点です。

ノンパラメトリック検定は、ランクに変換された数値を用いて計算されており、もはや平均値を見ていません。グラフについても同様で、ノンパラメトリック検定によって差を検出した場合は、 エラーバー(平均値の95%信頼区間)によって、表現することは適切とはいえないでしょう。

ノンパラメトリック検定で差の分析を行った場合は、中央値と四分位範囲(IQR)によって報告すべきです。
いずれも、データを大きさの順番で並べ替えたランクデータを対象にしている統計量です。

このように、ノンパラメトリック検定を適用すると、平均値に言及できないという制限が加わることもおさえておくべきポイントでしょう。