分散分析とは、
母集団において平均値に差があるかどうかを調べる統計手法です。
平均値の差を調べる統計手法には、あまりにも有名なt検定がありますが、t検定の場合、比較できるグループ(水準ともいいます)は2つまでです。分散分析はこれを拡張し、一度に3つ以上のグループ(水準)を比較することができます。
平均値を代表値として使うということは、とりもなおさず対象となる変数はスケール変数(金額、血圧値、得点、測定値など)です。そして、それをグループ化する変数はカテゴリ変数(性別、年代、地域、病院など)です。このとき、カテゴリ変数を1つだけ使用する形を「一元配置分散分析」といいます。
1元配置分散分析で検定すべき帰無仮説は、以下です。
帰無仮説(H0):μ1=μ2=・・・=μk
対立仮説(H1):μ1≠μ3≠・・・=μk
μ(母平均)、k(k番目の変数)
仮説の形からわかりますが、この分析で検定されているのは、「すべてのグループの平均値が同じ」かどうかです。つまり、グループたった1つでも平均値が異なれば、有意になるのです。言い換えれば、平均値に有意な差があるとコメントできるときに、どのグループ間に差があるかはわからず、どこかに差があるということしかわからないのです。
そこで、具体的なグループ間の差を調べる場合は、多重比較(下位検定)にかけていきます。