統計解析道具箱~はじめての統計分析~ -11ページ目

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics


重回帰分析を実行して、得られた回帰式がどれくらいデータに適合しているかを知る指標として
R2乗があります。これは、決定係数とよばれたり、適合度とよばれたり、寄与率と呼ばれたりしますが、
普通、R2乗と表現すれば、回帰分析をやっている方ならすぐに分かります。


R2乗は、データ全体の散らばりと(平均値と観測値の分散)、予測値の散らばり(回帰式上の予測値と
平均値の分散)の比をとったもので、0から1の範囲をとる数値です。

R2乗が1(=100%)になるということは、得られた回帰式によってデータの散らばりの100%が説明できることを
意味し、回帰式が完全に適合していると判断されます。
これは、回帰式の直線上にすべての観測値が乗ってくる状態ですが、一般のデータでR2乗が1になるケースは
ほぼ皆無です。

したがって、R2乗が1に近いほど、データに対して高い適合度を示す回帰式である、と解釈して使います。
逆に0に近いほど、あてはまりがよくない回帰式であるということです。

さて、気になるのはいくつくらいのR2乗を目安にすればよいか、ということですが、これは残念ながら目安は
ありません。なぜなら、研究の分野によって、または研究の興味や事前の仮説や知見によって、
いくつくらいの適合度が求められるかが異なるからです。

例えば、0.8のR2乗が得られても「適合度が低い」と判断されることもありますし、0.4くらいのR2乗でも
目的やデータによっては「適合度が高い」と判断されることもあります。

複数の独立変数の組み合わせを試行してみて、もっともR2乗の高い回帰式が、一番適合度がよい、
と判断すればよいでしょう。

なお、一般論にすぎませんが、分析を行う場合は、データの半分以上の現象を説明しようとしますので、
R2乗も0.5以上を目安にしてみる、という方法もあるかもしれません。


因子分析について説明された入門書です。
これから因子分析を勉強しようと思っている方(または泣く泣く勉強しなければならない方)は
迷わずこの書籍を購入または、友達に借りて読みましょう。

はじめて因子分析をされる方を対象にした、簡易で簡潔な説明が施されており、内容が比較的
スムーズに脳内に流れ込んでくるでしょう。実際はSPSSなどを使って解析する手順や出力される
アウトプットのどこをど読めばよいか、などが書かれており、実践的な内容にもなっています。

最後についているFAQも参考になって便利です。

誰も教えてくれなかった因子分析―数式が絶対に出てこない因子分析入門/松尾 太加志
¥2,625
Amazon.co.jp



統計の初歩の初歩を説明した本。とはいえ、基礎がばっちりと抑えられる良書。
統計とは? 平均値とは? 散らばりとは? 仮説検定とは? カイ2条検定とは? といった
基礎分析において重要となるトピックが簡単で優れた練習問題とともに学習できます。
最後は、相関係数と回帰直線まで取り扱っています。

ExcelやSPSSなどのアプリケーションの操作説明は一切ありませんが、統計の基本が
分かりやすく噛み砕かれ、かつ易しすぎず間違い・誤解のないよう説明されていて、
入門書として大変すぐれていると思います。

はじめての統計学/鳥居 泰彦
¥2,345
Amazon.co.jp