数量化Ⅰ類は、林知己夫博士によって生み出された日本独自の分析手法であるにもかかわらず、ご存じでない方も多いと思います。
また知っていても、「数量化Ⅰ類=ダミー変数を用いた重回帰分析」という認識の人が多いのではないでしょうか。
実は私もそう思っていましたが、それだけでは数量化Ⅰ類を理解したことにはならないと思います。
今回、『Evaluation No.75(5月30日発売予定)』(プログレス)に掲載予定の「数量化Ⅰ類で理解する取引事例比較法-土地価格比準表を作成しよう-」の執筆時点では私自身が整理できていなかったことを以下で補足しておこうと思います。
(次の2文は、『社会と調査』9号(社会調査協会)特集:数量化の現在 からの引用です。)
今日、数量化理論とは、林知己夫博士によって開発された質的(カテゴリカル)データの分析のための4種、あるいは6種の記述的多変量データ解析の方法群を指すと考えられている。これらの方法は、ダミー変数を用いる重回帰分析や、多重対応分析のような諸方法によって、すでに乗り越えらたかのような議論も耳にすることがある。しかしながら、林博士の本来の意図は、社会調査が対象とする本質的にあいまいな現象に対して、どのようにアプローチするかという包括的方法論と、その支えとなる思想の構築にあった(冒頭文)。
数量化Ⅰ類、Ⅱ類は、アルゴリズムとしては完全に質的(分類)データにダミー変数を用いた重回帰分析と判別分析で代用できる(林文「数量化理論による分析方法の利用の視点から」)。
要するに、数量化Ⅰ類は、計算方法としては、ダミー変数を用いた重回帰分析で代用できるが、数量化理論の理念、林博士がそれを生み出された背景、意図などを考慮すると、単に「重回帰分析といっしょ。」で片づけてしまわれては困る、ということだと思います。
アルゴリズム(計算手順)の違いのみに焦点を絞ると、フリーソフトC.Analysisの数量化Ⅰ類メニューで、(1)「カテゴリウェイト」から「基準化ウェイト」を算定するのが数量化Ⅰ類で、(2)「重回帰ウェイト」から「基準化ウェイト」を算定するのが重回帰分析による代用ということになります。
両者は 、答(基準化ウェイト)を導く計算手順が違うだけということですが、文献によって、(1)の流儀による説明のものと、(2)の流儀によるものとがありますので注意してください。
このことを事前に知らないと初学者は混乱しやすいと思います(私のことです。)。
と言っても、これだけ読んでも何が何だか分からないと思いますので、ぜひ上記雑誌を書店で手に取り、私の文章を読んでみてください。
その後、もう一度この文章を読み返していただければ、理解の一助になるかもしれません。
よろしくお願いします。