「グローバル」って何? | SPSS備忘録

「グローバル」って何?

Clementineのノードの中に、「グローバル」という名前のノードがあることには皆さん気づいていると思われますが、これの使い方を知らない人は結構いるのでは?と個人的に予想しております。


ノード

一般的な報告書とかをみると、項目の下に「小計」とか「合計」といった全体をまとめた値がつくと思われます。Excelのレポートはそういったものが多いでしょう。しかしSPSSなど統計ソフトではデータに入力するのはケースサンプルのみで、合計などのデータ全体の統計値をケースサンプルと同様に入力しません。


しかし、データ加工などにおいて、「合計に対する割合を返したい」ですとか「平均値で穴埋めしたい」など統計値を用いたい場合も出てきます。さきほどの報告書ですと、表の下の欄に書いておけばいいですが、統計ソフトの場合はどこでこの値を持っておこうか?となります。


この役割を果たすのが「グローバル値」です。データ全体の統計値を算出し、別枠で持っておき、必要なときに引っ張り出します。


統計値を使いたいノードの前に「グローバル」ノードを設置し、統計値を出したいフィールドを指定します。このダイアログの[実行]ボタンを実行すると、チェックの入った統計値をストリームが保持します。


グローバルノードのダイアログ


計算した値はどこにあるかというと、Clementineの下のほうにある[...]ボタンをクリックし、[グローバル]タブをクリックしますと、確認できます。


これがグローバル値

この「グローバル値」はCLEM式で「@GLOBAL」から始まる関数を用いることでストリームに呼び出すことが出来ます。CLEM関数式を用いてデータ加工に活用しましょう(画像では「"年齢"が平均以上のレコードを抽出」しております)。


CLEM式で活用