SPSSによるファイルの結合 | SPSS備忘録

SPSSによるファイルの結合

7月17日の記事 の最後でSPSSについて触れましたので、本日はSPSSのメニュー[データ]→[ファイルの結合]→[変数の追加]機能です。


まずこの機能には前提条件があり、キー変数はあらかじめソート(順番に並び替え)をしてある必要があります。順番に並んでいない場合は変数を右クリックして[昇順に並べ替え]をクリックしてソートしてから保存しておきます。またClementineでは元データのフォーマットはテキストでもデータベースでもSPSSでも何でもよいのですが、SPSSでは必ずどちらのデータもSPSSの「*.sav」ファイルに保存済みでなければなりません。


並び替え

今回はこのふたつのデータを結合して違いを比較します。これも7月17日の記事同様、わからない人はいくら言葉を連ねても理解できないので、小さなデータでイメージを覚えた方がよいです。


データ

SPSSのメニュー[データ]→[ファイルの結合]→[変数の追加]を選択します。ここで「横の結合」をする[変数の追加]ではなく[ケースの追加]を選ぶと、同じ変数名のデータをケースの末端に追加させる「縦の結合」をおこないます。


変数の追加

[変数の追加先]で結合させるデータを選択します。既にデータを開いていれば[開いているデータセット]、開いていなければ[外部SPSSデータセット]からデータを選択します。


変数の追加先

[変数の追加]ダイアログにて[キー変数によるケースの結合]にチェックをし、[除外された変数]にあるキー変数を右下の[キー変数]に移動します。結合後に残る変数は[キー変数]と[新しいアクティブデータセット]の変数です。不要な変数は[除外された変数]に移動します。


変数の追加

[両方のファイルがケースを提供]を選んで[OK]で実行すると、以下のように結合元、結合先の双方のキー変数に値がある結合できるケースのみが結合されて残ります。


両方のファイルがケースを提供

[アクティブでないデータセットが検索テーブル]を選んで[OK]で実行すると、以下のように結合元のケースはすべて残り、結合先のキー変数に値がある結合できるケースにはデータが結合されます。


アクティブでないデータセットが検索テーブル

[アクティブなデータセットが検索テーブル]を選んで[OK]で実行すると、以下のように結合先のケースはすべて残り、結合元のキー変数に値がある結合できるケースにはデータが結合されます。


アクティブなデータセットが検索テーブル