セット型フィールドに設定できない | SPSS備忘録

セット型フィールドに設定できない

Clementineにデータを読み込ませ、カテゴリカルなフィールド(変数)にデータ型を「セット型」と指定して、この型設定をもとにモデル作成やグラフ作成、データ加工を行おうとしても、データ型設定のところでいくら操作してもデータ型が「不明」にされてしまうことがあります。


このフィールドは数百種類の値を持っておりませんでしょうか?。Clementineでは初期設定で250種類以上カテゴリのあるフィールドをセット型として認識せず、代わりに「不明」を設定します。この設定は簡単に解除でき、Clementineの画面の下部にある[...]ボタンをクリックし、[オプション]タブの[最大セットサイズ]の値を増やすか、チェックを外せばOKです。


最大セットサイズ


ただ、セット型に登場するカテゴリの数が多ければ多いほど、モデル作成の数式上でかけあわせる組み合わせが増えることになり、膨大なハードウェアリソースを必要とすることになります(実際に机上で数式にしてみると膨大さがわかります)。経験上現在のコンピュータシステムでは初期設定で指定されている250を越えるとかなりリソースが厳しく、実用的ではありません。


えっ?データマイニングなのに250アイテムしか扱えないの?とは思いますが、仕方がありません。出来る範囲で例えば大分類や中分類を用意して分析しましょう。