SPSSの各ソフトは今日の時点でExcel2007未対応
今年はマイクロソフト からWindows Vista がリリースされましたが、前後してOffice2007 もリリースされました。
このOffice2007に対して、実は基礎部分の開発は2006年に完了していたSPSS15.0、AMOS7.0、Clementine11.0は未だ対応していないようです。
何が問題になりそうかというと、圧縮されたXMLファイルベースになった新しいExcelのファイルフォーマット「*.xlsx」をSPSS社の各ソフトは取り扱えませんので、何も考えずにExcel2007で生成したファイルをSPSS社の各ソフトは読めないということになります(Excel2007はもちろん旧フォーマットに対応しているので、SPSSやClementineで作成したファイルをExcelが読む分には問題ありません)。SPSS社の各ソフトで利用する場合はExcelは「*.xls」フォーマットで利用しましょう。それ以外のファイルフォーマットはOffice2007のものでも問題ないと思われます。
まあ、Excel2007のほうがあとということでしたら仕方がありませんね。次期バージョンには対応していただきたいものです。
コマンドでライセンス認証
現在のSPSS社のソフトは「ライセンス認証ウィザード」というもので、紙で渡される「ライセンス認証コード」とコンピュータで生成される「Lock Code」を元にライセンス認証をすることによって、ライセンスコード(?)というものが生成され、これをコンピュータに設定することで使用できるようになっております。認証はSPSS社の管理するサーバーで行われ、状況を記録されております。
このライセンス認証は「ライセンス認証ウィザード」を使わないで認証する方法があると聞き、SPSS Inc.のKnowledgebase で探しましたところ、Resolution number: 56400 というのがそれに該当するようです。
1. Windowsのコマンドプロンプトを起動し、cdコマンドでSPSSをインストールしたディレクトリ(初期設定を変更していなければ「C:\Program Files\SPSS\」。SPSS以外のソフトの場合はそのソフトのディレクトリに読み替えてください。)に移動します(例「cd C:\Program Files\SPSS\」)。
2.移動したこのディレクトリにspssactivator.exeというプログラムがあり、20桁のライセンス認証コードとともに以下のコマンドで実行します。
spssactivator 認証コード1(存在すれば続けて)[:認証コード2:...:認証コードN] [proxy-userid] [proxy-password]
<例>
spssactivator abcdef1234abcdef1234 1234abcdef1234abcdef joesmith pass1234
通常は「spssactivator 認証コード1」部分だけでよいでしょう。認証コードが複数あれば続けて入力してください。プロキシサーバーがネットワーク上に存在するようでしたら、そのIDとパスワードを入力して通過することが出来るそうです(プロキシサーバーがらみのエラー対策にも使えるということでしょうか)。
この機能を応用して、
cd C:\Program Files\SPSS\
spssactivator abcdef1234abcdef1234
部分をテキストエディタで書いて拡張子「*.bat」で保存し、これを複数のパソコンに設置してバッチファイルとして実行すれば、複数台まとめて自動でインターネットによる認証を行うことが可能でしょうね。
ノンパラメトリックってなに?
知人がノンパラメトリック検定ってやつ(「・・・ってやつ」って・・・)が出来ないという話をしてきました。ちょっとみて5秒で出来ない理由がわかりました。
SPSSのメニュー[分析]→[ノンパラメトリック検定]からノンパラメトリック検定ができるのですが、難しくなく表現するためにシンプルに説明すると、何をやるかは「ノンパラメトリック」という言葉のとおりです。
「ノンパラメトリック」は「パラメトリックではない」ということです。パラメトリックとは大雑把に言うと数値(連続数・スケール変数)です。数値から平均や分散などに加工して取り扱う分析で、t検定とか分散分析とかがパラメトリック検定と言えます。
ノンパラメトリックは、数値ではないカテゴリ値を扱う分析で、値の出現度数を分析します。カイ2乗検定が初学者にとって有名ですが、それと似たような分析になります。
カテゴリ値とは文字値だけではなく、数字のカテゴリも含まれます。だからSPSSの設定ダイアログ上では文字型変数だけでなく数値変数も投入できます。そうです、この知人は数値変数をダイアログに投入してノンパラメトリック検定の何かを実施しましたが、「1から5の選択肢」の変数ではなく「1.00から5.00までの測定値」だったため、値を平均にまとめず別々に扱ったため組み合わせが膨大になり、メモリエラーになっていたという次第です。
各種ノンパラメトリック検定に投入する変数に実数測定値の変数を投入は出来ても、実際はそういう手法ではないのでご注意ください。