ダミー変数は、
カテゴリーを示すデータを統計処理する際に
使用される変数。

例えば、配偶者の有無とか業種といったデータが、
他のデータとどう関係するかといった分析を
数式を使って行う際に使われる。

配偶者の有無を含むデータを収集したとき、
配偶者の有無について、
有を1、無しを0(逆でもよい)とすることで、
分析のための数式に適用できるようになる。

「有」「無」というデータではなく、
0と1のデータとしたものをダミー変数と呼ぶ。

PythonのライブラリPandasには、
カテゴリーで示されるデータを
ダミー変数にするpandas.get_dummies()という
メソッドがある。