教師あり学習の一つである「決定木(decision tree)」は特徴量の内容をもとにひたすら条件分岐を繰り返します。重要なのは「どういう条件で分岐させたらよいか」という分岐条件の選び方です。それを機械学習の力で最適な条件を調べ、決定木を作成します。

 

 「max_depth」は決定木の深さの最大値を指定するものです。深さというのは第何階層までフローチャートを作成するかということです。深い方が正解率は増加します。「random_state」には0以上の整数を指定して、乱数を固定します。

 

 

 もともと用意していたデータのうち3割をテストデータに、残りを訓練データに分割します。分割する理由は割愛します。簡単に言うと、練習と同じ問題をテストで出すと、実力以上の結果になってしまうからです。

 

 

 学習させるfitメソッドに訓練データ、正解率を求めるscoreメソッドにテストデータを渡します。

 

 

 このモデルを保存します。「pickle」はPyhtonに組み込まれた標準ライブラリです。ファイルを確認するとちゃんと保存されています。

 

  まだこの後には決定木の図の作成などすることはいろいろありますが、一応これで決定木モデルは完成です。