データ分析で必要なのが、分析ツールですね。
例えばアンケートの分析をしたいときに何を使って分析するのかということです。
Excel、SPSS、SAS、SPLUS、R言語など分析ツールが選択できます。
これからデータサイエンティストになりたいというなら、R言語くらいは覚えておいて損はないでしょう。
R言語というのは、統計解析、機械学習、データマイニングのためのプログラミング言語のことです。
SPSS、SAS、ExcelなどでR言語とのインターフェースを実装してきており、ビッグデータやデータ分析ではほぼデフォルトスタンダードになりつつあるので、学んでおいた方が良いでしょう。
R言語は、Windows、Linux、Mac OSなどで使うことが出来るので、PCからサーバインストール型にも対応しているのが便利です。
そしてR言語でできる分析手法には何があるのか?
予測に良く使うのが多変量解析です。
次によく聞くのが回帰分析です。
回帰分析には、線形回帰分析、ロジスティック回帰分析、決定木分析などがあります。
要約するときに使うのが主成分分析です。
これら以外の分析手法には、多次元尺度法、クラスタリング、k-means手法などもあります。