R言語の分析手法 | ビッグデータとは何か

ビッグデータとは何か

最近話題のビッグデータについてわかりやすく解説します。

データ分析で必要なのが、分析ツールですね。

例えばアンケートの分析をしたいときに何を使って分析するのかということです。

Excel、SPSS、SAS、SPLUS、R言語など分析ツールが選択できます。

これからデータサイエンティストになりたいというなら、R言語くらいは覚えておいて損はないでしょう。

R言語というのは、統計解析、機械学習、データマイニングのためのプログラミング言語のことです。

SPSS、SAS、ExcelなどでR言語とのインターフェースを実装してきており、ビッグデータやデータ分析ではほぼデフォルトスタンダードになりつつあるので、学んでおいた方が良いでしょう。

R言語は、Windows、Linux、Mac OSなどで使うことが出来るので、PCからサーバインストール型にも対応しているのが便利です。

そしてR言語でできる分析手法には何があるのか?

予測に良く使うのが多変量解析です。

次によく聞くのが回帰分析です。

回帰分析には、線形回帰分析、ロジスティック回帰分析、決定木分析などがあります。

要約するときに使うのが主成分分析です。

これら以外の分析手法には、多次元尺度法、クラスタリング、k-means手法などもあります。