トレードシステムを作っていく上で一番大切なのはデータ分析だと思います。
そこで、Pythonを使ってデータ分析を行っていく場合の便利な道具について書いていこうと思います。
①numpy(ナムパイ)
②pandas(パンダス)
③matplotlib(マットプロットリブ)
④scikit-learn(サイキット・ラーン)
①numpy(ナムパイ)は、
大規模な多次元配列や行列の演算など、科学技術計算を効率的に行うことを可能とする便利な道具が詰まっているライブラリ※1です。
②pandas(パンダス)は、
データ分析を効率的に行うためのライブラリです。データの前処理に必須のアイテムです。
③matplotlib(マットプロットリブ)は、
「データの可視化」を効率的に行うためのライブラリです。
折れ線グラフからヒストグラムなど、様々なグラフを簡単に描写することが可能です。
④scikit-learn(サイキット・ラーン)は、
機械学習のためのライブラリです。線形回帰、SVM、K近傍法などの有名な機械学習手法を簡単に実装することができます。
これら4個のライブラリを使いこなせれば、相当高度なデータ分析や機械学習ができます。
慣れるまでは大変ですが、習得すれば自由自在にデータ分析をできるようになるので、非常に費用対効果が高いと思います。
私もじゃんじゃん使っていって、自由自在にデータ分析ができるようになりたいと思います。
ちなみに、Anacondaを利用した場合、最初からこれらのライブラリはインストールされています。その他の環境でも、pipなどを使えば簡単にインストールすることができます。
〜〜次回へ続く~~それぞれのライブラリの使い方も書いていくつもりです。
※1 ライブラリとは、他のプログラムから利用される前提で作られたプログラムのことです。必要に応じて拡張部品として使うことができる便利なものです。プログラミング言語の良し悪しはこのライブラリの豊富さで決まるといってもいいと思います。基本的に無料で提供されています。

