データウェアハウス | すーぱーSEへの道

データウェアハウス

いま自分が担当してる業務の主な部分が
データウェアハウス構築(以下DWH)というもの。


最近はサーバの性能やディスクの容量が上がってきたので、
今まで捨てていたようなデータも保存しておけるようになってきました。

ちなみに、ウェアハウスってのは倉庫という意味なので、
DWHとはデータの倉庫ということになります。

日々の売上データとか、入金データとかそういったものを時系列で
保存して、いろいろな分析に使うために蓄えておく仕組みのことです。


うちのDWHシステムは比較的大規模で、顧客データが数千万件、
売上データが数億件保存されてます。

で、ユーザ向けにデータを加工したり、Webサービスでデータを
提供したりといったシステムを日々開発してるわけです。


これだけのデータが集まると、有効に使うことで顧客の購買パターン
とかを分析することが可能になってきます。今までの過去データを
もとに、これから先の未来に向けての施策を立てることが
できたりするわけです。


また、データマイニングと呼ばれる手法を
使うことで、『金曜日はビールと紙おむつを同時に買う顧客が多い』
というような、一見関連のなさそうな組み合わせなどを発見すること
なんかもあります。


これからどんどん技術的にも膨らんでいく分野だと思うんで、
作業しててもなかなか興味深いことが多いです。


でも不満がひとつ。

だんだんデータが増えてきて、今のバージョンのデータベース
システムだと不具合が多くなってきてしまったのです。

早く最新のデータベースに代えてくれないかな。。。


ほかにもこんな感じの業務担当してる人がいたら
話を聞いてみたいかも。