データウェアハウス
いま自分が担当してる業務の主な部分が
データウェアハウス構築(以下DWH)というもの。
最近はサーバの性能やディスクの容量が上がってきたので、
今まで捨てていたようなデータも保存しておけるようになってきました。
ちなみに、ウェアハウスってのは倉庫という意味なので、
DWHとはデータの倉庫ということになります。
日々の売上データとか、入金データとかそういったものを時系列で
保存して、いろいろな分析に使うために蓄えておく仕組みのことです。
うちのDWHシステムは比較的大規模で、顧客データが数千万件、
売上データが数億件保存されてます。
で、ユーザ向けにデータを加工したり、Webサービスでデータを
提供したりといったシステムを日々開発してるわけです。
これだけのデータが集まると、有効に使うことで顧客の購買パターン
とかを分析することが可能になってきます。今までの過去データを
もとに、これから先の未来に向けての施策を立てることが
できたりするわけです。
また、データマイニングと呼ばれる手法を
使うことで、『金曜日はビールと紙おむつを同時に買う顧客が多い』
というような、一見関連のなさそうな組み合わせなどを発見すること
なんかもあります。
これからどんどん技術的にも膨らんでいく分野だと思うんで、
作業しててもなかなか興味深いことが多いです。
でも不満がひとつ。
だんだんデータが増えてきて、今のバージョンのデータベース
システムだと不具合が多くなってきてしまったのです。
早く最新のデータベースに代えてくれないかな。。。
ほかにもこんな感じの業務担当してる人がいたら
話を聞いてみたいかも。
データウェアハウス構築(以下DWH)というもの。
最近はサーバの性能やディスクの容量が上がってきたので、
今まで捨てていたようなデータも保存しておけるようになってきました。
ちなみに、ウェアハウスってのは倉庫という意味なので、
DWHとはデータの倉庫ということになります。
日々の売上データとか、入金データとかそういったものを時系列で
保存して、いろいろな分析に使うために蓄えておく仕組みのことです。
うちのDWHシステムは比較的大規模で、顧客データが数千万件、
売上データが数億件保存されてます。
で、ユーザ向けにデータを加工したり、Webサービスでデータを
提供したりといったシステムを日々開発してるわけです。
これだけのデータが集まると、有効に使うことで顧客の購買パターン
とかを分析することが可能になってきます。今までの過去データを
もとに、これから先の未来に向けての施策を立てることが
できたりするわけです。
また、データマイニングと呼ばれる手法を
使うことで、『金曜日はビールと紙おむつを同時に買う顧客が多い』
というような、一見関連のなさそうな組み合わせなどを発見すること
なんかもあります。
これからどんどん技術的にも膨らんでいく分野だと思うんで、
作業しててもなかなか興味深いことが多いです。
でも不満がひとつ。
だんだんデータが増えてきて、今のバージョンのデータベース
システムだと不具合が多くなってきてしまったのです。
早く最新のデータベースに代えてくれないかな。。。
ほかにもこんな感じの業務担当してる人がいたら
話を聞いてみたいかも。