すーぱーSEへの道 -42ページ目

データウェアハウス2

そういや書いてませんでしたが、自分が扱っているのは信販会社のDWHです。

信販会社ということで、取り扱っている主なデータは

・カード会員情報
・カード利用履歴
・入金情報
・督促情報

といったところになります。


実際は営業店別の集計データとか、督促状態別のデータとか、
各種マスタとかイロイロあるので、DBに持っているテーブル数としては
数百あります。


で、この大別した4つの情報を組み合わせて分析しただけでも、
いろいろわかるわけですよ。


30万円の羽毛布団をクレジットで買ってる(買わされた?)人の
年齢帯だとか、借りたお金を返さない人の地域別の割合とか、
出そうと思えばそんなのも出てくるわけです。


まぁ実際の業務ではそんなふざけた切り口の分析はしませんけど。


では、どう使うかというと、実際仕事として分析する場合は、
新規の申し込みに対して、カードを発行するかどうかを判断したり、
顧客ごとのカードの利用限度額を決めたりするときに使うわけです。


カードの申し込み時の場合を例に挙げると。。。

まず、年齢・性別・職業・年収・住居(賃貸or持ち家)・他社ローン有無
などなど、様々な申し込み情報を元に、今回申し込んだお客さんを
パターン化します。

次に、今までに蓄積した過去のデータにおいて、
そのパターンの顧客の動向がどうだったかを調査します。

で、その結果がよろしくない場合は『ゴメンナサイ』という結果を
出すわけです。(実際にはもっとイロイロ調べます)


数千万件単位の顧客データがあると、お金を返せなくなる人の傾向
とかっていうのは出て来るみたいで、申し込み時点である程度の
危険予測は可能になるんですよね。


だから、カードの申し込みではじかれたからといって、本人に問題が
あるとは一概にはいえず、それまでに申し込んだ同様の属性を持つ人
たちの素行が悪かったってこともありえるわけです。

Java資格(SJC-P)について


【SJC-P】Sun Certified Programmer for the Java Platform

Javaの包括的な知識から、プログラムの作成まで、他言語での経験はあるが、オブジェクト指向プログラミング言語の経験がなく、アプリケーションをJavaに移植ないし、Javaを守備範囲に加えたいと思っているプログラマの向けの試験。


<取得に要する期間>1~2ヶ月
<難易度>受かるだけなら低い、満足行く点数を目指すと結構高い

Javaの資格をとるということになると、まず目指すことになるのがこの試験。
Sunの認定試験にはいくつか区分があるのだけど、これをとらないと受験資格がもらえないものもあるので、普通はこれを受けることになると思います。

実際業務でJavaを使うことになれば、EclipseとかJavacでコンパイルエラーをはじいてくれるので、細かい知識なんか要らないとは思うのだけど、この試験ではそういうトコまで問われます。


受験勉強をしてて思ったのは、業務でJavaを使いこなしているからといって予備知識なしで受けると、結構厳しいものがあるんじゃないかなってことです。合格基準が51%とかなり低いので、受かるだけならそれなりの勉強でいけるけど、ちょっと恥ずかしい感じなので、できれば7割くらいは取っておきたいところです。

『括弧対応が取れてないからコンパイルエラー』とか、そういったレベルの問題も出てくるので、集中して受験しないと取りこぼす可能性もあります。試験当日に体調を万全にしておくことも、この試験にとっては必要になってくるでしょう。


自分が何冊も参考書や問題集を買った結果、一番役に立った書籍は以下の二点です。

Sunテキスト Sun Certified Programmer for the Java2
Sunテキスト Sun Certified Programmer for the Java2問題集


とりあえず、この2冊をみっちりやっておけば7割は取れると思います。
ほかにも何冊か買ってみたけど、SJC-Pに関してはこれが最適でした。

あと、意外と役に立つのが2chのSJC-P対策スレッド。
受験前にはとてもお世話になりました。。。

データウェアハウス

いま自分が担当してる業務の主な部分が
データウェアハウス構築(以下DWH)というもの。


最近はサーバの性能やディスクの容量が上がってきたので、
今まで捨てていたようなデータも保存しておけるようになってきました。

ちなみに、ウェアハウスってのは倉庫という意味なので、
DWHとはデータの倉庫ということになります。

日々の売上データとか、入金データとかそういったものを時系列で
保存して、いろいろな分析に使うために蓄えておく仕組みのことです。


うちのDWHシステムは比較的大規模で、顧客データが数千万件、
売上データが数億件保存されてます。

で、ユーザ向けにデータを加工したり、Webサービスでデータを
提供したりといったシステムを日々開発してるわけです。


これだけのデータが集まると、有効に使うことで顧客の購買パターン
とかを分析することが可能になってきます。今までの過去データを
もとに、これから先の未来に向けての施策を立てることが
できたりするわけです。


また、データマイニングと呼ばれる手法を
使うことで、『金曜日はビールと紙おむつを同時に買う顧客が多い』
というような、一見関連のなさそうな組み合わせなどを発見すること
なんかもあります。


これからどんどん技術的にも膨らんでいく分野だと思うんで、
作業しててもなかなか興味深いことが多いです。


でも不満がひとつ。

だんだんデータが増えてきて、今のバージョンのデータベース
システムだと不具合が多くなってきてしまったのです。

早く最新のデータベースに代えてくれないかな。。。


ほかにもこんな感じの業務担当してる人がいたら
話を聞いてみたいかも。

出発はCOBOLerから。。。

IT業界を目指してる人なら、COBOLって言う言語のこと、
聞いたことぐらいはありますよね。基本情報処理の午後試験
とかでも選択できるし。


とはいえ、『古臭い言語だしC#とかJavaとか言ってる時代に、
COBOLなんかつかわねーよ』って思ってる人が多いんじゃないかな。


実際のとこ、銀行とか信販とか保険とかの基幹系システムって、
今でもバリバリCOBOLがメイン言語なんですよね。

だから、就職する会社によっては入社してからずーーーーーーーっと
COBOL漬けの日々を送らされる新人君なんかもいるわけです。


専門学校とかで、VBとかCとかJavaをバリバリ学んで、
『即戦力です!』って顔で張り切ってやって来たのに、
配属初日から緑一色のコンソール画面とにらめっこしながら
[IDENTIFICATION DIVISION]だの[PICTURE]だの、
オブジェクト指向のかけらもないような原始的な言語を
学ばされるなんて気の毒以外の何者でもないです。


でも、新人の配属なんてのはそんなもので、上の人間や人事担当は、
あんまり効果的な人員配置をしてくれないんですよね。


自分の場合も、入社してから4年くらいはCOBOLオンリー。

通ってた専門学校が、何を思ったか3年間もCOBOLの授業を
カリキュラムに組んでてくれたおかげで助かりましたけど。


というわけで、IT企業に就職しようとしてる人は、
かじる程度でもいいからCOBOLとかの旧言語も学んどいたほうが
いいと思います、ホントに。

なにを書くのか

流行に遅れることこの上なしだけど、
ブログというものをはじめてやってみる。。。

とあるIT関連企業に就職して8年目になるけど、
そろそろ身の振り方をいろいろ考える年になってきた。

SEに興味があってこの業界に入ろうと思ってる人とか、
この業界に入って2~3年くらいの人向けに、自分の経験から
役に立ちそうなことをつらつら書いてみようかと思ってます。


最近は、ベンダー資格とかを集めだしたから、
受験対策とか紹介するのもいいかもね。

あとは、この業界の現状とか、うちの職場の状況とかを
いろいろと書く予定。

というわけで、よろしくおねがいします。