クレンジングといってもメイク落しのことではありません。
データベースを解析するのには、今でこそ、マルチ検索DBなるテキストDBがあるために、売上階層のユニット化は無理ですが、何に相関があるかというのはすぐわかるようになりました。
しかしながら基礎統計上、ユニットを明確にしなければ組織や担当が成り立ちません。
だから商品データベース上のジャンル、要因(価格帯、テースト、マインド)などが非常に重要になります。
ところが分析を行うためのジャンル階層や要因定義をきっちり運用している企業は皆無です。
加工食品などはJAN-JICFSがあるのですが、ドラッグやエンタテインメント、飲食のメニューなどは、定義が不明確でバラバラです。
それを今、11,000もあるレコードをクレンジングしておりまして、ふぅ~っ。
これがね、また素人やバイトには任せられないんですよ。
人によって解釈が区々になることがあって、後で結局やり直ししなければならないのですね。
これをやらないとデータマイング上の課題や傾向が見つかりません。
データマイングの作業はこのデータークレンジングが80%ぐらいのウェイトを占めます。
もうね、肩凝って肩凝って・・・。
目の奥も画面を見すぎてゴロゴロしてて重痛~い。
はぁ~、ガンバロー。