こんにちは、Excelパーソナルトレーナー 土谷です。 本日はデータクレンジング方法の3回目。前回ご紹介した下記14手順の内、手順1をご説明いたします。
1. クレンジングの対象、範囲を決定
2. 法人名の半角と全角を統一(JIS関数)
3. 冒頭、末尾のスペースを削除(TRIM関数、CLEAN関数)
4. 法人名の表記揺れを解消(文字の置換)
5. 都道府県、市区町村の表記揺れを解消(フィルタリング)
6. (存在するのであれば)法人番号や企業コードで並び替えを実行
7. (存在するのであれば)法人番号や企業コードの一致するものを精査、名寄せ
8. 法人名、都道府県、市区町村で並び替えを実行
9. 法人名、都道府県、市区町村、その他の付帯情報で総合して精査、名寄せ
10. 都道府県、市区町村で並び替え
11. 都道府県、市区町村、丁目、番地、URL等その他の付帯情報から法人格未記載の情報を精査、名寄せ
12. 上記手順で不明なデータを記載者に直接確認
13. クレンジング不可能なデータの取り扱いを判断
14. 主キーを付与する
■手順1. クレンジングの対象、範囲を決定
※上記データはサンプルです。 実在の法人情報等とは関係ございません
※"□"は空白、"⏎"は改行を意味
上の画像のように、いくつもの項目に分割された企業データがあるとします。
まず、貴方の目的を考え、どの項目をクレンジングすれば良いのかを考えます。
もちろん全てのデータをクレンジングする事が出来ればベストです。
しかし、対象が増えるほどに必要な時間が増大します。
必要な範囲のみに絞るのが賢明です。
ここでは「法人名」、「住所」関連の4列を最初にクレンジングしてまいります。
次回は手順2. 法人名の半角と全角を統一(JIS関数)をご説明いたします。
簡単Excel集計にご興味のある方は、是非ともお問合せ下さい!
Excel集計のお悩み相談はこちらから
(1) 急に上司にデータを出せと言われて残業
(2) 単純業務に時間が多く取られる
(3) ミスが多くて怒られる
(4) もっと集計データを活用したい
特にこのようなお悩みをお持ちのあなたにお勧めです!
無料相談はこちらから
