こんにちは、Excelパーソナルトレーナー 土谷です。 本日はデータクレンジング方法の6回目。以前ご紹介した下記14手順の内、手順4をご説明いたします。
1 クレンジングの対象、範囲を決定
2. 法人名の半角と全角を統一(JIS関数)
3. 冒頭、末尾のスペース、改行を削除(TRIM関数、CLEAN関数)
4. 法人格の表記揺れを解消(文字の置換)
5. 都道府県、市区町村の表記揺れを解消(フィルタリング)
6. (存在するのであれば)法人番号や企業コードで並び替えを実行
7. (存在するのであれば)法人番号や企業コードの一致するものを精査、名寄せ
8. 法人名、都道府県、市区町村で並び替えを実行
9. 法人名、都道府県、市区町村、その他の付帯情報で総合して精査、名寄せ
10. 都道府県、市区町村で並び替え
11. 都道府県、市区町村、丁目、番地、URL等その他の付帯情報から法人格未記載の情報を精査、名寄せ
12. 上記手順で不明なデータを記載者に直接確認
13. クレンジング不可能なデータの取り扱いを判断
14. 主キーを付与する
■手順4. 法人格の表記揺れを解消(文字の置換)
法人格の表記揺れの主原因の一つに法人略称の取り扱いが存在します。
法人略称の表記ルールは、下記の通り企業や行政によってやや異なる事があるため、
名寄せは略さず正式名称で行うことをお勧めします。
(例)法人略称一覧表:
・岐阜市:http://www.city.gifu.lg.jp/secure/13493/aitegata-houjin.pdf
・行田市:https://www.city.gyoda.lg.jp/12/03/10/documents/kosyouitiran.pdf
以下の手順では見やすくするため、住所情報等のD列~K列を非表示にしてご説明します。
また、前回に比べ法人データ数を増やしております。
(a)「法人名」記載列(今回はC列)を選択
※上記データはサンプルです。 実在の法人情報等とは関係ございません
(b)[「CTRL」キー +「H」キー]を押下し、「検索と置換」ウィンドウを表示
([「ホーム」タブ → 「検索と選択」ボタン → 「置換」ボタン]の順に押下しても同様のウィンドウを表示可能)
(c)「検索と置換」ウィンドウの「検索する文字列」に法人格略称を、「置換後の文字列」に法人格正式名称を記載(ここでは株式会社を一例として使用)
(d)「すべて置換(A)」ボタンを押下し、文字を置換
(e)手順(c)、(d)を繰り返し、全ての法人格略称を正式名称に変換[注1]、[注2]
(ここでは”(医)”を”医療法人”、"NPO法人"を"特定非営利活動法人"に置換)
(f)「検索と置換」ウィンドウを消して処理完了!!
上記手順の繰り返しは法人略称の種類が多いほど発生することになります。
まず岐阜市や行田市の例のような一覧表を独自に作成しておくと良いと思います。
また、このような名寄せが度々発生する場合、マクロファイルを作成しておき、自動化を行うことをお勧めします。
(VBAのサンプルコード及び使用方法は後日説明します)
これで法人格の表記ゆれを解消できました。
次回は「5. 都道府県、市区町村の表記揺れを解消(フィルタリング)」、
をご説明いたします。
[注1] : 岐阜市の一覧表の場合、 “(医)”の略称には4種(医療法人、医療法人社団、医療法人財団、社会医療法人)、“(大)”には2種(国立大学法人、公立大学法人)等、同じ略称内に数種類あるケースが存在します。
このことから正確には”正式名称群”と言うべきかもしれませんが、ここでは便宜上”正式名称”といたします。
[注2] : ”NPO法人”という法人格は正式には存在せず、”特定非営利活動法人”が正式名称となります。
簡単Excel集計にご興味のある方は、是非ともお問合せ下さい!
Excel集計のお悩み相談はこちらから
(1) 急に上司にデータを出せと言われて残業
(2) 単純業務に時間が多く取られる
(3) ミスが多くて怒られる
(4) もっと集計データを活用したい
特にこのようなお悩みをお持ちのあなたにお勧めです!
無料相談はこちらから





