MEDIS↓や
診療報酬情報提供サービス↓が提供している医薬品マスタ。
いずれも文字コードがsjisのCSVファイルです。
これをUTF-8に変換するために、
今までは
1.エディタソフトでCSVを開く
2.文字コードをUTF-8に指定して上書き保存
という手順でやっていましたが、
Pythonで自動化することにしました。
↓以下のスクリプトと同じ場所に、medis_sjis.csvファイルがあるとします。
import pandas as pd
df = pd.read_csv('medis_sjis.csv',encoding='cp932')
df.to_csv('medis_utf8.csv', encoding='utf_8_sig', index=False)
これを実行することで、
同じ場所にmedis_utf8.csvファイルが生成されます。
ファイルの数が増えれば増えるほど、
この自動化のメリットが生きます!