Pythonでファイルの文字コードを変換する | 病棟薬剤師&DIやん

病棟薬剤師&DIやん

医療従事者の方々向けに書いています。非医療従事者の方々はここに書いてある情報を鵜呑みにせず、必ずかかりつけ医・薬剤師等にご相談ください。

MEDIS↓や

 

診療報酬情報提供サービス↓が提供している医薬品マスタ。

 

いずれも文字コードがsjisのCSVファイルです。

 

これをUTF-8に変換するために、

今までは

1.エディタソフトでCSVを開く

2.文字コードをUTF-8に指定して上書き保存

 

という手順でやっていましたが、

Pythonで自動化することにしました。

 

↓以下のスクリプトと同じ場所に、medis_sjis.csvファイルがあるとします。

import pandas as pd
df = pd.read_csv('medis_sjis.csv',encoding='cp932')
df.to_csv('medis_utf8.csv', encoding='utf_8_sig', index=False)


これを実行することで、

同じ場所にmedis_utf8.csvファイルが生成されます。

 

ファイルの数が増えれば増えるほど、

この自動化のメリットが生きます!