文字コードって、ホント、分からないんです。
ウェブページをHDDに保存しておく際、どのような形式がいいのか考えているんですけど、文字コードの問題でつまずいちゃって……。
例えば、Wikipedia のページを保存する場合について。
IEでページを保存する時、デフォルトのエンコードは Unicode(UTF-8) になっています。
これを、そのまま Unicode(UTF-8) で保存した場合と、日本語(シフトJIS)で保存した場合では、次のように結果が異なります。
【Unicode(UTF-8) 】
・ファイルの種類を「Webページ、完全」で保存。
IE、Word等で表示(HTML表示)。
→正しく読める。
・ファイルの種類を「Webページ、完全」で保存。
メモ帳で表示(ソース表示)
→正しく読める。
・ファイルの種類を「テキストファイル」で保存。
→化ける。
【シフトJIS】
・ファイルの種類を「Webページ、完全」で保存。
IE、Word等で表示(HTML表示)。
→正しく読める。
・ファイルの種類を「Webページ、完全」で保存。
メモ帳で表示(ソース表示)
→正しく読める。
・ファイルの種類を「テキストファイル」で保存。
→正しく読める。
どうして、上の赤文字部分のような相違が生じるのでしょうか?
また、上記の問題を考えると、やはり、ウェブページをHDDに保存するにはシフトJISが適当なのでしょうか?
お分かりの方、ご意見下さい。
