ホームページを自分で作成し編集するときに、HTMLファイルなどに使用する文字コードを「Shift-JIS」とするか「UTF-8」とするか迷いますね。
文字コードは、コンピュータ上で扱う文字に与えられた番号のことで、全ての文字情報に対して数値を与えています。
問題は、この文字コードがいくつもあって、正しく Webブラウザなどが認識しないと「文字化け」してしまうようなことが起きます。
よく使用される代表的な文字コードは以下の 4つでしょう:
- JIS
- Shift_JIS
- EUC(EUC_JP)
- Unicode(特に UTF-8)
「JIS」は日本工業規格が定めた文字コードで、ASCIIコード(半角英数字)、ひらがな、漢字、カタカナなどを含みます。
JISは、電子メールを日本語で送受信する際の標準規格となっています。
「Shift_JIS」は Microsoft社が開発した文字コードで、ASCIIコードの文字に日本語を追加した文字コードです。
JISコードの改良版とも言え、特に Windowsでの標準文字コードなどで多用されています。
「EUC_JP」は日本語UNIXが使用している文字コードです。
主に UNIX系のOSで日本語表示したい場合に利用されます。
「Unicode」は別名「符号文字集合体」とも呼ばれ、世界中の言語や記号などにコード番号を指定して利用しやすくしたものです。
Unicodeの中にはいくつか種類があり、特に UTF-8 という文字コードがよく利用されています。
さて、日本語 HTMLファイルなど Webの世界では「Shift-JIS」か「UTF-8」かいずれかを使用する流れが一般的です。
そして、現在ではその 9割を超えて「UTF-8」が使われているそうです。
上記したように Windows PCを使い、テキストエディタで HTMLファイルを作成すると、標準では「Shift-JIS」が使われてきましたが、基本的に 2バイトで表現できる漢字や記号には数に限りがあります。
そのため「環境依存文字」などの文字は表現できず文字化けすることになります。
その点、「UTF-8」で記述すれば、どの国の文字でも対応でき、どの PC環境でも読むことが可能になります。
現在多用されている「HTML5」でも文書で使う文字のエンコーディングとして、UTF-8 を用いる事が推奨されています。
こういった流れも手伝って「UTF-8」が多く使われるようになっています。
ただし「Shift-JIS」を使ってはいけないということではありません。
Webの世界に限らず、文字コードはその発展と共に変遷が繰り返されてきました。
過去に作成された Webページにも「Shift-JIS」を使って書かれたものも現在も表示されております。
でも、これから HTML、CSSファイルなどをコーディングするなら「UTF-8」を利用したほうがよいでしょうね。