文字コードの種類
WEBサイトを制作するときに、必ず文字コードを指定します。最近では『UTF-8』が多いですが、他にも『Shift_JIS』や『EUC-JP』などがあります。
文字コード
パソコンを含めコンピュータは計算機なので数値(整数)のみです。文字を扱うことは元々できないです。一つ一つの文字に番号を割り振って管理しています。
Shift_JISコード
マイクロソフトによって開発された文字コードになります。現在パソコンで使われている漢字コードはこのコードになります。WindowsだけではなくMac
OSや一部のLinuxでも使われています。WEB制作においては昔は文字コードに『Shift_JIS』と書いていました。最近ではUTF-8が多いです。
古い携帯電話などは『Shift_JIS』しか使えないため、現在でも携帯サイトでは『Shift_JIS』が使われています。
EUC-JP(Extended UNIX Code)
PHPなどのプログラムを使うとき、『Shift_JIS』で書くと文字化けを起こす事がありました。これは『Shift_JIS』の問題でもありました。PHPやPearlなどのプログラムを作るときは『EUC-JP』を使っていました。
この文字コードは主にUNIX(サーバーなど)で使用されている文字コードになります。日本語の他にも『中国語EUC』、『韓国EUC』というのがあります。日本語EUCの事をUJIS(Unixized JIS)ともよびます。
UTF-8
現在多くのサイトで使われている文字コードになります。特徴は『世界の主な言語を1つの文字コードで表す』ことになります。WEBサイトも現在はこの『UTF-8』で構築されていることが多いです。HTML5はデフォルトでこの文字コードを使用しています。
また、Linuxなどでも標準で使われている文字コードになります。システムなどの親和性が高いです
文字化けの問題
WEBサーバーで『EUC-JP』が使われていると、プログラムも『euc-jp』にしないと文字化けを起こします。単純に文字コードが違うため文字の解釈が違うためです。そのため、静的ページは『Shift_JIS』でプログラムファイルは『euc-jp』が多いです。現在はWEBサーバーでもプログラムでも静的ページでも『UTF-8』を使われています。
文字コードで『UTF-8』にしなくても文字化けをしないのは、Apacheの設定でデフォルトの文字コードの指定がされていないからになります。Apacheでデフォルトの文字コードを指定しているばあいは指定されている文字コード以外は全て文字化けします。
また、文字化けの原因にあるのは『ファイルの保存形式』にもあります。例えば、htmlで文字コードを『utf-8』にしても、そのファイルを保存するときに『utf-8』以外にしていると文字化けが起きます。
この場合はファイルを一度テキストエディタで開いて文字コードを『UTF-8』にして保存しなおせばいいです。
まとめ
WEBサイトをつくるさい、文字コードはデザインとは特に関係ないのでどの文字コードを使っても問題ないです。最近ではDreamWeaverやホームページビルダーなども『UTF-8』がデフォルトで設定されているのでデフォルトの『UTF-8』でいいんじゃないかなとおもいます。
個人支援・寄付について
サイトラボでは個人支援・寄付を受けております。ご協力いただける方はお願いいたします。当サイトではビットコインで受け付けております。
- ビットコイン:3LHnADwZwUbic2L45EnVJEykiG6KfbqrwS