文字コードの理解：UTF-8 vs ASCII 完全ガイド

なぜ文字化けが発生するのでしょうか？開発者が知っておくべきASCIIコードとUnicode（UTF-8）の違い、そして文字化けの原因を解説します。

こんにちは！Cheetsetです。

のような謎の記号や、文字化け（Mojibake）に遭遇したことはありませんか？

これは、コンピュータが文字を読み取る際のエンコーディング（Encoding）が間違っているために発生します。今日は文字コードの世界を深く掘り下げてみましょう。

1. ASCII: コンピュータ言語の始まり

初期のコンピュータは英語しか扱えませんでした。ASCIIは7ビットを使用して128文字（A-Z、0-9など）を表現します。

'A' = 65 (0x41)
'a' = 97 (0x61)
'0' = 48 (0x30)

すべての言語をサポートするためにUnicodeが作られました。世界中のすべての文字に固有の番号を割り当てます。例えば「あ」は U+3042 です。

UTF-8は、Unicodeを保存するための最も一般的な方法です。

日本の古いサイトではShift_JISが使われていましたが、現代の標準はUTF-8です。これらが混在すると文字化けが発生します。

💡 解決策

1. HTMLのheadタグに以下を追加してください：

<meta charset="UTF-8">

2. エディタでファイルを保存する際、エンコーディングがUTF-8であることを確認してください。

BOM (Byte Order Mark)は、ファイルの先頭にある見えないマーカーです。

Web開発では常にUTF-8を使用するようにしましょう！これが世界標準です。