
はじめに
テキストファイルやCSVファイルを開いたとき、意味不明な記号や文字が並んでしまう「文字化け」。
業務で扱うデータや、顧客リストを開いたときに文字化けしていると非常に困りますよね。
この記事では、文字化けが発生する主な原因と、すぐにできる対処法をわかりやすく解説します。
文字化けが起こる主な原因
(1) 文字コードの不一致
もっとも多い原因は、文字コードが一致していないことです。
文字コードは、コンピュータが文字(例:あ、A、1、@)をデータとして扱うための「番号付けルール」です。
代表的な文字コード
保存された文字コードと、開くソフトが想定する文字コードが異なると、文字化けが起きます。
作成時:ファイルが「Shift_JIS」で保存されている
閲覧時:アプリ(例:Notepad++)が「UTF-8」として読み込む
このとき、
「0x82 0xA0」(Shift_JISで「あ」)→ UTF-8では「‚ 」と解釈されることで本来の日本語が、意味不明な記号やアルファベットに変換されてしまいます。
(2) 改行コードの違い
改行コードにもOSごとに違いがあります。
改行コードが合わないと、文字化けや1行に全データが並んでしまう現象が起きます。
(3) CSVの区切り文字の違い
CSVファイルはカンマ区切り(,)が一般的ですが、タブ区切り(TSV)やセミコロン区切りの場合もあります。
区切り文字が合わないと列がずれて見えたり、正しく表示されなかったりします。
(4) ソフトの自動判別ミス
メモ帳やExcelは文字コードを自動判別しますが、100%正確ではありません。
特にExcelはShift_JIS前提で開こうとするため、UTF-8のファイルで文字化けが起きやすいです。
文字化けの対処法
(1) 文字コードを確認・変換する
- Windowsメモ帳
「名前を付けて保存」時に文字コードを選択可能(UTF-8推奨)
サクラエディタやNotepad++を使えば、文字コードの確認・変換が簡単にできます
- Macの場合
TextEditやVS Codeで開き、UTF-8で再保存するのがおすすめです。
(2) Excelで正しく開く
ExcelでCSVを開くと文字化けする場合は、以下の手順で改善できます。
(3) 改行コードを変換する
サクラエディタやVS Codeには「改行コード変換」機能があります。
開いた後に、CR+LF(Windows)、LF(Mac/Linux)などへ変換して保存すれば解決することが多いです。
(4) 区切り文字を指定する
CSVを開くときに、区切り文字を明示的に設定すると文字化けや列ズレを防げます。
Excelのインポート画面で「カンマ」「タブ」「セミコロン」などを選べます。
Notepad++ で文字化けを直す手順
例として、Notepad++でエンコードを変更し文字化けを直す方法をご紹介したいと思います。
1. ファイルを開く
Notepad++ を起動し、メニューから「ファイル > 開く」を選択し、文字化けしているファイルを開きます。
2. 表示されている文字コードを確認
画面右下に現在の文字コード(例:UTF-8 や ANSI)が表示されています。
3. 正しい文字コードで再表示する
メニューから「エンコーディング(Encoding)」をクリックし、「文字コードを変換せずに表示(Character sets)」の中から、以下のいずれかを選択します。
apanese > Shift_JIS、または「Encode in Shift_JIS」
この操作により、文字化けしていた部分が正しく表示される可能性があります。
4. 必要に応じて UTF-8 に変換して保存
表示が正しくなったら、再度「エンコーディング」メニューを開き、「UTF-8 に変換(Convert to UTF-8)」を選択します。
「ファイル > 上書き保存」で保存します。
文字化けを防ぐためのポイント
まとめ
文字化けは「文字コードの不一致」が原因で起きることがほとんどです。
まずは文字コードを確認し、開くソフトの設定を合わせることで解決できます。
特にCSVファイルはExcelの自動判別ミスが多いため、「インポート機能」や「UTF-8で保存」を習慣にすることが大切です。