DevFormatLab

CSV クリーナー

整理 · UTF-8 ↔ Shift-JIS

重複・空行・余分な空白を取り除き、UTF-8 と Shift-JIS の間で変換できます。

5 → 3 行 (2 行を削除)
区切り文字を検出: ,
入力 CSV
整理後の CSV

プレビュー

先頭 50 行
nameagecity
田中30東京
佐藤25大阪

ファイルはローカルで読み込まれ、サーバーにはアップロードされません。

CSV クリーナーとは?

CSV クリーナーは、CSV エクスポートに含まれがちな典型的なノイズ — 結合クエリ由来の重複行、スプレッドシートのドラッグフィルが残した完全な空行、手入力で混入した余計な空白 — を除去し、文字コードを正規化してシステム間でファイルを安全に往復できるようにします。実務の現場では、生の CSV はそのままでは使いものになりません:パーサを混乱させる UTF-8 BOM、Windows 系の CRLF とむき出しの LF の混在、ある行は 2026/05/18 で次の行は 18-May-2026 という揺れた日付、そして最も厄介な — 実は Shift-JIS のバイトを誤って UTF-8 として開いた瞬間に発生する文字化け。優れた CSV クリーナーは、データがパイプラインに乗る前にこれらをまとめて片付けます。 DevFormatLab の CSV クリーナーは、現実の乱雑な入力のために作られ、日本のエコシステムに対するファーストクラスサポートを備えます:ファイルを開くと UTF-8・Shift-JIS・EUC-JP を自動判定し、保存時は UTF-8(BOM 付き/なし)または旧 Windows 版 Excel・会計システム・行政ポータル向けの Shift-JIS としてダウンロード可能。RFC 4180 準拠のパーサがカンマを含む引用フィールド、二重引用符のエスケープ、複数行にまたがる値を正しく扱います。クリーニングのトグル(重複除去・空行除去・セルトリム)はデータ全体に作用しますが、プレビューテーブルは 50 行に制限しているため 100 MB のファイルでもページは軽快なまま。すべての処理はブラウザの File API でローカル実行されます — アップロードなし、内容に対する分析なし、第三者サービスなし。HR エクスポート、顧客リスト、財務抽出データなど、外に出してはいけない CSV にも安心して使えます。

機能

  • 完全に一致する重複行を削除(正規化後にバイト一致)
  • ドラッグフィルが残した完全な空行を削除
  • 各セルの前後の空白をトリム
  • ファイル読み込み時に UTF-8 / Shift-JIS / EUC-JP を自動判定
  • UTF-8(BOM あり/なし)または Shift-JIS でダウンロード
  • RFC 4180 パーサ:引用フィールド・二重引用符・改行入りフィールド対応
  • 先頭 50 行のライブテーブルプレビュー(ソート可能)
  • 純粋なブラウザ File API — アップロードなし、機微データも安心

使い方

  1. 「ファイルを開く」でローカルの CSV を選択 — エンコーディングは先頭 4 KB から自動判定されますが、ドロップダウンで UTF-8 / Shift-JIS / EUC-JP を強制指定もできます。CSV テキストを直接貼り付けることも可能です。
  2. 実行したい整理オプションを ON:重複削除・空行削除・空白トリム。各トグルはプレビューだけでなくデータ全体に作用します。
  3. 右側のプレビューテーブルで結果を確認 — 表示は先頭 50 行ですが、上の行数カウンタが本当の総行数を示します。
  4. プレビューが文字化けしている場合はエンコーディングを手動で切り替え、日本語・中国語・韓国語が正しく表示されるエンコーディングに変えてから進めます。
  5. 「UTF-8(BOM 付き)でダウンロード」を選べば Windows 版 Excel でも文字化けせずダブルクリックで開けます。「Shift-JIS でダウンロード」はレガシーシステム向け。BOM なしの「UTF-8 でダウンロード」は Linux パイプライン・Google Sheets・モダンエディタ向け。

よくある質問

CSV ファイルはアップロードされますか?

いいえ。ファイルはブラウザの File API で読み込まれ、ローカルで処理されます。データはデバイスを離れません。

Shift-JIS とは?なぜ変換が必要?

Shift-JIS は日本のレガシー文字エンコーディングで、一部の会計システム・行政ポータル・日本語版 Excel for Windows などで現在も必要とされます。本ツールは表現可能な文字について UTF-8 ↔ Shift-JIS の無損変換を行います。

文字化けとは?

誤ったエンコーディングでバイト列を読み込むと文字が壊れて表示されます(例:Shift-JIS ファイルを UTF-8 として開く)。本ツールはソースのエンコーディングを自動検出してこれを防ぎます。

カンマを含む引用付きフィールドに対応していますか?

対応しています。パーサーは RFC 4180 に準拠しており、引用フィールド・エスケープされた引用符("")・フィールド内改行を正しく処理します。

Excel (.xlsx) ファイルは扱えますか?

直接は扱えません。Excel から CSV としてエクスポートしてください(ファイル → 名前を付けて保存 → CSV UTF-8 または CSV)。

関連ツール

Canonical: https://devformatlab.com/ja/csv-cleaner