「正規表現 \s+」を覚える必要はありません。CSVをJSONに変換するスクリプトを書く必要もありません。Windows環境でClaude Codeに日本語で指示を出すだけで、テキスト整形の大部分は進みます――ただし「大部分」であって「全部」ではありません。どこまで頼むだけで済むのか、どこから人の目が必要になるのか、5つのStepで確かめます。
この記事で確かめること
テキスト整形とひと口に言っても幅があります。今回はWindows環境でClaude Codeに日本語で指示を出し、以下の5段階を順に検証します。
- 基本的なテキスト整形(空白削除・改行整理・全角半角変換)
- データ形式の変換(CSV、TSV、JSON、Markdown表)
- 複数ファイルの一括整形
- 日本語テキスト特有の整形(句読点・括弧や記号の前後空白)
- 修正指示による改善
「正規表現を覚えなくても、自然言語で頼むだけでどこまで片付くのか」を5つのStepで確かめます。すべてWindows 10/11前提です。
前提(始める前に)
この記事の内容を試すには、Windows 10または11でClaude Codeが使える状態が必要です。Claude Codeの導入方法そのものはこの記事では扱いません。
まだClaude Codeを入れていない場合は、導入手順の記事を先にどうぞ。今回の検証は、WindowsのターミナルからClaude Codeを起動して行いました(Claude Codeはターミナル以外の環境でも利用できますが、今回はこの方法で検証しています)。
なお、Claude Codeがファイルを編集したりコマンドを実行したりする際、設定によっては利用者の承認操作が必要になります。初めて使う場合は、画面に表示される確認プロンプトに応答しながら進めることになります。
検証には、意図的に汚したテストデータを使います。
- 全角と半角が混在した文字列(例:「ABCabc 123」)
- 改行がバラバラなコピペ文章
- カンマ区切りとタブ区切りが混ざった表データ
- 句読点が「、。」と「,.」で混在している日本語文章
こういうデータを用意しておけば、整形のBefore/Afterがはっきり分かります。手元に似たような汚いデータがあれば、それを読み込ませても構いません。
Step 1: 基本的なテキスト整形に頼んでみる
最初の依頼はシンプルなテキストのクリーンアップです。
ファイルに保存された汚いテキストを読み込ませて、余分な空白を削除し、改行を整理し、全角英数字を半角に統一するよう頼みました。
data/sample.txt を読んで、余分な空白を削除し、連続する改行を1つにまとめ、全角英数字を半角に変換して上書き保存して
結果はまずまずでした。余分な空白の削除と連続改行の圧縮は、今回の検証では正しく処理されました。全角英数字の半角変換も、アルファベットと数字については期待通りでした。
Before(一部抜粋):
CLAUDE Code で テキストを
整形する
実験です
After(同箇所):
CLAUDE Codeでテキストを
整形する
実験です
ただし全角カタカナの半角変換は落とし穴でした。依頼文で「カタカナはそのまま」と指定していなかったため、意図せず半角カタカナに変換されてしまいました。Claude Codeの判断としては間違いではありません。指示が甘かっただけです。
確認のポイント:
– 全角→半角の変換対象にカタカナを含めるかは、依頼時に明示すべき
– 変換後のファイルを開いて、視覚的に違和感がないか目で確認する
初心者ならここで止まりやすいポイントです。「全角を半角に」とだけ言うと、カタカナまで対象に入ってしまうことを予想しにくいからです。依頼文を少し丁寧に書けば防げる問題でした。
指示が明確なら、基本整形は1回の依頼で済んだ。変換対象の指定は人が明示すること。
Step 2: データ形式の変換を頼んでみる
次に、データ形式の変換です。Excelからコピペした表データを別の形式に変換する、実務でよくあるケースを考えました。
用意したのは、カンマ区切り(CSV)の顧客データです。これをMarkdown表に変換するよう頼みました。
data/customers.csv を読んで、Markdownの表形式に変換して data/customers.md に保存して
列の数と内容は変換前後で一致していました。ヘッダー行もMarkdownの表記法に合っており、セル内のカンマも適切に処理されていました。
Before(CSV):
名前,年齢,備考
田中太郎,30,東京在住
佐藤花子,,
After(Markdown表):
| 名前 | 年齢 | 備考 |
| --- | --- | --- |
| 田中太郎 | 30 | 東京在住 |
| 佐藤花子 | | |
次に逆方向も試しました。Markdown表からJSONへの変換です。
data/customers.md の表を読んで、JSON配列形式に変換して data/customers.json に保存して
こちらも、概ね変換されました。ただし、元のCSVにあった空のセルの扱いがポイントです。JSONでは null と空文字列 "" のどちらにするかの選択があり、今回は null が入りました。データの使われ方によっては空文字列の方が都合が良いケースもあるため、ここは要確認です。
押さえておきたい点:
– 列の数が変換前後で一致しているか
– 空セルの扱い(nullか空文字か)が意図通りか
– 文字コードがUTF-8で保存されているか
形式変換は1回の依頼で済んだ。気になるのは空セルの扱いと文字コードくらいで、それ以外は特に手直しが不要だった。
Step 3: 複数ファイルの一括整形を頼んでみる
ここから少し実務寄りの検証です。ディレクトリ内にある複数のテキストファイルを一括で整形できるかを試します。
data/ フォルダに5つのテキストファイルを置き、すべてのファイルに対して同じ処理を頼みました。
data/ フォルダ内のすべての .txt ファイルに対して、行末の空白を削除し、タブをスペース2つに変換し、最後に空行を削除して、それぞれ上書き保存して
5つすべてのファイルが処理され、指定した3つの整形内容は各ファイルに反映されていました。
次に、もっと複雑な条件を試します。「特定のパターンに一致する行だけを書き換える」という処理を、正規表現を使わずに自然言語で指示できるか。
data/ フォルダの各ファイルで、「TODO:」で始まる行の先頭に「[未]」を付けて
これも今回のケースでは正しく処理されました。「TODO:で始まる行」という自然言語の指定で伝わりました。正規表現を知らなくても、やりたいことを言葉で伝えれば動く——そんな感触でした。
もっとも、ファイル数が数十〜数百になると、すべての結果を目視で確認するのは現実的ではありません。サンプリングして数ファイルを確認するか、処理前後の差分を一覧で出力させるよう頼むと良いです。
なお、こうした一括処理はルールが固定されているなら、スクリプトや専用ツールの方が向いています。自然言語での依頼が活きるのは、「このファイルだけ例外扱いして」のように、条件がその場で変わる場面です。
気をつけたいこと:
– 処理対象のファイルが漏れなく含まれているか
– 処理後のファイルに意図しない変更がないか
– 大量ファイルの場合は、サンプリングでの確認手法を考える
一括処理も条件指定も自然言語で動いた。ただしルール固定の定型処理なら、専用ツールの方が向く場面もある。
Step 4: 日本語テキスト特有の整形を頼んでみる
日本語のテキスト整形は、英語中心のツールや単純な置換では扱いにくい領域です。Claude Codeが日本語の文脈をどこまで理解して整形できるかを確かめます。
まず句読点の統一です。「、。」と「,.」が混在している文章を「、。」に統一するよう頼みました。
data/japanese.txt の句読点をすべて「、」「。」に統一して保存して
基本的な句読点の置換は完了しました。文末の「.」や途中の「,」が「。」と「、」に変換されていました。
Before:
近年,AIの進化は著しい.特に自然言語処理の分野では,多くの成果が報告されている.
After:
近年、AIの進化は著しい。特に自然言語処理の分野では、多くの成果が報告されている。
次に、括弧や記号の前後にある不要な空白を整理するよう頼みました。日本語文章では、全角括弧の前後にスペースが紛れ込むことがあります。
data/japanese.txt で、全角括弧「」『』の前後にある半角スペースを削除して。また、句点「。」の後にある不要な半角スペースも削除して
ここは少し微妙でした。単独の括弧や句点の前後空白は削除されました。ただし、括弧が入れ子になっている部分(「『〜』の中に」のような箇所)では、内側の括弧の前の空白が残るケースがありました。
日本語の文脈判断が必要な整形は、まだ人が確認する余地が大きい領域です。
見落としがちな点:
– 句読点の変換漏れがないか
– 括弧の入れ子など、複雑な構造で空白が残っていないか
– 意図的に入れている空白まで削除されていないか
句読点の統一自体は1回でできた。括弧周りの空白は、入れ子構造のせいで取りきれず、Step 5で改めて直すことになった。
Step 5: 修正指示で改善する
どの段階でも、一発で完璧とは限りません。ここではStep 4で残った括弧周辺の空白を、修正指示で直せるかを試します。
Step 4の結果を確認したあと、次のような修正指示を出しました。
「『〜』の中に」のような入れ子の括弧の前後にも空白が残っているので、それらも削除して
指摘した箇所は直りました。ただし別の場所で、丸括弧( )の前後に空白が残っていることに気づきました。Step 4の依頼文では「」と『』を指定していましたが、丸括弧のことは書いていなかったため、そのまま残っていたのです。追加で修正指示を出しました。
丸括弧( )の前後の空白も削除して
2回目の修正で、テストデータ内の括弧周辺の空白は一通り整理されました。初回依頼から修正指示2回を合わせて計3回のやり取りで、望む結果に到達しました。
一発ではうまくいかなかった点:
– 「」『』だけを指定していて、丸括弧( )が漏れていた
– 括弧の種類をまとめて指定していなかったのが原因
– 修正指示で埋められるが、何が漏れているかに気づくのは人の役割
修正指示を出せば確実に改善に向かう。ただし指定の漏れに気づくのは人の役割で、そこは自動化の範囲外。
どこまで頼むだけでできた?
5つのStepを通じて分かったことを整理します。
頼むだけでできたこと:
– 余分な空白の削除、連続改行の圧縮
– 全角英数字→半角への変換(カタカナを除く指定があれば)
– CSV、TSV、JSON、Markdown表の相互変換
– 複数ファイルへの同一ルールの一括適用
– 正規表現を使わない自然言語による条件指定(「TODO:で始まる行」など)
– 日本語の句読点統一
頼むだけでは到達しなかったこと:
– 日本語の構造判断を要する整形(括弧の入れ子など)の初回での完璧な処理
– 処理結果の全件自動検証(サンプリング確認が必要)
– 大量ファイルの整形結果の全件品質保証
– 対象の指定漏れ(括弧の種類など)の自動補完
人が確認・修正すべきだったこと:
– 全角→半角の変換対象の明示的な指定
– データ変換時の空セルの扱い(nullか空文字か)
– 日本語テキストの括弧周辺の通読確認
– 処理後のファイルの文字コード確認
– 大量ファイルのサンプリングによる品質確認
今回の検証全体でのやり取り回数は、5つのStepと修正指示を合わせて計8回でした。
振り返り
Claude Codeに頼むだけでテキスト整形の大部分は進みました。
基本的な整形(空白・改行・全角半角)とデータ形式の変換は、依頼文を丁寧に書けば1回で期待に近い結果が出ます。複数ファイルへの一括処理も、自然言語の条件指定で機能しました。ただし日本語テキストの構造に依存する処理は、現状では人の目による確認が必須です。
Step 1〜3(基本整形とデータ変換)は、Windows環境でClaude Codeが動いていればすぐ試せます。Step 4の日本語テキスト整形は、結果の良し悪しを判断するための知識が必要になるため、少しハードルが上がります。
頼むだけでここまでは進められた。ただし最後は人が確認する、というのが今回の結論です。
次に試すなら
テキスト整形ができることが分かったので、次はもう少し応用範囲を広げてみると良いです。
たとえば、整形したデータをWordPressに投稿するMarkdownの生成や、ログファイルからの特定パターンの抽出、HTMLファイルのタグ整理などが考えられます。どれも「自然言語で指示する」という同じアプローチで進められます。
テキスト整形以外にも、Claude Codeに頼むだけでどこまでできるかを検証した記事を他にも用意しています。興味があれば併せてどうぞ。
コツを一つだけ。頼むときは「何を」「どうしてほしいか」を具体的に書くほど、結果が安定します。「適当に整形して」より「空白を削除して、全角英数を半角にして」と指示する方が、意図通りに進みやすいです。
テキスト整形以外にも、下書き作成やタイトル案、カテゴリ整理など、ブログ運営で役立つ場面をまとめて知りたい場合は、Claude Codeでブログ運営を効率化する記事まとめを参考にしてください。
まとめ
空白削除・改行整理・全角半角変換のような基本整形は、自然言語の指示だけでかなり良い結果が出ます。CSVやJSONの形式変換、複数ファイルへの一括処理も同様です。
ただし「全部」ではありません。日本語テキストの構造判断を要する整形や、大量ファイルの最終品質確認は、今のところ人の目が必要です。また、ルールが決まっている定型処理を何度も繰り返すなら、専用ツールやスクリプトを用意した方が確実な場面もあります。
正規表現を覚えなくても、スクリプトを書かなくても、日本語で「どうしてほしいか」を伝えるだけでここまでは進められました。最後は人が確認する、という境界線を意識しておけば、テキスト整形の負担は大きく減らせるはずです。







