ChatGPTでビッグデータを分析する方法:CSVからインサイトまでの実践ガイド

CSVを読ませるだけ AIが見つける売上法則
この記事は旧方針時代の内容です。現在は Claude Code 中心で検証・発信しています。 最新のClaude Code記事を読む →

売上データのCSVがある。「何か傾向がないか」は見たい。でも分析方法が分からないし、Pythonを学ぶ時間もない。そんな時に試せるのが、ChatGPTにデータを渡して「分析して」と頼むだけのアプローチです。Windows環境でその手順を1つずつ進めていきます。

目次

ここでやること

CSVやExcelのファイルが手元にある状態から、ChatGPTに読み込ませて傾向・グラフ・ビジネス上の気づきを引き出すまでを、番号順に進めていきます。

前提として、ブラウザ(EdgeかChrome)とChatGPTのアカウントがあれば始められます。プログラミングの知識は不要です。

具体的には次の流れで進めます。

  • データファイルをChatGPTが読みやすい形に整える
  • ChatGPTにアップロードして基本統計を確認する
  • グラフと傾向分析を頼む
  • 「だから何?」に答えるビジネスインサイトを引き出す
  • うまくいかない時の対処法と限界を押さえる

ChatGPTのデータ分析機能とは

ChatGPTには「Advanced Data Analysis」という機能が組み込まれています(以前はCode Interpreterと呼ばれていました)。これは、アップロードしたデータファイルをChatGPTが裏でPythonコードとして自動処理し、分析結果を返す仕組みです。

ユーザー側がコードを書く必要はありません。「このデータの月別売上推移をグラフにして」と頼めば、ChatGPTがコードを生成・実行してグラフ画像を返してくれます。

対応しているファイル形式はCSV、Excel(.xlsx)、JSON、PDF、Word文書など多数。最も使いやすいのはCSVとExcelです。

無料版のChatGPTでもデータ分析機能が使えます。ただし、Plus(有料版)の方が複雑な分析や大きなデータに強く、グラフの品質も安定しています。まずは無料版で試して、物足りなければPlusを検討するという進め方で問題ありません。

データサイズの目安:数MB程度のCSV(数千〜数万行)なら快適です。数十万行を超えるとタイムアウトの恐れがあります。

事前に必要なもの

始める前に、以下を用意してください。

  1. ChatGPTアカウント(無料版またはPlus)
  2. 分析したいデータファイル(CSVまたはExcel形式)
  3. ブラウザ(EdgeまたはChrome推奨。Windows環境)
  4. データの中身の確認(個人情報や機密情報が含まれていないか)

手元のデータそのままでもChatGPTは読んでくれますが、列名を整えておくと後の分析精度が段違いです。「列1」「列2」のままより「売上日」「商品名」「金額」になっていた方が、ChatGPTも意図を汲み取りやすくなります。ここをサボると後で苦労するので、最初に5分だけかけておくのがおすすめです。

4つ目について補足しておきます。ChatGPTに渡したデータはOpenAIのサーバーで一時的に処理されます。会話履歴に残る設定の場合、データの一部が保存される可能性があります。社内データや顧客情報を扱う場合は、事前に個人情報を削除・マスキングしておくことを推奨します。ここを飛ばすと後で取り返しがつかないので、必ず確認してください。

では、データの準備から始めます。

手順1:データファイルを準備する

ChatGPTが正しく読み取れるデータには、いくつかの基本ルールがあります。

1行目は列名(ヘッダー)にする

データの1行目には、その列が何を表しているかの名前を入れます。「売上日」「商品カテゴリ」「金額」のように、日本語でも英語でも構いません。

1行に1件のデータを入れる

1つのセルに複数の情報を詰め込まないようにします。「東京都新宿区」を「都道府県」「市区町村」の2列に分けておくと、後で地域別の集計が頼みやすくなります。

サンプルデータのイメージ

売上日 商品カテゴリ 金額
2025-01-15 食品 3200
2025-01-15 日用品 1500
2025-01-16 食品 2800

文字コードをUTF-8にする

Windowsユーザーならここでつまずきやすいポイントです。ExcelでCSVを保存すると、標準設定ではShift-JISという文字コードになります。ChatGPTはUTF-8が得意なので、このまま読み込ませると列名が「譁・險・荵・」のように文字化けし、分析結果がめちゃくちゃになります。

対処法は簡単です。保存したCSVをメモ帳で開き、「名前を付けて保存」を選択し、画面下部の「文字コード」を「UTF-8(BOM付き)」に変更して上書き保存してください。これで文字化けを防げます。

期待される結果:ChatGPTにアップロードした際、「このデータは〇〇行で、列は『売上日』『商品カテゴリ』『金額』の3列ですね」と正しく列名を読み取った応答が返ってくれば、準備完了です。

データがきれいに整ったら、ChatGPTに読み込ませましょう。

手順2:ChatGPTにデータを読み込ませる

ChatGPT(chatgpt.com)をブラウザで開き、新しいチャットを始めます。

ファイルをアップロードする

チャット入力欄の左側にある「+」ボタン(またはクリップアイコン)をクリックし、用意したCSVまたはExcelファイルを選択します。ファイルが添付された状態でプロンプトを入力できます。

最初のプロンプト例

このデータの概要を教えてください。列の内容と行数、基本的な統計(平均・最大・最小)も合わせてお願いします。

ChatGPTの応答例

アップロードが成功すると、ChatGPTは次のような応答を返します。

「このデータは100行で、列は『売上日』『商品カテゴリ』『金額』の3列です。金額の基本統計は以下の通りです:平均2,480円、最大12,000円、最小500円、中央値2,100円。商品カテゴリは食品、日用品、衣類の3種類が含まれています。」

このように列名・行数・基本統計が正しく報告されれば、データの読み込みは成功です。

もしChatGPTが列名を正しく認識しない場合、文字コードの問題である可能性が高いです。前の手順に戻ってUTF-8での保存を確認してください。

全体像がつかめたら、さっそく分析に取り掛かります。

手順3:基本的な分析を頼む

データの読み込みが確認できたら、具体的な分析を指示します。

要約統計量を取得する

各列の平均、中央値、最大値、最小値を表形式でまとめてください。

ChatGPTは表形式で各列の統計量を返します。出力イメージとしては、行に各列名(金額など)、列に平均・中央値・最大・最小が並んだ表が表示されます。

傾向分析を頼む

売上の月別推移を分析して、グラフで表示してください。

グラフ出力のイメージ

棒グラフまたは折れ線グラフが生成され、X軸に月(1月、2月…)、Y軸に売上合計金額が表示されます。グラフはPNG形式の画像としてチャット内に表示され、ダウンロード可能です。

ChatGPTが日付列を文字列と勘違いして、月別推移がバラバラの順番で出てくることがあります。そんな時は次のように追加で伝えてください。

売上日を日付型として扱って、月ごとに時系列順で集計して。

これだけで正しい順番に直ります。

さらに分析を広げる

商品カテゴリ別の売上構成比を円グラフで表示してください。

分析結果の数字は、ChatGPTが自信満々に出していても必ずExcelで照合してください。特に合計値と平均値は最初に手元で確認しておくと安心です。ChatGPTが「このデータの平均は〇〇円です」と言ったら、Excelでも同じ数式を叩いてみる癖をつけておくと、後々の信頼度が変わってきます。

基本的な傾向は見えました。でも「だから何?」に答えるにはどうすればいいでしょうか?

手順4:ビジネスインサイトを引き出す

グラフや統計量は出た。でも「で、このデータから何が言えるの?」に答えが出なければ分析の意味が薄いです。ここが一番の目的です。

インサイトを直接聞く

このデータから分かるビジネス上の気づきを5つ挙げてください。具体的な数字も添えて。

ChatGPTは箇条書きで次のようなインサイトを返します。

  • 「金曜日の売上が他の曜日より約40%高い。週末前の需要が集中している」
  • 「食品カテゴリが全体の売上の約60%を占めている。食品が牽引役」
  • 「月別で見ると3月に売上が急増している。年度末需要の可能性」
  • 「金額のばらつきが大きく、高額購入と低額購入の2極化が起きている」
  • 「日用品の売上は安定しているが食品は変動が大きい」

顧客セグメント分析を頼む

データから購買パターンを分類して、セグメントごとの特徴を教えてください。

異常値の検出

このデータに外れ値や異常なデータポイントがあれば指摘してください。

インサイトは一度で完璧に出るわけではありません。ChatGPTの回答を見て「もっとこの期間について深掘りして」「地域別でも見て」と追問することで、精度の高い分析に近づいていきます。一問一答の対話形式がChatGPT分析のコツです。

分析のやり方は分かりました。でも実際に試すと思った通りにいかないこともあります。

うまくいかない時の対処法

ChatGPTにデータ分析を頼むと、よくあるつまずきポイントがいくつかあります。

失敗例①:文字化けしたCSVをそのまま読み込ませた

Shift-JISのCSVをそのままアップロードすると、ChatGPTが列名を「譁・險・荵・」のように化けた文字として認識し、「譁・險・荵の平均値は…」という全く意味のない分析結果を返してきます。気づかずに進めると、あとでグラフも統計も全部やり直しになります。

対処:手順1に戻って、UTF-8で保存し直してください。

失敗例②:ChatGPTが列を誤認識する

金額列を文字列として扱い、「平均」が計算されないことがあります。CSVで「3,200円」のように単位付きで入っていると、ChatGPTはこれを数値ではなく文字と判定してしまいます。

対処:「金額列は数値データです。カンマや単位を除外して計算してください」と明示的に伝えます。

ChatGPTが行数を間違えることがある

ChatGPTが「このデータには120件あります」と自信満々に言っても、実際は100行かもしれない。これはAI特有の現象で、最初の数行だけを見て推測することがあるためです。まずは行数の一致から確認する癖をつけましょう。「正確な行数を数えてください」と指示すると、再カウントして訂正してくれます。

無料版で分析が動かない場合

ChatGPTの無料版(GPT-4o mini)でもデータ分析は使えますが、モデル選択が古いGPT-3.5になっていると機能しません。チャット画面上部でモデルが「GPT-4o mini」以上になっているか確認してください。

グラフが表示されない場合

タイムアウトしている可能性があります。「もう一度グラフを生成して」と指示するか、データ件数を減らしてから試してみてください。

ここまでの対処法を押さえておけば、大半のトラブルは自分で解決できます。最後に知っておくべき限界を確認しましょう。

知っておくべき限界と注意点

ChatGPTのデータ分析は便利ですが、いくつか明確な限界があります。

データサイズの制限

1回のアップロードで扱えるデータ量には上限があります。数十MBを超えるファイルや数十万行のデータは、タイムアウトやエラーになることが多いです。大きなデータは事前に期間や条件で絞り込んでから渡す方が確実です。

分析結果の正確性に限界がある

ChatGPTは分析結果を自信満々に出力しますが、数値が間違っていることがあります。ハルシネーション(もっともらしい嘘)のリスクは常にあります。特に次の項目は必ず自分で確認してください。

  • 合計値(ExcelのSUMと照合)
  • 割合・率(元の数字から計算し直す)
  • 「最も〇〇な」系の結論(実際にソートして確認)

機密データの取り扱い

ChatGPTに渡したデータはOpenAIのサーバーで処理されます。OpenAIは「チャット履歴に保存しない」設定(データ管理のオプション)を提供していますが、社内規定で外部サービスへのデータ送信が制限されている場合は、利用前に確認が必要です。

ChatGPTが苦手な分析

複数ファイルの結合、時系列予測(将来の売上予測など)、複雑な統計モデリングは、やろうと思えばできますが精度に期待しすぎない方がいい領域です。このあたりは専用のBIツールや統計ソフトの出番です。

限界は分かった。じゃあ、自分がちゃんと分析できたかどう確認するには?

最後に確認すること

分析が一通り終わったら、次のチェックリストで結果を検証します。

  • ChatGPTが報告した行数が、元のデータの行数と一致しているか
  • 合計値・平均値をExcelで計算し直して、ChatGPTの数字と同じか
  • グラフの軸ラベルとデータの列名が一致しているか
  • インサイトの主張に具体的な数字が裏打ちされているか

確認が取れたら、結果を保存しましょう。グラフ画像はチャット内でクリックするとダウンロードできます(PNG形式)。表形式のデータは選択してコピーし、Excelに貼り付けることができます。

次に試すこととして、以下のステップアップが考えられます。

  • 期間を絞った分析(「上半期と下半期で比較して」)
  • 複数の切り口でのクロス集計(「商品カテゴリ×月別の売上マトリクス」)
  • 異常値の深掘り(「3月の売上急増の要因を特定して」)

ChatGPTのデータ分析は、完璧なBIツールの代わりにはなりません。しかし「CSVがあるけど分析方法が分からない」という最初の一歩としては、ブラウザさえあれば今日から始められる手軽さがあります。まずは手元のデータで試してみて、出てきた数字を自分の目で確認する。その繰り返しで、データと向き合う感覚が養われていきます。

まとめ

ChatGPTのデータ分析機能を使えば、CSVやExcelのデータから傾向やインサイトをプログラミングなしで引き出せます。手順は、データをUTF-8で準備し、アップロードして概要を確認し、分析を指示し、結果を自分で検証するという流れです。分析結果の数字は必ず自分で照合し、機密データの取り扱いに注意することが前提です。この手順を一通り試せば、より複雑な分析に進む基礎ができています。

目次