Stable Diffusionで画像を生成するとき、多くの人が「画面のフォームに文字を入れる」やり方を思い浮かべます。でも画像生成の世界には、フローチャートのようにパーツを繋いで組む別のやり方がある——それがComfyUIです。この記事を読めば、ComfyUIが何をするツールか、そしてなぜClaude Codeの文脈でよく登場するのかが分かります。
一言でいうと——ComfyUIは「つなげて組む画像生成ツール」
ComfyUIは、画面上に四角い箱(ノード)を配置し、それらを線で繋いで画像を生成するオープンソースのツールだ。
個別のパーツ(ノード)を目的に合わせて繋ぎ合わせると、1つの画像生成ワークフローが出来上がる。たとえば「テキストを読み込むノード」「画像を生成するノード」「画像を保存するノード」を順番に線で繋ぐだけで、1枚の画像が完成する。
ComfyUIの押さえておきたいポイントは次の3つ。
- 無料で使える ——オープンソース(GitHubで公開)なので、誰でも無償で利用できる
- ノードベース ——フォームに文字を入れる方式ではなく、フローチャートのようにパーツを繋ぐ方式
- カスタマイズ性が高い ——「カスタムノード」という追加パーツを使えば、自分好みの処理を組み込める
GitHubでは約10万9000のスターを集めており、画像生成コミュニティで広く支持され、注目を集めている。
余談だが、「ComfyUI」という名前はそのまま「Comfy UI」(快適なUI)と読む。オープンソース版のComfyUIは現在、公式配布やドキュメント、クラウドサービス版(Comfy Cloud)を提供しているComfy Orgが中心となって開発を進めている。この記事で扱うのはオープンソース版の方だ。
なぜClaude Codeの記事でComfyUIが出てくるのか
ComfyUIのワークフローは、JSONというテキスト形式で保存・共有できる。生成された画像のメタデータにもワークフロー情報が埋め込まれており、必要に応じて取り出して再利用することも可能だ。つまり、ComfyUIの設定や手順の多くがテキストとして扱える。
Claude Codeが得意なのは、テキストとして扱える設定や構造化データの整理だ。プログラムのコード、設定ファイル、マークダウンなど、文字で書かれたものを扱うのが得意。ComfyUIのワークフローもJSONというテキスト形式なので、Claude Codeの守備範囲に入っている。
具体的にどういうことか、簡単な例で考える。
架空のプロジェクトで「ComfyUIのワークフローを新しく作ってほしい」とClaude Codeに依頼したとする。Claude CodeはJSONの構造を理解しているので、ノードの定義や繋ぎ方をテキストとして記述できる——つまり、ワークフローの雛形を書き出したり、既存のワークフローを整理・修正したりする作業に向いている。生成されたJSONをComfyUIに読み込めば、画面上にワークフローが反映される。
ただし実際には、利用するカスタムノードが揃っているか、モデル名が環境と一致しているか、ComfyUIのバージョンによる差分がないかといった確認が別途必要になる。Claude Codeはワークフローの雛形作成や整理・差分修正に向いているが、環境ごとの差分までは自動で吸収できない。
もちろん、画像そのものの生成はComfyUIが行う。Claude Codeに画像の生成能力があるわけではない。重要なのは「ComfyUIの設定や手順書がテキストで管理されている」という点だ。だからこのブログでは、Claude Codeでどこまで画像生成パイプラインを自動化できるか、という検証でComfyUIがよく登場する。
ComfyUIの基本——3つのキーワード
ComfyUI関連の記事を読む上で、最低限押さえておきたい概念が3つある。
ワークフロー
画像生成の手順全体を図のように組んだもの。ComfyUIの画面に表示される、ノードと線のまとまりそのものがワークフローだ。画像を生成するには、どのノードをどんな順番で繋ぐかを組み立てる必要がある。
ノード
1つの処理を表す四角い箱。「画像を読み込む」「テキストを解釈する」「サイズを変更する」など、それぞれの箱が1つの役割を持っている。ワークフローは、このノードを複数繋ぎ合わせて構成する。
モデル
画像の生成を担うAI。Stable Diffusion、Flux、Hunyuanなど複数のモデルが存在し、どれを使うかで生成される画像の傾向が変わる。ComfyUIは、こうしたモデルを切り替えて使える作業環境という位置づけだ。
この3つを押さえておけば、ComfyUIの記事で出てくる「ワークフローをインポートする」「モデルを切り替える」「ノードが足りない」といった表現の意味が追えるはずだ。
ComfyUIとよく似たツールとの違い
ComfyUI以外にも画像生成を扱うツールはいくつかある。初心者が一番混同しやすいポイントを整理しておこう。
まず大前提として、「ComfyUIはツール、Stable Diffusionはモデル。別のもの」という区別がある。ComfyUIは画像を生成するための作業環境で、Stable Diffusionはその環境の中で動くAIエンジン。この区別が分かると、他のツールとの違いも見えやすくなる。
Stable Diffusion webUI(AUTOMATIC1111)
Stable Diffusion系のモデルを扱うもう一つの代表的な無料ツール。ComfyUIと重なる部分もあるが、操作方法は大きく違う。画面のフォームにプロンプトを入力して「Generate」ボタンを押すタイプ。設定画面が多めで、初心者には項目が多く見えがち。一方で直感的に操作しやすいという意見もある。
ComfyUIとの違いは、ノードで組むかフォームに入力するか。ComfyUIは一つひとつの処理を視覚的に組み立てるのに対し、Stable Diffusion webUIは設定値を入力して実行するスタイルだ。
Midjourney
クラウド上で動く有料の画像生成サービス。プロンプトを入力するだけで高品質な画像が出る。自分のPCには一切インストール不要。ただし月額費用がかかり、細かい制御は苦手な面がある。
ComfyUIとの違いは、ローカルで動かすかクラウドか、無料か有料か。ComfyUIはローカルPCで動かすことができるが、GPU(グラフィックボード)がそれなりに必要になる。
ChatGPTの画像生成機能
ChatGPTに「〜の画像を作って」と指示するだけで画像が生成される。最も手軽だが、ComfyUIのような細かな制御はできない。
ツールごとの違いを一覧にまとめた。
| ツール名 | 操作方法 | 料金 | 動作環境 |
|---|---|---|---|
| ComfyUI | ノード式 | 無料 | ローカルPC |
| Stable Diffusion webUI | フォーム入力式 | 無料 | ローカルPC |
| Midjourney | プロンプト入力式 | 有料(月額) | クラウド |
| ChatGPTの画像生成 | チャット入力式 | プランにより異なる | クラウド |
「どれが一番いいか」は目的による。ComfyUIは細かな制御と自動化に強いので、Claude Codeと組み合わせるなら自然な選択肢になる。
関連記事への導線
ComfyUIは「ノードを繋いで画像を生成する無料ツール」で、Claude Codeユーザーにとってはワークフローがテキスト形式で扱える点が関係している。
ComfyUIのことを知らなくても、このブログの検証記事自体は読める。ただComfyUI関連の検証記事に出てくる「ワークフロー」「ノード」「モデル」という言葉の意味は、この記事で整理できたと思う。
ComfyUIについてさらに掘り下げたい場合は、以下の記事が参考になる。
- 「ComfyUIをWindowsに導入できる?」 ——実際にWindows環境にComfyUIをインストールして動かすまでの検証記事
- 「ワークフローはどこまで作れる?」 ——Claude CodeにComfyUIのワークフロー作成を依頼した検証記事







