Stable Diffusionで画像を生成するとき、多くの人が「画面のフォームに文字を入れる」やり方を思い浮かべます。でも画像生成の世界には、フローチャートのようにパーツを繋いで組む別のやり方がある——それがComfyUIです。この記事を読めば、ComfyUIが何をするツールか、そしてなぜClaude Codeの文脈でよく登場するのかが分かります。
一言でいうと——ComfyUIは「つなげて組む画像生成ツール」
ComfyUIは、画面上に四角い箱(ノード)を配置し、それらを線で繋いで画像を生成するオープンソースのツールだ。
レゴブロックに近いイメージで捉えると分かりやすい。個別のパーツ(ノード)を目的に合わせて繋ぎ合わせると、1つの画像生成ワークフローが出来上がる。たとえば「テキストを読み込むノード」「画像を生成するノード」「画像を保存するノード」を順番に線で繋ぐだけで、1枚の画像が完成する。
ComfyUIの押さえておきたいポイントは次の3つ。
- 無料で使える ——オープンソース(GitHubで公開)なので、誰でも無償で利用できる
- ノードベース ——フォームに文字を入れる方式ではなく、フローチャートのようにパーツを繋ぐ方式
- カスタマイズ性が高い ——「カスタムノード」という追加パーツを使えば、自分好みの処理を組み込める
GitHubでは約10万9000のスター(いいねに相当)を集めており、画像生成コミュニティで広く使われている。
余談だが、「ComfyUI」という名前はそのまま「Comfy UI」(快適なUI)と読む。開発元はComfy Orgという企業で、オープンソース版のComfyUIとは別にクラウドサービス版(Comfy Cloud)も提供している。この記事で扱うのはオープンソース版の方だ。
なぜClaude Codeの記事でComfyUIが出てくるのか
答えはシンプルだ。ComfyUIのワークフローはJSONファイルで保存される——つまりテキストデータとして扱える。
Claude Codeが得意なのはテキストの読み書き。プログラムのコード、設定ファイル、マークダウンなど、文字で書かれたものなら何でも扱える。ComfyUIのワークフローもJSONというテキスト形式なので、Claude Codeの守備範囲に入っている。
具体的にどういうことか、簡単な例で考える。
架空のプロジェクトで「ComfyUIのワークフローを新しく作ってほしい」とClaude Codeに依頼したとする。Claude CodeはJSONの構造を理解しているので、ノードの定義や繋ぎ方をテキストとして記述できる。生成されたJSONをComfyUIに読み込ませれば、画面上にワークフローが反映される——という流れが成り立つ。
もちろん、画像そのものの生成はComfyUIが行う。Claude Codeに画像の生成能力があるわけではない。重要なのは「ComfyUIの設定や手順書がテキストで管理されている」という点だ。だからこのブログでは、Claude Codeでどこまで画像生成パイプラインを自動化できるか、という検証でComfyUIがよく登場する。
ComfyUIのここだけ知っておけば大丈夫——3つのキーワード
ComfyUI関連の記事を読む上で、最低限押さえておきたい概念が3つある。それぞれ料理に例えて整理しよう。
ワークフロー
画像生成の手順全体を図のように組んだもの。ComfyUIの画面に表示される、ノードと線のまとまりそのものがワークフローだ。
料理に例えると「レシピ」に当たる。「まず素材を切って、火を通して、盛り付ける」という手順の全体像。ComfyUIではこのレシピを自由に組み替えられる。
ノード
1つの処理を表す四角い箱。「画像を読み込む」「テキストを解釈する」「サイズを変更する」など、それぞれの箱が1つの役割を持っている。
料理でいうと「調理手順の1ステップ」。卵を割る、フライパンを熱する、調味料を入れる——各ステップがノードに相当する。
モデル
画像を生成するAIの脳。Stable Diffusion、Flux、Hunyuanなど、複数のモデルが存在し、どれを使うかで生成される画像の傾向が変わる。
料理でいうと「料理人」。どんなに良いレシピ(ワークフロー)があっても、料理人(モデル)が違えば味は変わる。ComfyUIは複数の料理人を呼べるキッチンのようなものだ。
この3つを押さえておけば、ComfyUIの記事で出てくる「ワークフローをインポートする」「モデルを切り替える」「ノードが足りない」といった表現の意味が追えるはずだ。
ComfyUIとよく似たツールとの違い
ComfyUI以外にも画像生成を扱うツールはいくつかある。初心者が一番混同しやすいポイントを整理しておこう。
まず大前提として、「ComfyUIはツール、Stable Diffusionはモデル。別のもの」という区別がある。ComfyUIは画像を生成するための作業環境で、Stable Diffusionはその環境の中で動くAIエンジン。工具と材料の関係に近い——ComfyUIがペイントブラシで、Stable Diffusionが絵の具。
この区別が分かると、他のツールとの違いも見えやすくなる。
Stable Diffusion webUI(AUTOMATIC1111)
Stable Diffusionを使うためのもう一つの無料ツール。ComfyUIと同じモデルを動かせるが、操作方法が違う。画面のフォームにプロンプトを入力して「Generate」ボタンを押すタイプ。設定画面が多めで、初心者には項目が多く見えがち。一方で直感的に操作しやすいという意見もある。
ComfyUIとの違いは、ノードで組むかフォームに入力するか。料理でいうと、Stable Diffusion webUIは「メニューを選んで注文するレストラン」、ComfyUIは「自分でレシピを組み立てるキッチン」に近い。
Midjourney
クラウド上で動く有料の画像生成サービス。プロンプトを入力するだけで高品質な画像が出る。自分のPCには一切インストール不要。ただし月額費用がかかり、細かい制御は苦手な面がある。
ComfyUIとの違いは、ローカルで動かすかクラウドか、無料か有料か。ComfyUIは自分のWindows PC上で動かすので、GPU(グラフィックボード)がそれなりに必要になる。
DALL-E(ChatGPTの画像生成)
ChatGPTに「〜の画像を作って」と依頼するだけで画像が生成される機能。最も手軽だが、ComfyUIのような細かな制御はできない。出力の傾向もDALL-E独自のものになる。
ツールごとの違いを一覧にまとめた。
| ツール名 | 操作方法 | 料金 | 動作環境 |
|---|---|---|---|
| ComfyUI | ノード式 | 無料 | ローカルPC |
| Stable Diffusion webUI | フォーム入力式 | 無料 | ローカルPC |
| Midjourney | プロンプト入力式 | 有料(月額) | クラウド |
| DALL-E | チャット入力式 | ChatGPT Plus等 | クラウド |
「どれが一番いいか」は目的による。ComfyUIは細かな制御と自動化に強いので、Claude Codeと組み合わせるなら自然な選択肢になる。
関連記事への導線
ComfyUIは「ノードを繋いで画像を生成する無料ツール」で、Claude CodeユーザーにとってはワークフローがJSON形式で扱える点が関係している。
ComfyUIのことを知らなくても、このブログの検証記事自体は読める。ただComfyUI関連の検証記事に出てくる「ワークフロー」「ノード」「モデル」という言葉の意味は、この記事で整理できたと思う。
ComfyUIについてさらに掘り下げたい場合は、以下の記事が参考になる。
- CC-022「ComfyUIをWindowsに導入できる?」 ——実際にWindows環境にComfyUIをインストールして動かすまでの検証記事
- CC-025「ワークフローはどこまで作れる?」 ——Claude CodeにComfyUIのワークフロー作成を依頼した検証記事