Claude Codeでどこまでできる?

Claude Codeの使い方や連携を、実際に試してわかりやすく伝えるサイト

ComfyUIとは?ノードで組む無料画像生成ツールを初心者向けに整理

,

Stable Diffusionで画像を生成するとき、多くの人が「画面のフォームに文字を入れる」やり方を思い浮かべます。でも画像生成の世界には、フローチャートのようにパーツを繋いで組む別のやり方がある——それがComfyUIです。この記事を読めば、ComfyUIが何をするツールか、そしてなぜClaude Codeの文脈でよく登場するのかが分かります。

一言でいうと——ComfyUIは「つなげて組む画像生成ツール」

ComfyUIは、画面上に四角い箱(ノード)を配置し、それらを線で繋いで画像を生成するオープンソースのツールだ。

レゴブロックに近いイメージで捉えると分かりやすい。個別のパーツ(ノード)を目的に合わせて繋ぎ合わせると、1つの画像生成ワークフローが出来上がる。たとえば「テキストを読み込むノード」「画像を生成するノード」「画像を保存するノード」を順番に線で繋ぐだけで、1枚の画像が完成する。

ComfyUIの押さえておきたいポイントは次の3つ。

  • 無料で使える ——オープンソース(GitHubで公開)なので、誰でも無償で利用できる
  • ノードベース ——フォームに文字を入れる方式ではなく、フローチャートのようにパーツを繋ぐ方式
  • カスタマイズ性が高い ——「カスタムノード」という追加パーツを使えば、自分好みの処理を組み込める

GitHubでは約10万9000のスター(いいねに相当)を集めており、画像生成コミュニティで広く使われている。

余談だが、「ComfyUI」という名前はそのまま「Comfy UI」(快適なUI)と読む。開発元はComfy Orgという企業で、オープンソース版のComfyUIとは別にクラウドサービス版(Comfy Cloud)も提供している。この記事で扱うのはオープンソース版の方だ。

なぜClaude Codeの記事でComfyUIが出てくるのか

答えはシンプルだ。ComfyUIのワークフローはJSONファイルで保存される——つまりテキストデータとして扱える。

Claude Codeが得意なのはテキストの読み書き。プログラムのコード、設定ファイル、マークダウンなど、文字で書かれたものなら何でも扱える。ComfyUIのワークフローもJSONというテキスト形式なので、Claude Codeの守備範囲に入っている。

具体的にどういうことか、簡単な例で考える。

架空のプロジェクトで「ComfyUIのワークフローを新しく作ってほしい」とClaude Codeに依頼したとする。Claude CodeはJSONの構造を理解しているので、ノードの定義や繋ぎ方をテキストとして記述できる。生成されたJSONをComfyUIに読み込ませれば、画面上にワークフローが反映される——という流れが成り立つ。

もちろん、画像そのものの生成はComfyUIが行う。Claude Codeに画像の生成能力があるわけではない。重要なのは「ComfyUIの設定や手順書がテキストで管理されている」という点だ。だからこのブログでは、Claude Codeでどこまで画像生成パイプラインを自動化できるか、という検証でComfyUIがよく登場する。

ComfyUIのここだけ知っておけば大丈夫——3つのキーワード

ComfyUI関連の記事を読む上で、最低限押さえておきたい概念が3つある。それぞれ料理に例えて整理しよう。

ワークフロー

画像生成の手順全体を図のように組んだもの。ComfyUIの画面に表示される、ノードと線のまとまりそのものがワークフローだ。

料理に例えると「レシピ」に当たる。「まず素材を切って、火を通して、盛り付ける」という手順の全体像。ComfyUIではこのレシピを自由に組み替えられる。

ノード

1つの処理を表す四角い箱。「画像を読み込む」「テキストを解釈する」「サイズを変更する」など、それぞれの箱が1つの役割を持っている。

料理でいうと「調理手順の1ステップ」。卵を割る、フライパンを熱する、調味料を入れる——各ステップがノードに相当する。

モデル

画像を生成するAIの脳。Stable Diffusion、Flux、Hunyuanなど、複数のモデルが存在し、どれを使うかで生成される画像の傾向が変わる。

料理でいうと「料理人」。どんなに良いレシピ(ワークフロー)があっても、料理人(モデル)が違えば味は変わる。ComfyUIは複数の料理人を呼べるキッチンのようなものだ。

この3つを押さえておけば、ComfyUIの記事で出てくる「ワークフローをインポートする」「モデルを切り替える」「ノードが足りない」といった表現の意味が追えるはずだ。

ComfyUIとよく似たツールとの違い

ComfyUI以外にも画像生成を扱うツールはいくつかある。初心者が一番混同しやすいポイントを整理しておこう。

まず大前提として、「ComfyUIはツール、Stable Diffusionはモデル。別のもの」という区別がある。ComfyUIは画像を生成するための作業環境で、Stable Diffusionはその環境の中で動くAIエンジン。工具と材料の関係に近い——ComfyUIがペイントブラシで、Stable Diffusionが絵の具。

この区別が分かると、他のツールとの違いも見えやすくなる。

Stable Diffusion webUI(AUTOMATIC1111)

Stable Diffusionを使うためのもう一つの無料ツール。ComfyUIと同じモデルを動かせるが、操作方法が違う。画面のフォームにプロンプトを入力して「Generate」ボタンを押すタイプ。設定画面が多めで、初心者には項目が多く見えがち。一方で直感的に操作しやすいという意見もある。

ComfyUIとの違いは、ノードで組むかフォームに入力するか。料理でいうと、Stable Diffusion webUIは「メニューを選んで注文するレストラン」、ComfyUIは「自分でレシピを組み立てるキッチン」に近い。

Midjourney

クラウド上で動く有料の画像生成サービス。プロンプトを入力するだけで高品質な画像が出る。自分のPCには一切インストール不要。ただし月額費用がかかり、細かい制御は苦手な面がある。

ComfyUIとの違いは、ローカルで動かすかクラウドか、無料か有料か。ComfyUIは自分のWindows PC上で動かすので、GPU(グラフィックボード)がそれなりに必要になる。

DALL-E(ChatGPTの画像生成)

ChatGPTに「〜の画像を作って」と依頼するだけで画像が生成される機能。最も手軽だが、ComfyUIのような細かな制御はできない。出力の傾向もDALL-E独自のものになる。

ツールごとの違いを一覧にまとめた。

ツール名 操作方法 料金 動作環境
ComfyUI ノード式 無料 ローカルPC
Stable Diffusion webUI フォーム入力式 無料 ローカルPC
Midjourney プロンプト入力式 有料(月額) クラウド
DALL-E チャット入力式 ChatGPT Plus等 クラウド

「どれが一番いいか」は目的による。ComfyUIは細かな制御と自動化に強いので、Claude Codeと組み合わせるなら自然な選択肢になる。

関連記事への導線

ComfyUIは「ノードを繋いで画像を生成する無料ツール」で、Claude CodeユーザーにとってはワークフローがJSON形式で扱える点が関係している。

ComfyUIのことを知らなくても、このブログの検証記事自体は読める。ただComfyUI関連の検証記事に出てくる「ワークフロー」「ノード」「モデル」という言葉の意味は、この記事で整理できたと思う。

ComfyUIについてさらに掘り下げたい場合は、以下の記事が参考になる。

  • CC-022「ComfyUIをWindowsに導入できる?」 ——実際にWindows環境にComfyUIをインストールして動かすまでの検証記事
  • CC-025「ワークフローはどこまで作れる?」 ——Claude CodeにComfyUIのワークフロー作成を依頼した検証記事