1. Kudo's Radio -クドラジ-
  2. 【画像生成AI】神ワークフロー..
2025-10-14 32:07

【画像生成AI】神ワークフローを使おうとしたら、ComfyUIが起動しなくなって絶望した話。

spotify apple_podcasts youtube

めっちゃ大変でしたが、とても勉強になりました😅

🔻お便りフォーム https://forms.gle/pchkKUYQhBTRZRQ69

🔻音楽生成AI Suno https://suno.com/@kudo_ai

🔻AIイラスト - Kudo https://www.artstation.com/kudo_aiart

🔻音声ライブ配信:アニボッチステーション https://stand.fm/channels/60ce14cbfa2e548a3cc824e9

🔻アニボッチDiscordコミュニティ ⁠https://discord.gg/gM3UDWnuMW

ーーーーーーーーーーー

以下、広告リンクを含みます。

🔻マイク SHURE MV7 https://amzn.to/4lEwNc8

🔻オーディオインターフェース ZOOM Podtrak P4 https://amzn.to/4ijYi7G

サマリー

このエピソードでは、Kudoさんが画像生成AIのConfig UIとQuenに関連するワークフローの設定に苦労している様子が語られます。特に、Pythonパッケージのインストールに関するトラブルや、カスタムノードの認識問題に直面しつつ、解決策を見つける経緯が描かれています。また、ComfyUIを用いた画像生成ワークフローが起動しなくなるトラブルに直面した経験についても触れられ、GitHubを活用したデータのバックアップ方法や生成プロセスの時間短縮について考察されます。さらに、コンフィUIを使用して動画生成AIをローカルで実行した結果、期待外れの問題に直面しながらも貴重な学びが得られたことも述べられます。今後はペーパースペースを活用し、さらに効率的な生成を目指す話も紹介されます。

AIの導入とワークフローの構築
どうもみなさん、Kudoでございます。
この番組は、年間でアニメ200作品以上、 漫画300作品以上、そしてゲームもたしなみ、
最近はAIにもどっぷりハマっている私、Kudoが、 アニメ、漫画、ゲーム、AIの話をしたり、しなかったりする番組です。
本日は、2025年の10月14日火曜日、 現在時刻は朝9時52分でございます。
14日ということは、もう10月入って2週間経過したんですね。
早いですね、本当に。
10月がもうすぐ半分終わろうとしているというタイミングですが、
もうあと10月半分いったら、もう11月。
私は11月になると、32歳になります。
まだちょっと気が早いですけど。
そんな10月の中旬と言っていいんでしょうか。
今日はちょっと寒いかな。
昨日と比べると雨も降っていまして、ちょっと寒いかなと。
もう今21度ぐらいなんでね。
今、膝掛けしながら、普段はハンソルなんですけど、 ちょっと上着を羽織って収録したりしてますけど、
皆さんも風邪ひかないように気をつけてください。
ということで、今日もちょっとAIの話をしますよ。
AIの話ということで、ここ最近の続きという感じではなると思うんですが、
Config UIおよびQuenというですね、 ローカルの編集に特化した画像生成AIの話をちょっとして、
プラスアルファでちょっと話したいこともあるので、 それを話して今日は終わろうかなと思います。
クドラジでは何度もお伝えしてますが、 最近Config UI上でQuenというですね、
ローカルで動かせるオープンソースの 画像生成のAIをいじくって遊んでるわけなんですけど、
先日博士愛さんというですね、 AI研の情報発信をされてる方のノートのメンバーシップに加入するぞっていう配信をやったんですが、
そこから博士さんのノートの記事を見たりして、 あとはConfig UIのワークフローなんかをダウンロードして、
実際に自分のローカルの自分のパソコンのConfig UI上にそのワークフローを持ってきて、
実際に画像生成したりとかやって遊んでるんですけど、 結構大変でした。
結構というかもうちょっと諦めというか、 ちょっと絶望しかけたこともあったりしたんですけど、
私自分のパソコンでConfig UIを使っているんですが、
さっきも言ったようにConfig UIってワークフローって呼ばれるJSONファイル、 .jsonというふうな拡張して書かれたファイルをですね、
自分のConfig UI上にドラッグ&ドロップすると、 自分のConfig UIでも誰かが作った、
もう神がかったワークフローをね、 自由にカスタマイズしたり使うことができるって話前したんですけど、
そこまではまあいいんですよ。 ただ問題はそのワークフローの中で、
トラブル発生と解決の試行
自分のConfig UIには入ってないカスタムノードって言うんですけど、
世界中の方がGitHubとかで公開されているカスタムノードと呼ばれるものがあるんですけど、
そのカスタムノードが自分のパソコンの中には入ってないやつを使われてたりすると、
その使われてないカスタムノードを自分のパソコンに持ってこないといけないんですよね。
今のConfig UIにはミッシングノードって言って、自分の環境にはないワークフローにはあるんだけど、
自分の環境にはないカスタムノードを一覧で自動的に表示して、
ポチポチってやるだけで全部ダウンロードしてインストールできる機能があるんですよね。
そこまではまあいいんですけど、一覧でいっぱい自分の環境には入ってないカスタムノードが表示されて、
じゃあいいや、これポチポチ押していこう、インストール、インストール、インストール、インストールってやって、
再起動するんですけど、再起動したらConfig UIが立ち上がらなくなりまして、
初めて見る画面が表示されて、メンテナンス画面なのかな。
私が今までConfig UI使ってきてちょっと表示されたことない画面が表示されて、
Pythonのパッケージをインストールしてくださいみたいな、これインストールしないとダメですみたいなエラーが表示されて、
え?みたいな。
俺カスタムノードインストールしただけなんだけど、
なんで急にPythonのパッケージがどうだろうとか言い始めたんだろうと思って、おかしいなみたいな。
その言われるがままにインストールボタンがあったんでポチって押してやったんだけど、
なんか全然進まなくて、あれ?みたいな。
嘘だろ?おいみたいな感じになって、Config UIがうんともすんとも言わなくなってしまって、
うわーやべーやっちまったみたいな。
ってなって、もうローカルでのConfig UIは半分諦めたような状態になったんですけど、
どう?なんとかしてこれ直せないかなと思って、AIに相談しました。
私が愛用しているクロードですね。クロードソネット4.5?4.5ソネットか。
に、Config UIで今こんなことになってこんな画面表示されてるんでしょ?
ですけど、みたいな感じでスクショも載せたりしながら相談してやってたんですけど、
それでも2時間くらいやってたかな?2時間くらいずっとやってたんだけど直んなくて、
もうダメかもしれないみたいになって、くっそーと思って。
クロードに相談してたら、パソコン一回再起動してみたらどうですかって言われて、再起動かけたんですよ。
そしたらちょっと変化が起こって、やっぱねパソコンの再起動って最終奥義でもあると思うんだけど、
やっぱ大事なんだなって思ったね。
なんか再起動かけたら、さっき言ったConfig UI上のPythonのパッケージインストールみたいなやつが急に動き始めて、
お、これでいけると思ってやったらですね、その後動いたんだっけな?
その後インストールできて、Config UI自体は確か起動できたんですよ。
起動できて、これで解決かと思いきや、違う、そんな簡単に言ったかな、ごめん。
結構いろいろちょっと端折ってるところはあると思うんだけど、
Windowsで私やってますから、Windows使われてる方は知ってるかと思いますけど、
WindowsにPowerShellっていうコマンドをテキストで打ち込むソフトウェアがあるんですけど、
それとかも駆使しながらMacrodoに相談して、このコマンド打ってください、このコマンド打ってください、このコマンド打ってくださいみたいな。
仮想環境を一旦削除して再構築しましょうとか言われて、
大丈夫かなとか思ったけど、言われるがままにどんどん入力していって。
最終的な解決と復活
やってったら、Config UI一回起動したんだよね。
たぶんいろいろあったんだけど、起動してなんとかなおっていけると思ってワークフローを開いたらですね、
今まで普通に使ってきた、それこそこのクズラ列のカバーアート最近AIで作ってますけど、
カバーアートにしていった画像を生成、カバーアートを生成するためのワークフローをConfig UIで開いたら、
今まで普通に使えてたはずのカスタムノード、今回新しく入れたやつじゃなくて、
ちょっと前から入れてたカスタムノードがなぜかありませんみたいな認識されなくなっちゃって。
そのノードが使えないと非常に困るんですよ。
非常に困るし大変なので、何とかしてこのカスタムノードを今度は認識させなきゃいけないってことで、
それをまたクロードと相談しながらやってみたんですけど、ここも大変でね。
何度かそういうコマンドをPowerShellで打ったりとか、Config UI再起動かけたりパソコン再起動かけたりしたんですけど、
直らなくて、結局どうやって直ったんだっけな。
結局それやってる間にまたConfig UI立ち上がらなくなったり、
さっき言ったメンテナンスの画面に行ってパッケージインストールしてくださいみたいになって、
これ何度繰り返すねんみたいな感じになったんだけど、でもなんやかんやありつつ、
直りました。無事に。その戦いの記録は私のクロードのチャット履歴に全部残ってはいるんですけど、
非常に大変ではありましたが、でもちょっとさっき仮想環境を一旦削除して新しく作り直したみたいな話しましたけど、
それのおかげかわかんないんだけど、これまでConfig UI使ってる中でちょっとバグっぽいのがあったんですよ。
カスタムノードを入れて再起動、リスタートさせると、普通はもう1回立ち上がるんですけど、Config UIがちゃんとね。
今まで立ち上がらなくて、一旦Config UIを削除、画面消してからもう1回Config UI起動すると直るっていうか、
ちょっとしたバグみたいなものとかがあったんですが、その辺が綺麗さっぱりなくなったりしてたんで、大変だったけど、
やってよかったっちゃよかったのかなと思ったりはしました。
だから今はとりあえず何とか復活して問題なく動いてるっていう感じです。
今回そういったちょっと大変な思いをしたので、クロードさんに相談しながら、
バックアップ、データ保存とか前の環境を取っておく方法ってないですかねみたいな感じで聞いたら、
Config UIにはConfig UIマネージャーだったかなみたいな機能があって、
ComfyUIのトラブル
それを使うとスナップショットっていう、その時の状態を保存しておけるっていう機能があるんですけど、
あとはGitHubでコードを保存しておく設定ファイルとかワークフローとかその辺を設定しておくことができますよって言われて、
それもクロードに相談しながらやって、今GitHubのほうに全部じゃないんですけど、
モデルデータとかはすごい何十ギガとかあるんで、その辺は重いからいらないけど、
ユーザーデータ、設定の情報とかワークフローとか、それこそスナップショットとかもその中に含まれるんですけど、
とかも含めて全部GitHubに保存しておいて、定期的にそのGitHubにバックアップをアップしておいて、
例えばパソコン買い替えるとか、パソコンぶっ壊れたとか、コンフューアイ全く既読しなくなっちゃったなった時に、
そのGitHubからデータを持ってきて復帰させるみたいな方法がいいんじゃないですかみたいなっていうふうに言われて、
なるほどと、そっかそっか、GitHubね、あーみたいな、その方法があったかと、もちろんそれで完全復帰できるかどうかはわかんないですよ。
あくまでもその設定の部分だけなんで、今回起動しなくなったのはなんでなんだろうね。
結構そのコンフューアイって、なんていうかな、私も正直苦労となかったら絶対無理だったと思うんだよね。
だからちょっとやっぱハードル高いのかなっていう感じはしたよね。
ステーブルディビュージョンそのものもそうだけど、ウェブサービスで課金して動画生成したり画像生成したりするのって、
金さえ払っていれば基本使えなくなることってないと思うんだけど、やっぱ自分のパソコンにそういうのをインストールしてやるのって、
パソコンの状況によって結構エラーが出たりとか、自己解決しなきゃいけないっていうことが多々あるんで、
そういうのができない人はなかなかオススメしづらいなとは思いますけど、でもいろいろ勉強になった。
パワーシェルとかもそうだけど、GitHubにデータ保存しておくとか、
あとついでにWindowsで拡張子で、自動化ですね。
PS1っていうふうに拡張子をつけておくと、
そのPS1のテキストの確かラレーズだったと思うんだけど、
GitHubにGitの操作あるじゃん。
Git AddなんとかGit CommitとかGit Pushとかあるじゃん。
あの操作を毎回やるの面倒じゃないですか。
だからこのPS1って書かれたファイルの中にそのやり取りというか、その処理をもう書いておいて、
デスクトップにそのPS1のデータファイルを置いておいて、それを起動するだけでもう自動的にパワーシェルからGitを起動して、
GitHubにバックアップを取ってくれるみたいな、そういう自動化の方法まで教えてくれて、
お前すげえなクロードみたいな感じで、今デスクトップにそのファイルがあるんですけど、
定期的にそれを起動してGitHubに、状態が良い場合、状態が悪い状態で保存しておいてもあれだけど、
状態が良い状態のときに定期的にバックアップを取っておくことで、
ワークフローだったり、いろんなものがバックアップ取れるので非常に便利だなというふうに思っています。
そういうのも含めて非常に勉強になる、ある意味良い経験だったかなとは思いました。
二度ってやりたくないけどね。
このPUI起動しなくなるとかマジで勘弁してほしいって感じです。
そんなこんなありつつ、今は博士さんから提供された紙ワークフローも今普通に動かせるようになりましたので、
モデルとかもダウンロードしたりとか、その辺のモデルのダウンロードとかも初めてのことがあったり、大変ではありましたが、
一応なんとか動くようになりました。
1個問題が今あるとすれば、ちょっと生成に時間がかかりすぎるなっていう印象はあって、
クエンをローカルで、前にONPYのテンプレートで動かしたときは、
大体40秒とか50秒くらいかな、で1枚生成できてたんですけど、
今回の紙ワークフローを使うと2分とか、2分、1分半ぐらいかかっちゃうんですよね。
ちょっとね、やっぱりその時間がかかりすぎるっていうところはなんとかしたいなと思っていて、
だからそこを今自分なりにカスタマイズできないかなとかっていう感じで今少しずついじってるっていう感じですね。
だからその紙ワークフローはね、処理が普通のシンプルな編集もできるし、複数画像参照もできる。
複数画像参照っていうのは例えば1枚目と2枚目の画像があって、
2枚目の例えば写ってる人の衣装を1枚目の人に着せるみたいな、着せ替えみたいなことができたりとか、
あとはインペイントかな、これこの前言ったかな、塗りつぶしてそこだけ編集するとか、
あとはコントロールネットですね、ポーズとか構造を維持するっていうやつですけど、
そういうのが全部、その紙ワークフローには全部異色体になってるんだよね。
これを使いたいときはここを有効化して、ここを無効化してみたいな感じで使っていくんですけど、
だからかわかんないけど結構処理に時間かかっていて、
テンプレートのやつは本当にシンプルになっているので、だから早いのかなとか思ったりするんですけどね。
そんな感じで、紙ワークフローではありましたが、色々と問題を引き起こしてくれて、おかげで色々勉強になったというお話でした。
画像生成の効率化
でも一つ壁を乗り越えた感じがします。
コンフィギュア使いとしてまた一歩、二歩、三歩成長できたんじゃないかなと思います。
大変だった。
そして現状、さっきも言ったけど、紙ワークフローを普通に使えるようになりましたので、
あとは生成時間の短縮とか、コントロールネットインペイントとかその辺をちょっと実際にやってみて、こんな感じかっていうのがわかったら、
あとはローカルでクエンを使ってやることはそんなないんだよね。
今後もしその画像編集したりとか、仕事で使いたいとかってなった時にこのワークフローをパッと持ってきて、
もうAIでカタカタカタ、こうしてペーンみたいな、やったらもう一瞬でね。
そうだよね、でも言うても2分だもんね。
短いに越したことはないだろうけど。
普通だったらフォトショーとかで、下手したら1時間とか2時間とかやって編集するものをAIにただ命令するだけ。
ここの部分こうして、もっとプロっぽい感じにして、おしゃれにしてとか言うだけで変えてくれたりするわけですから、
それだったら2分とかでも全然問題ないかなっていう気もしますが、
そこの時間短縮を何とかしたいなっていうところと、
そして今回のプラスアルファの部分ですけど、
Paper Spaceを使った動画生成ですね。
ここがとりあえずの最終到達、
最終到達を言い過ぎた。
とりあえずの目標化ですかね。
動画生成は前から何度も言ってるように、
やっぱりローカルの私の環境だとかなり厳しいです。
グラボRTX3080、VRAM10GBなんで、ちょっと厳しいです。
できなくはないだろうけど、時間もかかるし、
だって普通にこのPaper Spaceの結構イケイケのGPU使っても、
動画10秒とか12秒とかのやつを作ろうとすると、
やっぱ10分とか早くてもかかるらしいんで、
1本ね、らしいんで、
私のGPUじゃちょっと無理だろうということで、
やっぱPaper Spaceを契約しなきゃいけないかなと言ったところです。
Paper Spaceの活用
Paper Spaceはプロプランとグロースプランってあるんですけど、
おすすめはグロースプランですね。
ただ、グロースプランはいくらだっけな。
ちょっと待って、グロースプランは、
確か39ドルじゃなかったかな。
そう、39ドル。今だと39ドルっていくらなんだ。
7000円とか。
39、ごめん、7000円うそ、6000円。
6000円ですわ。6000円かかってしまいます。
結構高いですよね。
プロプランだと1200円とかか、
8ドルなんですよ。8ドルっていくら。
8ドルはいくらだ。1200円。
なので、お得かなっていう感じはしますけど、
ただ、プロプランだとRTX5090と、
何だっけな、もう1個、もうちょっと上のやつが
使えたはずなんですけど、確か。
この前、それこそクロードに聞いたんだけど、
どれだっけな。ちょっとどっか行っちゃったかな。
これかな。
クロードにチャット履歴が残ってるんですが、
どれだっけ。RTX5000。
私のグラボの2世代上のやつが使えるってだけでも
十分すごいんですけどね。プロプランでも。
だから、とりあえずプロプランでいいのかな。
ちょっと待ってね。どこ行ったっけ。
グロースだとA5000みたいなやつが使えるらしいんですよ。
VRAM24GBとかもあるんですが、
Paper Spaceにはさらにとんでもないやつもあるんですけどね。
何だっけ。VRAM80GBとか。私10GBですよ、パソコン。
コンフィUIの実行結果
VRAMだからね。普通のメモリーじゃないからね。
なので、プロプランで使える動画生成用のやつは
RTX5000、VRAM16GB、もしくはP5000っていうやつだね。
これもVRAM16GBあるみたいですけど。
結構このVRAMが重要っぽいですよ。
ビデオメモリーっていうものがあるんですけどね。
私の場合はRTX3080で10GBしかないので、
プロプランを契約すれば、月額お金はかかりますけど、
16GBのものが使えるという感じで。
グロースプランになるとさらにその上の、
さっき言ったようなモンスター級の、
普通一般家庭で使うようなGPUではないんで、
もうそういうクリエイター向けというか、
本当にプロ向けみたいなグロースプランではありますけど、
すごいやつがあるはず、確か。
A5000、A100。
A100はグロースプランでも有料なのか。
VRAM40GBとかね。
1時間使うだけで3.9ドル取られるとかね。
すごいお金取られちゃうんで、
ちょっと使うGPUは見極めなきゃいけないですけど、
そんな感じでちょっとPaperspaceを今、
契約するかどうかっていうところを今考えております。
一旦登録だけしちゃうか。
無料もあるんでね、フリー。
フリーで使えるやつもあるんで、
今じゃあせっかくPaperspaceのページ開いてるし、
登録だけしちゃいますか。
多分Googleアカウントとかで登録できるんでしょう。
サインアップフリー。
どうしようかな。
DigitalOcean、GitHub。
Googleアカウントでいいかな。
GoogleアカウントでPaperspaceに登録します。
多分一瞬で終わるはずだけどな。
あ、なんか電話番号入れたりしなきゃいけないのか。
Japanあるかな。
ないわけないよね。
Japan。
ヨルダンじゃなくて。
あ、あった。
あるけど、ちょっとこの辺は後でやろう。
まあいいや。
とりあえずPaperspaceを使って、
プロプランでお試しでやってみてかな。
やっぱりそれでどうしても
ちょっとVRAM16GBじゃ足りないなみたいな。
だったら高いですけど6000円を払う。
でもね、6000円払うんだったら普通に
ヒッグスフィールドとかの方がいいんじゃないかなって思っちゃいますよね。
まあヒッグスフィールドはヒッグスフィールドで便利だしいいんだけど
どうかね。
難しいところではある。
ヒッグスフィールドってだっていくらだっけ。
今話題のヒッグスフィールド。
あれとか、
料金プランどうなってるんだっけ。
見てよ。
料金。
ベーシックプランで9ドルか。
プロプランで29ドル。
アルティメットで49。
ふぅーみたいな。
ちょっと悩みますよね。
ちょうど39ドルですからね。
間なんだよね。
49ドルっていくら。
それこそ7、8000円とか。
49ドル。
7500円。
ヒッグスフィールドの、
どうかアルティメットプランが契約できちゃうんですよね。
私はいろんな、たくさんの人が使ってると思うんだよ。
ヒッグスフィールド。
なんで、あえて私が契約するメリットあるかなみたいな。
すごい動画が作れるとかね。
だったら私でもいいと思うんですけど。
私そういう感じじゃ多分ないと思うんで。
ロスだったらあんまりみんながやらないようなことをやったほうが、
やる価値ありそうな気がしますけどね。
ローカルで。
実際は1.2.2という動画生成AIを動かしたいというところなんですけど。
ペーパースペースを使って1.2.2の動画生成で、
ペーパースペースの料金が39ドルなら6000円かかってしまいますが、
動画生成自体はもう無制限。
オープンソースなんでね。
いくらぐらいあれば元取れるんだろうな。
39ドル。
6000円。
6000円分以上の動画を生成しないと契約してる意味はないよね。
何本ぐらいになるんだろうな。
ちょっとわかんないですけど。
1.2.2も結構すごい動画生成AIなんで。
コンフィUI、ローカルとかだと動画APIがあるんで。
2.5もあるのか。
1.2.5もあるんでね。
APIでいくらだっけな。
ソラがだって1秒いくらだっけ。
15円とかだったかな。
ちょっと忘れたけど。
なので6000円分か。
ってなると結構そこそこの数の動画を生成しないと元は取れないかもしれないんですが。
動画生成でお仕事とかが取れたらね。
もう全然その返金しなくてもガンガン。
もう39ドルなんてあっという間に多分ペイできると思うんですけど。
言うても6000円だからね、月額。
月に6000円稼ぐぐらいだったらいけそうな気もするけど。
どうでしょうか。
そこは私の頑張り次第によるところが大きいと思いますが。
とりあえず今日はここまでにしたいと思います。
今日の話を軽くまとめると、
コンフィUIの紙ワークフローをローカルで実行してみたらとんでもない目にあったけど、
いろんな経験ができてなんだかんだ勉強になったというお話と、
今後やりたいこととしては、
クエンのワークフローをカスタマイズしてちょっと生成時間を短縮したい。
ペーパースペースというサービスを使ってオープンソースの動画生成1.2を使って動画生成をしてみたいというお話でございました。
興味があるというか、ある程度パソコンが得意な人とかじゃないと途中行き詰まったりすると思うので、
AIに相談しながらとかでもいいという人は、ぜひコンフィUIを触ってみると面白いんじゃないかなと思います。
というわけで、今回はここまでにしたいと思います。
最後にお知らせです。
今後の計画
Kudarajiではお便り大募集しています。
エピソードの概要欄にあるリンクからアクセスして送ってみてください。
SpotifyやYouTubeでお聞きの方はコメントもお待ちしています。
良ければ番組のフォローと評価もよろしくお願いします。
というわけで、今回もここまで聞いていただきありがとうございました。
それではまた次の配信でお会いしましょう。
バイバイ。
32:07

コメント

スクロール