1. Kudo's Radio -クドラジ-
  2. 【Sora 2 Pro】ComfyUIに公式..
2025-10-09 21:40

【Sora 2 Pro】ComfyUIに公式のAPIテンプレートが登場!!

spotify apple_podcasts youtube

がんばれWan!!🔥

🔻お便りフォーム https://forms.gle/pchkKUYQhBTRZRQ69

🔻音楽生成AI Suno https://suno.com/@kudo_ai

🔻AIイラスト - Kudo https://www.artstation.com/kudo_aiart

🔻音声ライブ配信:アニボッチステーション https://stand.fm/channels/60ce14cbfa2e548a3cc824e9

🔻アニボッチDiscordコミュニティ ⁠https://discord.gg/gM3UDWnuMW

ーーーーーーーーーーー

以下、広告リンクを含みます。

🔻マイク SHURE MV7 https://amzn.to/4lEwNc8

🔻オーディオインターフェース ZOOM Podtrak P4 https://amzn.to/4ijYi7G

サマリー

本エピソードでは、AIによる画像生成と動画生成に着目し、特にConfig UIにおけるソラ2とソラ2プロの公式APIテンプレートについて詳しく解説しています。AIの進化と、それを活用したクリエイティブな作業の利便性に注目しています。ComfyUIには公式のAPIテンプレートが導入され、動画生成に関する新しい料金体系が紹介されています。また、Paperspaceを利用してローカル環境で動画生成を行う可能性についても言及されています。

AIとクリエイティブな作業
どうもみなさん、Kudoでございます。
この番組は、年間でアニメ200作品以上、漫画300作品以上、そしてゲームもたしなむ私、Kudoが、アニメや漫画やゲームの話をしたり、しなかったりする番組です。
本日は、2025年10月9日、木曜日、現在時刻は18時3分でございます。
今日も1日お疲れ様でした。
明日はついに金曜日ですね。
まだあと1日は残ってはいますけど。
今週はあれか。
明日金曜日で、来週の月曜日が確かスポーツの日か何かで休みじゃなかったっけ?
13日の月曜日はスポーツの日でお休みということで3連休ですね。
やったね。
何かやること決めてますか?
私は、とりあえずゴーストオブ予定を進めたいのもあるけど、今はですね、今日もAIの話をするんですけど、画像生成とか動画生成かな。
コンフィUIを触るっていう感じには多分なるかなと思います。
まだあと1日あるんで、3連休のために頑張りましょう。
ということで、今日の話はAIの話でございます。
ここ最近もAIの話しかしてませんが、許してください。
今後はAIの話を多めにいこうかなとは思ってるんですよね。
アニメとかももちろん見てるし、ゲームもゴーストオブ予定やったりしてるんですけど、何が聞きたい?
みんなが何を聞きたいかちょっといまいちわからないので、その都度面白い作品とかアニメだったらあれば話すぐらいの感じで。
基本は今までと同じか、興味があることがあれば話していくって感じなんですが、今私の中で一番ホットな話題はやっぱりAI。
特に画像生成とか動画生成かな、コンフィギュアというツールにはまってるわけなんですけど、そこに関連していくお話かなと思います。
YouTubeとかその他XとかいろんなところでそういったAIの情報は溢れてるとは思うんですけど、
私なりに得た情報とか今こんなことやってますよとかあればちょっと共有していけたらなと思ってます。
前はこのエピソードのカバーアートなんかをAIで作ったりしてたんですけど、ちょっとそれも再開してもいいかなとか思ったりしてますが、
ちょっとその辺はどうなるかは私の気分次第なところがありますので、
カバーアート変わってたら気分が良くなったというか気分が乗ってるんだろうなと思っていただけたらいいと思います。
ソラ2プロのAPIテンプレート
今日は昨日に引き続きまたソラ2のお話でして、
毎日毎日アップデートというか進化しているなとつくづく思うんですけど、
前回はオープンAIのソラ2にソラ2プロが登場して、
しかもAPIが一部展開されているという話をしたんですけど、
今だとヒッグスフィールドとか他の動画生成プラットフォームはちょっとわからないですけどサービス名は。
ヒッグスフィールドが結構ソラ2の動画作れますよみたいな話題になってましたけど、
いよいよAPIが公開されていろんなところで生成できるようになったんですけど、
なんと私が愛してやまないConfig UIというオープンソースのツールがあるんですけど、
そちらでもついにテンプレートとしてソラ2およびソラ2プロかな、
多分そちらもいけると思うんですけど、もう使えるようになりましたというお話を今日はしたいと思います。
今日はそれがまとめみたいなものなんですけど、
ここから何を話していくかというと、実際にそのテンプレートをちょっと開いているので、
それを見ながらどれぐらい金かかるのかなとかっていうのをちょっとお話できたらなと思っております。
Config UIを使ったことがない人からしたらちょっと新聞刊文かもしれないんですけど、
動画生成もできる、画像生成もできる、3Dモデルとか音声も作ったりできる、
クリエイティブなことを大体何でもできるみたいなイメージでいいかなと思います。
オープンソースで作られていて、ノードと呼ばれる一つじゃないんですけど、
いろんな機能をまとめたものが箱みたいなものがあって、それを線と線でつないで最終的な出力結果、
今だったら動画とか画像とかっていうのを作っていくっていうものなんですけどね。
そこに新たにテンプレートがかなりたくさん用意されておりまして、
いきなり画像とか動画生成したいってなって何したらいいか分からないっていう人はこのテンプレートから触ってみるといいんですけど、
そこに動画APIとか画像APIとかっていうAPIを使って画像を作ったり動画を作ったりできるテンプレートがあるんですけど、
そこの動画APIのところに新たにソラ2 Text and Image to Videoというのが追加されています。
サムネの動画みたいなのが載ってるんですけど、キリンが空中でくるくる回転してるみたいなサムネがついてて、かなりリアルな動画が作れるということなんでしょう。
実際に開いてみると意外とシンプルというか、API関係はなんだかんだシンプルです。
動画の処理自体はAPIなんで、自分のパソコンで処理するわけじゃないので、
なので専用のノードに必要なデータを送ってしまえば、あとはそこから動画が作れるという感じなんでしょう。
このノードでいくと、画像と、あとはモデルを選択する必要があるんですけど、
モデルはソラ2とソラ2 Proというのを選べて、あとはモデル選択でプロンプトを入力する。
プロンプトは命令ですね、どんな動画にするのかというやつ。
あとはサイズ、縦横のサイズね。縦横のサイズは720×1280と、あとはその反対1280×720。
あとはもうちょっと大きい1024×1792、その反対の1792×1024といった4つから選べるみたいです。
デュレーション、これは動画の長さですね。動画の長さは4秒と8秒と12秒という、4秒ごとに選べるみたいですね。
あとはシード値があって、生成後の制御、ランダマイズ、これは多分シード値の話ですね。
という感じなんで、基本はモデルを選んでプロンプトを入力して、あとサイズと長さを調整、設定するだけなんで非常に簡単です。
非常に分かりやすいものかなと思います。
API料金と便利さ
あとは画像ね。テキストだけでも多分生成できるんですけど、最初の動かしたい画像みたいなものがあればアップロードしておくと、その画像を動かす形になっていくというふうになると思います。
ノード自体は本当に7つぐらいでしか構成されていないので、本当シンプルですね。分かりやすいかなと思います。
これがローカルで動画生成やりたいとか、画像生成やりたいってなると大変ですよ。
チェックポイントをロードしてきて、クリップっていうやつ使ったりとか、テキストエンコーダーとかね、ローラ挟んだりとか、あとKサンプラーとか、VAEがどうたらとか、その辺はややこしいんですけど。
APIなんで非常にシンプルかつ簡潔に出来上がっております。
英語でいろいろ説明が書いてあるんですけど、ここはいいでしょう。
実際に生成はしないですよ。ちょっと高いので。
あと、このConfig UIのいいところは、APIで生成したりすると、API料金を払う必要があるんですけど、APIって聞くとちょっととっつきにくいなと、どうやって使ったらいいのっていう方いると思うんですけど、
本来なら、例えばオープンAIならオープンAIのAPIを自分で取得してきて、支払い方法を設定して支払うみたいなことをやる必要があるんですけど、Config UIもアカウント登録してアカウント上でチャージができるんですよね。
設定からいけるんですけど、ユーザーの下にクレジットっていうところがあって、そこに要はクレジットを購入するところがあって、5ドル、10ドル、20ドル、50ドル、あとは100ドル以上。
100ドル以上っていうか、自分で細かく設定してクレジットを購入することができます。
Config UI上でクレジットを購入しておけば、あとはオープンAIのソラのAPIだろうが、あとはGeminiのNanobananaのAPIだろうが、ByteDanceのSeaDreamだろうが、どのAPIでもそのクレジットから消費されていくっていう形になるんで、そこが非常にConfig UIの便利なところかなとは思います。
私は1ドルもチャージしてないんですけど、使ってから説明しろよって感じかもしれないんですけど、ゲチなんで。
ソラの話に戻りますけど、API料金ですね。ソラ2の場合、ソラ2でサイズが720×1280で、時間では秒数一番低く4秒とかにしましょうか。
APIテンプレートの導入
で、生成するとお値段0.4ドルかかります。今いくら?0.4ドルって。いくらだ?61円ぐらいですね。
61円。1動画ですね。生成するのにかかりますと。
で、例えばこの12秒、3倍の時間にすると、当たり前ですけど1.2ドル。3倍になったよね。そうだね。シンプル計算で1.2ドル。
だからいくらぐらい?3倍だから183円とかかな。だいたいね。かかるかなというところですね。やっぱり高いのかな?どうなんだろう。
もちろんAPIなんで気をつけてほしいのは、クレジットがなくなるタイミングで通知が来ると問題だと思いますけど、ConfiUIの場合はチャージしてから使うというパターンなんで。
他のAPIサービスだと、APIだと気づかなくてガンガン使ってたら後からすんげえ金額請求されたみたいなことがあったりするんですけど、ConfiUIはそのへん心配ないと。
ただクレジットが消費されていくのは変わりないんでそこは気をつけてください。
ちなみに一番高いのは何かというと、ソラツープロですよね。
ちなみにソラツープロにしたんですけど、ソラツープロで720×1280で長さ12秒にすると3.6ドル。
なんで何倍だ?1.2の3倍かこれも。
ソラツープロになった途端に急に料金が3倍に跳ね上がると。さらに3.6ドルです。
3.6ドル?180円の3倍だから480円ぐらいか。
480円。12秒の動画で結構上がってきますよね。
さらにさらに画質をですね1段階上げて1024×1792にするとこれがですね6ドル。
あれさっき何円だったっけ?ちょっと待って。
6ドルか。違うな。3.6、2.4ドル上がってるのかな。
今度6ドルですね。ぴったし6ドルになります。
これは一番高いのか。そっかそっか。
デュレーション今一番長い12秒にしてるんでソラツープロで1024×1792、一番高画質の動画を12秒一番長く生成しようとすると6ドルかかります。
6ドルは結構高いぞ。6ドルは約1000円だね。
916円なんで。
まあね、やっぱ高いっすね。
1024×1792ってフルHDぐらいのサイズか?
1080×1920とかだよねフルHDって確か。
フルHDには満たないけどそれぐらいの大きさか。
動画を12秒生成しようとすると約900円ちょっとかかるというところでございます。
これが高いのか高くないのかは感覚にもよるとは思いますけど。
ヒッグスフィールドとかだと画質落とさなきゃいけないけど無限生成できるみたいな話聞きましたけど、おそらくこの1024×1792では生成できないんじゃないかな。
秒数とかも。4秒とかじゃない?できても。
なんじゃないかなと思いますけど。
さすがにこの一番設定値が高い状態で無限生成は多分できないと思うので、クレジットがなくなるかまたクレジット買わなきゃいけないかみたいな感じになるんだと思うんですけど。
やっぱ高いは高いと思いますよ。私は高いと思うけどね。
作った動画でそれ以上のリターンが得られるんであれば全然いいと思うけど、1000円くらい。
その動画で1000円くらいのお金が稼げるんだったら全然ガンガン買っていいと思うけど、私の場合はちょっときついかなっていう感じですね。
なので個人的にはやっぱこれいずれ話そうかなと思ってましたけど、Paperspaceっていうですね、Googleコラボと似たようなサービスがあって、クラウドでGPUを借りることができるサービスなんですけど、
そちらを使うことでローカルというかオープンソースの動画生成のモデルを使って動画をガンガン作ることができるという方法があるんですけど、
それを使って1.2.2とかで動画を作る方がAPIを使わないので、Paperspaceを契約するお金はもちろんかかりますけど、そこだけ払っておけばあとは環境の中で動画生成し放題になると思うので、
個人的にはそこをちょっと今やってみようかなとか考えてたりするんですけどね。結構オープンソースの方の動画生成のクオリティもかなり上がってきてるっぽくて、実際やってないんでわかんないですけど、
それこそこの3連休とかでちょっとやってみたいなと思ってるんですよ。動画生成は今日話したようにコスト面で手が出せないなって思ってたりしてて、
動画生成は画像生成は自分のパソコンの環境でローカルで何とか動かせてるんですけど、動画はちょっとチャレンジしたことあるんですけど、前にチャレンジしたんですけど全然動かないの。
しかもパソコンがすっげーにフワーってパンがすっげー回るみたいな。すごいパソコンに無理させてる感があって、これはちょっとローカルじゃ無理だなと思ったんで、
そういうGoogleコラボとかペーパースペースみたいなクラウドのGPUが使えるサービスを利用することで動画生成とかもオープンソースのやつを動かしてガンガン生成できたらなと思っています。
そういうことを企んでるという話でございました。そんなところかな。とりあえず今でもOpenAIのソラン2のAPIが公開され始めていて、いろんなところでソランのアプリを使わなくてもウォーターワークとか無い状態で生成できるっていう環境が整いつつあるので、
触れる環境があるんであれば触ってみると面白いんじゃないかなと思います。私は私でさっき言ったようなペーパースペースとか1.2.2とか使って、なんとか動画生成できる環境を整えたいなと思ってるんで、
その辺なんか引き続きちょっと情報というか進展があればまたKudorajiでお伝えしたいなと思ってますんで、よかったら聞いてみてください。というわけで今回はここまでにしたいと思います。最後にお知らせでございます。
動画生成のコストと手法
Kudorajiではお便り大募集しています。エピソードの概要欄にあるリンクからアクセスして送ってみてください。SpotifyやYouTubeでお聞きの方はコメントもお待ちしています。
よければ番組のフォローと評価もよろしくお願いします。というわけで今回もここまで聞いていただきありがとうございました。それではまた次の配信でお会いしましょう。バイバイ。
21:40

コメント

スクロール