1. 詩吟日本一による「声を鍛えるラジオ」
  2. AI動画の素材作りを5倍早くで..
2026-02-18 07:41

AI動画の素材作りを5倍早くできるようになった方法


---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/5f18a737907968e29d7a6b68
00:05
おはようございます、詩吟YouTuberのheyheyです。 本日3本目ですが、AI動画用の静止画作りですね。 静止画作りの作業時間を4倍以上早めた方法ということでお話ししていきたいと思います。
今、AIを使ってモチベ・詩吟というYouTubeチャンネルをやっているんですけれども、 これが1本の動画あたり、静止画としては40枚から60枚ぐらい作るんですよ。
これをプロンプトを立てて、それでミッドジャーニーに入力して出力してみたいな。 場合によっては、ナノバナナプロを使ったりとかですね。
そんなんで5、60枚作っていくわけなんですけれども、最初の頃はですね、めちゃくちゃに時間かかっていたんですよ。
1枚あたり、本当に早くても5分はいけなかったですね。 10分から15分ぐらいかかっていました。
1時間かけて4枚作るとかですよね。 だから40枚やろうとしたら10時間とかってことになるんで、本当に静止画作りだけでですね、10時間ぐらいが優にかかっていたんですよ。
今はどれぐらいかというとですね、2時間ですね。 3時間はいかないかなっていうところになっています。
なんでそこまで圧縮できたのかっていうところをちょっと今日はお話ししたいと思います。
使うものはですね、チャットGPT、あとはジミニ、どっちでもいいかなと思います。 僕は今チャットGPTのプロジェクト機能を作っていますね。
チャットGPTとミッドジャーニー、あとはナノバナナプロをたまに使うかなみたいな感じですけれども、基本はその2つだけで大丈夫ですね。
順番に頭整理しながらいくんですが、まずですね、ミッドジャーニーで使いたいスタイルを決めるんですよ。スタイル作りですね。
--SREFで数字が何桁、10桁ぐらいの数字っていうので、デザインのスタイルというものを定義できるんですけれども、まずはですね、それをミッドジャーニーの中から探すんですよね。
エクスプローラーのところがあって、そこで例えば和風のやつが探したいなと思ったら、ジャパンとかジャパニーズとかで検索画面に入れて、いろんなすでに作られたデザインがあるんですね。
それをバーッと探していって、お気に入りに入れていくみたいな感じですね。ハートマーク入れてリスト化していくと。
03:06
で、その次に、まあ自分が一番、これはもういいっていうのがあったらですね、そのSREFなんちゃらかんちゃらはもうどこかにコピーしてメモしておくんですよ。
まあその方が早いかなと思うんですが、それがまず前段階になります。これでスタイルですね、デザインのスタイルで悩むことがほぼほぼなくなっていくんですよ。
今まではこんな雰囲気でこんな雰囲気でみたいな、その雰囲気の長々しいプロンプトをですね、毎回メモしておいてそれを貼り付けてみたいな作業をしていたんで、それもまあだいぶやっぱりあの大変だったんですね。
これがまず大前提。で、その次にですね、僕がやっているのは台本をもとに静止画を作っていくわけなんですけれども、台本をChatGPTに与えます。
あなたはどこまで書くかはないですが、あなたはもう有名な敏腕の映画監督です。この台本をもとに一番ここが書くたるところだと、本質的なところだと思える場面を10個抜き出してくださいっていう風にで台本を与えるんですね。
そうしたらまあいい感じの場面をですね切り出してくれるんですよ。ただその時はそんなにあの場面描写はそこまで詳細になっていないので、この10個出てきた場面に対して今度はミッドジャーニーで細かくやりたいので、より詳細でもう高精度なみたいな、そういう形容詞いっぱい入れてですね。
詳細で細かくても素晴らしいような、そういう日本語で描写した場面描写、日本語の場面描写を作ってくださいとそれぞれ。だからこういう風に指示すると10個分の日本語のより細かい場面描写のやつができてくるんですね。
そこまでできたら最後にですね、ではこの場面描写に対してミッドジャーニー用のプロンプト、英語のプロンプトを作ってください。なお最後に先ほど言ったデザインのスタイルですね。
これを最後に入れることでやります。そうしたら10個分の場面のこのミッドジャーニー用のプロンプトが出てくるということですね。
あとはそれを貼って出して貼って出して貼って出してっていう風にやれば、ミッドジャーニーの場合はですね、1回の生成で4枚画像が生成されますんで、同じプロンプトで2回ずつやってもいいですし、1回ずつでバーっと10個分作ってもいいですし、そんな感じで合計40個画像ができてくる。
40個の中から10枚とか15枚とかを選んでみるみたいな感じですね。これをどんどん繰り返していくわけです。どういうことかというと、今10個出したんで、今度はそれ以外のところで重要だと思う場面を10個切り出してください。
06:13
もしくはですね、それを何回か繰り返して10個20個30個みたいに出していって、ではここまでを補足するような補うような精神的メンタル的抽象画とか風景画とかを抜き出してください。場面描写をしてください。
そんな感じでこの台本の中からチャットGPTに切り出して切り出して切り出して、その場面描写を日本語でより詳細にしていってから、英語のプロンプトを作り上げて、あとはミッドジャーニーにばばばばばっと貼り付けていくと。
あとはできたものをもうここから選んでいくって言えばですね、デザインのテイスト雰囲気がだいたい揃ったものもできるし、基本的に70点80点ぐらいのものが一気に作ることができると。
そこからこだわりたい場合はこだわればいいんですけれども、それで大体の大胸ができるんで、今まで10時間以上かかっていたやつが2時間ぐらいで抑えることができたということですね。
これは本当に自分の試行錯誤でできたスタイル。本当に時間ないからどうしたらできるんだろうなっていうのをうんうんと唸っていて、なんとかここにたどり着いたみたいな形なんでですね。
ぜひこのAIで動画を作る際に静止が作るの大変だよという人はですね、なかなかそういう人少ないかもしれませんが、参考にしていただけたらと思います。
ではありがとうございました。バイバイ。
07:41

コメント

スクロール