1. 詩吟日本一による「声を鍛えるラジオ」
  2. 111/600:自己流!Midjourney..
2026-02-03 09:46

111/600:自己流!Midjourneyで欲しい画像を爆速生成する方法


---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/5f18a737907968e29d7a6b68

サマリー

今回、彼はMidjourneyを利用して効率的に画像を生成する方法を紹介します。特に、吉田松陰をテーマにした画像作成の手法や、その過程での工夫について詳しく説明します。

画像生成の基本
おはようございます。詩吟YouTuberのheyheyです。
600日後の脱サラに向けて111日目ですけれども、今日はですね、
Midjourneyで求める画像を爆速で作る方法ということで、今自分が実際にやっている手法をですね、
今日発明ということじゃない、多分やっている人は全然いると思うんですけれども、
あ、これでいけばいい感じに生成が進むぞというのがですね、
多分通常の今まで僕がやってたやり方の3倍ぐらいは早く作れるなというのがわかったので、
それをですね、ここに残しておきたいと思います。
今このモチベ詩吟という新しいYouTubeチャンネルでですね、
監視の背景、人間ドラマみたいなところから歌に合わせていって、最後詩吟をやるというYouTubeチャンネルをやっているんですけれども、
これに対してですね、毎回60枚ぐらいの画像を作って、
それをちょっと動かして、それを繋ぎ合わせるという形でですね、AI動画というものを作っております。
ただこの60枚の静止画を作るのがなかなかに大変でですね、
どんなプロンプトがいいんだろうかというのをこの台本から考えて、
そこから自分とかAIと壁打ちしたりとかですね、
それでプロンプトを作って、そこからさらに人物のキャラクターの画像を読み込ませたり、
あとはそのデザインテイストですよね、いい雰囲気とかいいオシャレな感じとかですね、
それにさらに史実のものを掛け合わせたりして、より説得力のあるようなものを持たしたりとかやっているとですね、
1枚早くても10分とか遅ければ15分とかかかるとかですね、やっていたんですよ。
でもそんなやっていたら本当に日が暮れてしまうので、何かいい方法はないかなーってうんうんと唸って考えておりました。
プロンプト作成の手法
2本目の、2作目の時は正直あんまりまだ確立してなかったんですけれども、
3作目今やっていてですね、これならいけそうだと、実際に出力できているというのがあったんで、これをお話ししていくというところです。
使うものとしてはまずMidJourneyですね。
MidJourneyとChatGPTだけでいけるかな、いけますね。
Nanobanana Proもちょっと作っていたんですけれども、
Nanobanana Proやりすぎるとバナナ味が強すぎてですね、チープな感じになるから、やっぱりちょっとあまり使わない方がいいなーっていうふうに思えてきました。
で、実際の作り方なんですけれども、
まず台本がありますよね。
その台本について、
吉田松陰今回やってるんですけど、吉田松陰と台本読みについてですね、渡して、それをディープリサーチさせておきますね。
どういうふうにいこうかな、台本を渡しておくと、台本を渡しておいて、あなたが映画監督であった場合、この台本をもとにどんな場面が必要不可欠だと思うか、
10個の場面を切り出して、それを日本語で詳細に描写してくださいという感じですね。
まず出させます。
そうしたらですね、いい感じの場面を10個切り出してくれるんですね。
ただその時に、歴史の専門用語とか固有名詞とかがわんさが出てくると、それをプロンプトに投げた場合に難しくなるんですね。
そういう場合は固有名詞とかそういったものはなしで、AIが生成しやすいような言葉として詳細に描写してくださいという、そういう形でまず10個の場面を日本語で出していきます。
その次にですね、もう一個準備が必要なんですけれども、やはり主人公となる人物とか人物の三面図を作っておく必要があります。
だから僕の場合は吉田松陰の画像をですね、読み込ませて、そこからこのAI用にちょっと和風な感じとか浮世絵っぽくとか水墨画風にみたいな感じで、これはチャットGPTの中でですね、その中で画像生成させていきます。
読み込ませた上で、これをこんな風にやってみてと。で、いい感じのテイストができたら、これを三面図、全身の三面図と顔を拡大したものを、それを一枚の画像にまとめたものを出力してくださいとやっていくと。
で、人物ができたらですね、今度はそこから年齢で何パターンかあるとやっぱりいいかなと思いますね。これをじゃあ20歳のバージョン、10歳のバージョン、50歳のバージョン作って。
吉田松陰50歳じゃなくなってないんですけれど、30代でなくなってますからね。
なんですけれども、そんな感じでこのキャラクターの素材を持っておくというところですね。
で、さらにあともう一個用意が必要なんですけれども、ミッドジャーニーにおけるスタイルですね。デザインのスタイルを決めておく必要があると。
で、これは本当に自分で一から希望するものをですね、作っていくというのもできなくはないんですけれども、やっぱり一番早いのはリサーチというか、検索バージョンですね。検索モードでこのスタイルリファレンスをですね、探していくと。
こういうデザインテイストいいかもしれないなっていうのを何個かお気に入りしておいてですね。
それで、ハイフン、ハイフン、スレフっていうかSREFで数字の羅列がバーっとあると。そういうコードを使っていくと、最後にそれを入力するだけでですね、そういうデザインテイストになるというやつがあるんですよね。
もう口頭で何言ってるかわからないと思うんですけれども。だからこのキャラクタリファレンスのコードをですね、自分なりにこれは良さそうだというものを3つ4つぐらい持っておくんですよ。
で、ここまでいったら準備がだいたいできたんでですね、この場面を切り取った詳細描写の日本語描写があるんで、今度はこれをミッドジャーニー用の英語プロンプトに置き換えてくださいと。
で、ついでに言うと16対9にしてほしいし、あとはその4つあるキャラクタリファレンスのコードがあるんですね。最後にこれを必ずつけてくださいというのでやってみると。
そうしたらその詳細描写の英語プロンプトプラスこのキャラクタリファレンスのデザインリファレンスかな。スタイルリファレンスか。スタイルリファレンスのやつが10場面分出てくるんで、それをミッドジャーニーのプロンプトのところにポンと貼り付けていく。
効率的な運用方法
それに加えてこの3面図ですね。今回吉田松陰のキャラクターの3面図をオムニリファレンスだっけな。オムニリファレンス。一番右のやつです。キャラクターを読み込ませるという、キャラクターを参照させるというリファレンス機能があるから、そこに吉田松陰のその3面図を入れておく。これでもうok。
準備って言うほどですね、今結構ややこしいことを言ったように思いますけれども、何らかんだ準備。15分ぐらいあれば十分にこの準備は完成します。早ければ5分10分で完成すると思うんですけれども、これができたらですね、あとはこの10個のプロンプトをベンベンベンベンとやっていて、ひたすらミッドジャーニーでバンバンバンバンと4枚ずつ出力されるから、それだけで切り張りしたらまず40枚分ができてくると。
まあでもその中から1枚ずつ選ぶんですね。そういうのがあると。じゃあ他にさらに必要だと思う場面も同様に場面案作ってやっておいて、バンバンバンバンと作っていく。この人物がいる場合もあれば人物がいないバージョンも作ってください。建物描写とか心象風景とかですね。そういった場面でじゃあ10場面作ってくださいっていう風に、もう一回出力させて出てきた英語のプロンプトをベンベンベンベンとキャラクターリファレンスを入れておいてロックしておくとかですね。
そんな感じでやるとめちゃくちゃに早いですね。めちゃくちゃに早いから、あとはこのガーッと出てきたやつの中から台本に良さげなやつをひたすら当てはめていくという。それで静止画が一通りできるかなというところです。
本当に多分自分の体感3倍ぐらいは早くなったような気がするんですよね。これでこの後ですね、ガーッと作ったんで剪定していって、今度は動画化していく必要があるというところですね。動画化はまだ言うほど僕ノウハウ持っていないんで、11ラボの中のクリングを使ってますかね。
クリング2.6が程よく使いやすくていい気がするんですけど、そのあたりもノウハウがたまったらいいかなと思ってます。やっぱりAIは本当に使いようによって全然速度早まるから時間がない人ほど頑張れる余地があるなぁと。
ただ効率化するためにやるというよりは自分の中で追い込んでいかないといけないですよね。自分にはこれだけしか時間がない。その中でまず無理くりやる。そこからさらにもう一個プラスアルファやれることはないかみたいな風に考えていった方が自分にマッチした効率的なやり方が見つかってくるし、それがやっぱり血肉になっていくのかなというのが今まさに感じているんですね。
今日はこんな感じでミッドジャーニーで爆速で欲しい画像を作っていく方法というのはお話しさせていただきました。誰の参考になるかわからないですけれどもこんな感じで終わりたいと思います。ではバイバイ
09:46

コメント

スクロール