V1モデルの概要
ブク美
こんにちは。今日はですね、Midjourneyが発表したばかりの新しい動画生成モデル、V1についてちょっと深く見ていきたいなと思っています。
ノト丸
はい。
ブク美
情報源はもちろん、Midjourney自身の6月19日の公式発表ですね。
ええ。
この新しいツールがどんなもので、Midjourneyの大きな構想の中でどういう位置づけなのか、その辺りを探っていきましょう。
ノト丸
そうですね。発表された内容を見ると、中心のアイディアっていうのは、すごくアクセスしやすいんですよね。
Midjourneyで作った画像、あるいは自分でアップロードした画像でもいいんですけど、それをボタン一つで動かせると。
ブク美
ボタン一つで。
ノト丸
ただこれ、単なる機能追加って見るのはちょっと早いかなと。
ブク美
そうなんですか。
ノト丸
Midjourneyはこれをリアルタイムのオープンワールドシミュレーションというかなり野心的な長期目標への第一歩なんだってはっきり言ってるんですね。
ブク美
なるほど。オープンワールドシミュレーションへの第一歩。壮大ですね。
ノト丸
ええ。だから技術をより多くの人に開放していく試みというか、未来への具体的なステップが示されたって感じですよね。わくわくします。
ブク美
それはわくわくしますね。具体的にはどうやって使うんですか、そのイメージトゥビデオのワークフロー。すごくシンプルだって話ですけど。
ノト丸
はい。画像の下のアニメイトボタンを押すだけっていうのは本当なんですか。まさにその通りなんです。基本的な使い方は本当にそれだけ。
さらに面白いのが、自動アニメーション設定っていうのがあって。
ブク美
自動ですか。
ノト丸
これはもうシステムがよしなにやってくれるみたいな。
よしなに。
ノト丸
画像の内容とか雰囲気を見て、多分これがいいだろうっていう動きを自動でつけてくれるんですよ。とにかく動かして楽しんでっていう感じですね。
ノト丸
もちろんもっと細かくコントロールしたいっていう人のために、手動でプロンプトで支持するオプションも一応あります。
ブク美
自分のイメージがそんな簡単に動き出すなんて、いやこれはすごい可能性を感じますね。
あなたが作った幻想的な風景画とかどんな風に動くんだろうって想像しちゃいますよ。
ノト丸
そうですね。試してみたいですね。
ブク美
ただ自動だと思った動きにならないみたいなこともありそうですけど、その辺はどうなんですかね。
ノト丸
そこですね。そこを調整するのが高モーションと低モーションっていう設定なんです。
ブク美
高モーションと低モーション。
ノト丸
低モーションはカメラの動きが少なくて被写体がゆっくり動くみたいな落ち着いたシーンに向いてますね。
なるほど。
ただ思ったより動きが少なくてほとんど静止画みたいになっちゃう可能性もなきにしもあらずというか。
ブク美
ふむふむ。じゃあ逆に高モーションを選ぶと?
ノト丸
もっとダイナミックな動き。被写体もカメラも全体的にワーッと動いてほしいみたいな時に選びます。
ただこれも発表で言及されてるんですけど、予期せぬ不自然な動き、いわゆるwonky mistakesってやつですね。
ブク美
あーなるほど。
ノト丸
例えば手足が変な方向に曲がっちゃったり、物がぐにゃっと変形したり、そういうのが起きる可能性もちょっと高まる。
ブク美
うーん。トレードオフがあるわけですね。
ノト丸
そうなんです。どっちがいいかは本当に作りたいもの次第という感じですね。
ミッドジャーニー自身もこれがまだ技術的な挑戦の途中だってことはわかってて、V1はあくまでスタート地点だと。
あと外部からアップロードした画像も動かせるっていうのは結構大きいポイントだと思います。
未来への展望
ブク美
確かにミッドジャーニーもこのツールの楽しさみたいなのをすごく強調してますよね。
ノト丸
ええ、してますね。
ブク美
でも古い世界も新しい世界も突然生き生きとさせるっていう言葉にはなんか単なる遊び以上の深いものを感じますね。
クリエイティブな探求心みたいな。
ノト丸
そうですね。その創造性を今度は実用面、コストの面から見てみるとですね。
ブク美
あ、コスト気になります。
ノト丸
画像生成コストの約8倍だそうです。
ブク美
8倍か。でも。
ノト丸
でもこれ既存のプロムカの動画生成ツールと比べるともうびっくりするくらい手頃なんですよ。
へえ。
発表では1秒あたり画像1枚分のコスト感って言ってるんですけど、計算すると市場の他のツールよりなんか25倍以上安いみたいな感じになるんです。
ブク美
それはすごい。かなりアクセスしやすいですね。
ノト丸
ええ。まずはウェブサイト限定で始めて利用状況を見ながら調整していくと。
うん。
あとプロ以上のサブスクライバー向けには動画生成用のリラックスモードのテストも計画してるみたいですね。
ブク美
リラックスモード。
ノト丸
手頃な価格で誰もがこういう高度な技術を探求できるようにするっていうミッドジャーニーの哲学がここにも出てるなと。
ブク美
そしてこれ単発の機能追加じゃなくて連続した開発の一部なんですよね。
ノト丸
その通りです。
ブク美
今回の動画モデル開発で得たことって今後の画像モデルの改善にはいかす計画があるとか?
ノト丸
ええ。そうなんです。
動画、それから3D、リアルタイム、これらを個別のピースとして開発して最終的に全部統合して一つのシミュレーションシステムを目指してるっていう。
ブク美
まさに壮大なジャーニーの一部ってことですね。
ノト丸
ええ。まさに。個々の技術開発がその大きな目標につながってるっていうその視点が大事だと思いますね。
ブク美
というわけで今回のポイントをちょっとまとめますとミッドジャーニーはまず簡単で、そして何より楽しいV1動画ツールを出しましたと。
はい。
で、これは彼らが目指す野心的なリアルタイムシミュレーションの世界への具体的ですごくワクワクする第一歩なんだということですね。
ノト丸
そうですね。
ブク美
さてリスナーの皆さんはどんな画像に命を吹き込んでみたいですかね。
ノト丸
最後にもう一つだけちょっと考えてみてほしい問いがあるんですが。
ブク美
何でしょう。
ノト丸
発表の中でリアルタイムのオープンワールドシミュレーションが必然的な到達点とまで言われてるんですよ。
ブク美
必然的ですか。
ノト丸
単に画像を動かすっていうレベルを超えてですね。
デジタルの世界の創造とかインタラクションがこれほど流動的で即時的になる未来っていうのは我々にとって一体どういう意味を持つんだろうかと。
ブク美
深いですね。
ノト丸
それは物語の語り方とかデザインのプロセスとかあるいは私たちが現実をどう捉えるかということ自体にどんな変化をもたらす可能性があるのか。
なるほど。
その先の展開を想像しながらぜひ考えてみていただけたらなと。