#6 OpenAIが動画生成AIのSoraを発表！ついに真打登場か？🕺

OpenAIが動画生成AIのSoraを発表

皆さんこんにちは、矢野哲平です。

このポッドキャストは、無料で学べるAIスキル、ロボシンクが運営する番組です。

耳で学ぶAIをコンセプトに、初心者向けにAIのトレンドや可能性を深掘りしていきます。

今回のテーマは、OpenAIが動画生成AIのSoraを発表、ついに真打登場かについて話していきます。

ということで、今回は、OpenAIが開発した動画生成AIのSoraについて話していきます。

Soraが作成した動画、見ましたでしょうか?

まだ動画を確認していない人は、WBS、ワールドビジネスサテライトのYouTubeチャンネルがSoraを紹介している動画があるので、こちらをご覧になってください。

私もSoraが発表してから公式サイトで見たんですけど、すごいですね。

パッと見た感じ、既存の動画生成AIと比べてもかなり精度の高い印象を受けます。

例えば動画生成AIの弱点で言うと、一見してわかるAIっぽさであったりとか、動画が破綻している部分があるんですね。

そういったものが、Soraはかなり少なくなっている印象を受けますね。

動画によっては、これは本物とちょっと見分けつかないなという動画もあります。

個人的に驚いたのがですね、ワールドビジネスサテライトのYouTubeチャンネルでも取り上げられてたんですけども、国内の大手のニュースメディアが取り上げたことをですね、

動画生成AIって他にも色々あって、例えばですね、Runwayなんかが有名なんですけど、国内のニュースメディアがですね、

それこそWBSでもそうですし、あとはYahooニュースとかでも見かけたんですね。

国内のニュースメディアが動画生成AIを取り上げたことって過去なかったように思うんですね。

それだけオープンAI、チャットGPTの会社ですね、がリリースした動画生成AIということで、注目度の高さが伺えます。

ここからソラの特徴について話していきたいと思うんですけども、

シンプルにですね、ソラはテキストtoビデオの動画生成AIですね。

これは何かというと、テキストtoビデオ、人間ですね。

人間がテキストでAIに指示をして、そのテキストの内容に沿って動画を生成するというようなサービスになります。

Soraの特徴

ちなみにですね、基本のベースはそのテキストから動画を生成するというものなんですけど、

イメージtoビデオやビデオtoビデオ、つまり画像や動画からも動画を生成できるというようなものになります。

例えばですね、やっぱりテキストから動画を生成するのも場合によっては使いやすいんですけども、

既存の画像から動画を生成するというのが非常に使いやすいので、

そういった意味でもソラですね、使いやすいのかなと思ったりします。

例えばビデオtoビデオ、つまり動画から動画の生成ができるようになると、

サンプルでこれすごいなと思ったのがですね、山の中を失踪するスポーツカーの風景を撮った動画があるんですね。

スポーツカーが山の中をバーッと失踪するような動画ですね。

それを空にかけて周りの山の風景をジャングルに差し替えているというようなサンプルがあるんですね。

こうすることで山の中を走っていたスポーツカーがジャングルの中を走っているという、そんな動画を作ることもできます。

空で作れる動画の長さが最長1分ですね。

これは他の動画生成AIのサービスと比べても長いですよね。

例えば他の動画のサービスとかだとですね、4秒が平均なんですね。

これなぜかというと動画生成AIって生成する時間、動画の時間ですね。

動画の時間が長ければ長いほど破綻が多くなってくるんですね。

なのでそういった意味でも動画の時間が長いというのはそれだけでもちょっと驚いています。

サイズに関してなんですけども縦型の動画も作成できるようです。

というかですね、様々なアスペクト比に対応しているみたいです。

アスペクト比っていうのは縦と横の比率ですね。

例えば各デバイス、スマホであったりとかパソコンにあったりとかっていう、そういった動画を生成可能です。

つまりですね、YouTubeとかだと横長の動画が一般的ですよね。

一方でYouTubeショートやTikTokですね、縦長の動画が主流なんですけど、

そういったサービスにも空はですね、使えそうですね。

あと他の機能で言うと動画のつなぎができるという、これですね。

ちょっとサンプルを見ないことには凄さがなかなか伝わりにくいと思うんですけど、

私が見たサンプルだとですね、ドローンがヨーロッパのレンガの街並みを飛んでいる動画があるんですね。

その飛んでいるドローンが途中でいきなり蝶々に変わるんですね。蝶に。

そこからヨーロッパの街並みを蝶がドローンのようにですね、失踪、隔空って言ったらいいんですかね。

飛んでいくんですけど、そのヨーロッパの街並みもいつの間にか珊瑚礁に変わって、

今度は海の中の珊瑚礁を蝶が飛んでいるという、なんとも不思議な動画が出来上がるんですね。

これはソラの機能を使って動画と動画を繋いでいる、合成しているような機能ですね。

サンプルを見るとですね、既存の動画生成AIとは比べ物まではあれですけど、

かなり品質が高い動画が生成できているわけなんですけども、

公式の説明によるとソラはユーザーのプロンプト、つまりユーザーがソラに対して支持する内容ですね。

テキストなどで支持する内容、そういったその支持の内容の文脈を理解して、

あとは物理的な世界でどのように起こるのかというのも理解しているという、

これによって高精度な動画生成が可能ということで公式サイトで歌っています。

動画生成AIの進化

あとはチャットGPTの会社OpenAIですね。

そのOpenAIが提供しているDARI3という画像サービスや、あとはGPTモデルですね。

それにおける過去の研究をベースにしているという、

そのDARI3の技術やGPTモデルの技術をソラに適用しています。

同じ会社なので当然と言えば当然なんですけども、

そういった技術をソラに使っています。

実際に動画を見ると見分けがつかない、現実のものと見分けがつかない動画がたくさんあるので、

やっぱりこれは他の生成AIに比べても高いクオリティかなと思います。

ただしですね、全部が全部現実を間違うような動画のクオリティまでは届いてない部分ももちろんあります。

ただ単純にすごいですよね。

OpenAIがソラを発表したことで動画生成AIの技術が大きく前進した感はあります。

個人的な予想なんですけど、画像生成AIのDARI3と同じようにですね、

いずれはチャットGPT上でソラが使えるようになるのではと予想しています。

ここまでですね、ソラの話をするとですね、

使いたいですよね。私も使いたいです。

ただですね、残念な話なんですけど、

現時点ではまだ一般の人は利用できないそうなんですね。

期待を込めてですね、2024年中には使えるようになるのではないかと思っています。

今が2月なので、2024年にはですね、ソラがリリースされると思います。

ただ、過去のDARI3なんかの事例を見てもですね、

チャットGPTの有料プランに加入している人じゃないと使えないのかなとは思います。

ちょっといろいろソラの特徴を話してきましたが、

ここで一旦特徴をまとめると、

まずはテキストや画像、動画から動画を生成できるサービスですね。

アスペクト比も柔軟に対応可能、縦横サイズも柔軟に対応可能ということですね。

次に最長1分の動画を作成できるですね。

あとはプロンプトを理解して、物理的な世界も理解していると、

そのため高品質な動画ができるというサービスですね。

ソラが発表されてですね、大手のニュースメディアなんかでも取り上げられてですね、

動画生成AI界隈、役者が揃ってきた感じはありますよね。

例えばオープンAIのソラですね。

あとはGoogleのルミエール、これも2024年になって発表された動画生成AIですね。

あとはメタ、Facebookの会社ですね。

今は名前が変わってますが、メタのMビデオ。

あとはバイトダンス、これはTikTokの親会社ですね。

バイトダンスのマジックビデオV2。

あとはスタビリティAI、これはステイブルディフュージョンなんかで有名な会社なんですけど、

そのステイブルビデオディフュージョン。

あとは一番動画生成AIで話題を引っ張ってきたランウェイのGen2ですね。

あとはピカラボ、今ピカ1.0ということでリリースしている動画生成AIですね。

これもともと大手のIT企業っていうのは動画生成AIのジャンルに参入してなかったんですよね。

GoogleとかオープンAIとかですね。

2023年あたりくらいからですね、大手の参入も目立つようになってきて、

あとは2024年になってから、まだ2月なんですけど、

Googleがルミエールという動画生成AIを発表して、

そして2月のついこの前ですね、オープンAIがソラを投入してきましたという。

いきなり2月、今年2024年になって動画生成AIのジャンルがですね、

にわかに活気づいてきたかなという感じはあります。

ちなみにですね、現在ソラとルミエールっていうのはまだ使えない状態なんですけど、

私がメインに今使っているのはGen2とピカですね。

クオリティの面で言うとGen2がリードしているかなと思います。

両者ともですね、制限はあるんですけども、どちらも無料で試せるので、

興味のある方はぜひ試してみてください。

テキストや画像をですね、AIに投げて、そこからこう動画を作るというプロセスはですね、

今まで自分が人生で生きてきた中で初めての体験だったので、

これハマる人はハマるんじゃないかなと思います。

ちなみにですね、ピカの学習講座というのをロボシンクで無料公開しているので、

興味のある方はですね、ぜひそちらを覗いていただければと思います。

概要欄にリンクを貼っておきます。

動画生成AIの今後について

動画生成AIの今後について考えというか、ちょっと話をすると、

まずですね、CGやゲーム、映像制作で大きく影響が出てきますよね。

CMや動画広告でも影響がありそうです。

これに対して皆さんはポジティブかネガティブな印象どちらでしょうか。

ちなみに私はですね、ポジティブな印象を受けています。

というのもですね、動画生成AIがどんどん技術が発達することで、

個人や企業がもっと手軽に動画生成ができるようになるんですね。

例えば個人であればですね、動画生成AIを使って自主制作のショートフィルムを作れるようになりますし、

クリエイターの方が例えば動画広告であったりとかそういったものをですね、手軽に作れるようになると思います。

ちなみにですね、ネガティブな意見で、

AIが生成した動画とリアルで作った動画、区別がつかないんじゃないかっていう話もあると思うんですけど、

この部分はですね、クリアになるのかなと思います。

というのもですね、動画や画像、音声に関してはですね、

AIが生成したものかどうかっていうのを識別できる技術っていうのはもうすでにあるんですね。

例えば画像や動画はですね、人間が識別できないぐらいの、

例えばそのカラーコードであったりとか、このシグナルなどを埋め込む技術があります。

音声に関しても、人間の耳でほぼ聞くことができない、認識できないような音声、ノイズのようなものですね、埋め込むと。

これがAIが生成したものですよということで識別ができるようになるんですね。

問題はテキストなんですね、文章。

AIが作った画像や動画、音声というのは技術的にですね、識別は可能です。

問題はテキストで、テキストはですね、AIが作ったものかどうかっていうのを見分けるのがかなり難しいみたいなんですね。

確かに言われてみればそうだなと、文字に識別コードとかを埋め込むことはできないし、

あと、識別するといえば文章のパターンですかね。

でもそれも難しいですよね。

これちなみにですね、一度オープンAIが、AIが生成したテキストがどうかっていうのを見分ける技術って言ったらいいんですかね。

サービスを一回リリースしたんですね。

でもこれ途中で断念したんですよね。

なのでテキストを見分ける技術は相当難しいらしいですね。

話を動画に戻すと、空のようにですね、ちょっとものすごい生成AIが出てくると、

動画に携わる人たちが失業するっていう話が出てきますが、どうなんでしょうかね。

私個人としてはむしろアップデートしていくのではと思っています。

動画生成AIを活用して業務の効率化が図れたり、

それこそ現実では起こらないような、空想のような動画をですね、制作できたりという、

逆に幅が広がってくるのかなとは思いますね。

で、今まで動画制作に手を出せなかったクリエイターの人とかもですね、

AIによる動画制作の影響と価値

手軽に動画を作れるようになると価格反応が起きそうで面白いですよね。

で、私も動画生成AIを使ってますけど、今はAIすごいっていう風になってる段階ですよね。

つまりそのAIが作った動画というのが珍しいと思われる段階です。

例えばですね、2023年にお茶の伊藤園、大井お茶の伊藤園ですね。

あの伊藤園がAIを使ったCMを作って話題になりましたよね。

厳密に言うとですね、全てAIを使って作ったわけではなくて、

登場する女性がAIタレントというCMですね。

ただそれでもかなり話題になったんですね。

やっぱり話題になった理由っていうのが、AIが作った動画だから話題になったわけですね。

でもですね、ちょっと考えてほしいんですけど、

これからですね、AIを使ったCMを100社くらいが導入したら話題性というのは薄れていきますよね。

人間は慣れの生き物なので、AIが作った動画に価値や注目が集まる時期っていうのは、

割とすぐ終わりそうなのかなと思ったりしています。

とりあえずAIで作った動画というものにですね、付加価値がなくなったらどうなるのかなと思ったりします。

AIが作った動画が一般化した時に何が起こるのかっていうのを想像するとですね、

結局クオリティ勝負になりますよね。

人の感情を動かす動画を作るには。

動画の品質を左右するのは、そういった人間の感性やスキルが大きく影響していくのは変わらないので、

そういった意味でも動画生成AIがこれからどんどん発達しても、

おそらく単純作業、動画の制作に関わる単純作業というのはなくなってくると思います。

でも映像制作のその核となる部分ですね、これは人間の手はまだまだ必要だと思っています。

動画生成AIはですね、色々とクリアしないといけない問題があるんですけども、

この勢い、流れというのは私はポジティブに捉えています。

ある海外のユーザーが言っていたのが、

2024年は動画生成AIが来るんじゃないのかという風に言ってですね、

それも穴がち間違いじゃないのかなと。

今まではですね、動画生成AIは趣味レベルで扱うようなツールだった感が否めないんですけど、

今後本格的に企業や個人クリエイターが本格的な動画を作れるようなツールになっていくのかなと思っています。

皆さんは動画生成AIの今後はどうなると思いますでしょうか。

ポジティブな意見、ネガティブな意見、様々な意見があると思いますが、

コメントでぜひ聞かせてください。

はい、今日はこのへんということで、本日も聞いていただきありがとうございました。

このポッドキャストでは毎週AIの情報を発信しています。

ぜひフォローお願いします。

ロボシンクの公式サイトではChatGPTや画像生成AIを動画で学べるコースも提供しています。

興味のある方はカタカナでロボシンクと検索してみてください。

概要欄にも記載しています。

それでは今日もありがとうございました。また次の配信でお会いしましょう。

スター

エピソードをシェアする

メッセージを送信

矢野哲平

サマリー

目次

スター

コメント

こちらもおすすめ