1. 耳で学ぶAI、ロボシンク
  2. #3 Googleがついに動画生成AI..
2024-01-26 08:13

#3 Googleがついに動画生成AIを投入!その名もLumiere💡

Googleが動画生成AIのLumiere(ルミエール)を公開 / Lumiereの特徴 / Lumiereで出来ること / 現在の動画生成AIのプレイヤー


「耳で学ぶAI、ロボシンク」は生成AIのトレンドや情報を「耳」で学べるポッドキャストです。

AI初心者向けにChatGPTや画像生成AIの可能性をゆるく楽しく解説します。


【リソース】

◎Lumiereプロジェクトページ

https://lumiere-video.github.io/


-----

◎ロボシンク公式サイト

https://bit.ly/3xlLcW0


◎Xアカウント

https://bit.ly/3Tx6maM


◎Youtube

https://bit.ly/4agZS78


【スクリプト】

こんにちは、矢野哲平です。このポッドキャストは無料で学べるAIスキルロボシンクが提供する番組です。耳で学ぶAIをコンセプトに初心者向けにAIのトレンドや可能性を楽しく解説します。今回はGoogleが動画生成AI「Lumiere」を投入したことについて話します。


今日はGoogleがリリースした動画生成AI「Lumiere」について解説します。今収録しているのは1月26日金曜日でちょうど2日前にGoogleの動画生成AIが発表されました。動画生成AIとは指示を出してAIに動画を生成してもらうものです。例えば「砂漠の動画を作って」という指示をするとAIが砂漠の動画を作ります。イメージとしては動画生成ができるチャットGPTのようなものです。


例えばランウェイの「ジェンツー」や「ピカラボのピカ1.0」が有名です。最近リリースされたこれらは動画生成AIで知られています。この領域には今までGoogleは参戦していませんでしたがとうとう動き出しました。


「Lumiere」という言葉はフランス語で光を意味し映画や写真の分野でも使われます。Lumiereの特徴は公式の説明によると既存の動画生成AIが複数枚の画像を生成し繋げる手法を用いていたのに対しLumiereは動画全体の複数枚を一度に生成するため複数枚の繋がりが自然で違和感の少ない動画が可能です。生成できる動画の時間は合計で数分ですがこれは他の動画生成AIと大差ありません。


Lumiereを実際に使ってみたいですが現時点では一般公開されておらず公開時期や費用も未定です。この辺は発表され次第ポッドキャストでお伝えしたいと思います。


今回の情報をまとめるとGoogleが動画生成AIのLumiereを公開しました。Lumiereは既存の動画生成AIと異なるアプローチを取り動画全体の違和感が少なくなっています。Lumiereの公式ページは概要欄に貼っておきますのでぜひご覧ください。


Lumiereでできることにはテキストから動画を生成するテキスト2ビデオ、画像から動画を生成するイメージ2ビデオ、既存の画像のスタイルを参考に動画を生成するスタイライズデンジネレーション、既存の動画を別のスタイルに変更するビデオスタイルデーション、画像の一部が動くシネマグラフ、動画の欠損部分を補うビデオインペインティング、動画の一部を修正する機能などがあります。


現在の動画生成AIのプレイヤーとしてはランウェイの「ジェンツー」やピカ1.0、ステーブルビデオディフュージョンなどがありますが今回のGoogleの参入により2024年の動画生成AI市場はさらに面白くなりそうです。


それでは今日はこの辺で終わります。ありがとうございました

サマリー

Googleはついに動画生成AIのLumiereを公開しています。Lumiereは5秒の動画を生成し、動画全体の違和感が少なく、品質も高いです。

00:08
みなさんこんにちは、矢野 哲平です。
このポッドキャストは、無料で学べるAIスキル、ロボシンクが運営する番組です。
耳で学ぶAIをコンセプトに、初心者向けにAIのトレンドや可能性を緩く楽しく解説します。
Googleの動画生成AI「Lumiere」の特徴
今回のテーマは、Googleがついに動画生成AIを投入、その名もLumiereについて話していきます。
はい、ということで、今日はGoogleがリリースした動画生成AIのLumiereについて解説をしていきます。
今収録しているのが1月26日金曜日なんですけど、ちょうど2日前ぐらいにですね、Googleの動画生成AIが発表されました。
動画生成AIは何なのかという方もいらっしゃると思うので、軽く説明すると、テキストでAIに指示を出して動画を生成してもらうというAIですね。
例えばですね、砂漠の動画を作ってくださいというふうに指示をすると、AIが砂漠の動画を作ったり、そういったことができるものになります。
イメージ的にはですね、動画生成ができるチャットGPTのようなものとイメージしていただければと思います。
例えば、RunwayのGen2であったり、Pica1.0ですね、最近リリースされましたけども、こちらが動画生成AIで有名です。
この領域というのは、今までGoogleは参戦してなかった領域なんですけども、とうとうGoogleが動き出したかなということで、このトピックを取り上げました。
ルミエールという言葉なんですけども、フランス語のようですね、直訳すると光とかという意味でですね、使われるそうです。
これは映画や写真の分野とかでも使われるという言葉みたいですね。
ルミエールの特徴なんですけども、これは公式の説明になるんですけども、既存の動画生成AIはコマを複数枚生成して、そのコマ同士を保管するという手法で動画を生成しているそうなんですね。
そのためコマ同士の繋がりが不自然になってしまうというようなデメリットがあったそうなんです。
既存の動画生成AIで言われているのが、動きがどうも不自然だと、AIっぽいと言われる。
それはやっぱりコマを複数枚生成して、そのコマ同士を保管しているからそういうギクシャクするような部分が生まれてくるよっていうのがGoogleの説明みたいなんですね。
一方でルミエールは動画全体のフレーム、動画全体のコマを一度に生成するという手法を採用しているため、コマ同士の繋がりが自然で違和感の少ない動画が生成可能ですということを公式を謳っています。
ちなみに生成できる動画は5秒になります。これは他の動画生成AIと比べてもあまり変わらない秒数ですね。生成できる動画は5秒の動画が生成できます。
ルミエールを実際に使ってみたいと思うんですけども、これはまだ公開、一般公開はされてないそうで、まだ公開時期も未定ということで、そのためいくら金額がかかるかっていうのもまだ発表されてないですね。
この辺は発表され次第、Podcastでも発信していきたいなとは思っています。
ここまでの情報をまとめると、Googleが動画生成AIのルミエールを公開した。
ルミエールは生成できる動画は5秒。ルミエールは既存の動画生成AIと違ったアプローチで動画生成をするため、動画全体の違和感というのが少なくなっている。
そして生成できる動画5秒ですね。
ルミエールの公式ページというのがあるので、これは概要欄に貼っておきます。ぜひご覧になっていただければと思います。
ちょっと音声ではですね、なかなか伝えにくい部分もあるので、ぜひ公式ページをご覧いただければと思います。
Lumiereの機能1-4
次にルミエールでできることを一つずつ説明していくと、まずテキストトゥビデオですね。
これは既存の動画生成AIでも備わっている機能ですけれども、テキストを入力してそれに対して動画を生成する機能ですね。これがまず一つ。
そして2つ目にイメージトゥビデオ。これは画像から動画を生成する機能ですね。これも既存の動画生成AIは備わっている機能ですね。
3つ目にスタイライズドゥジェネレーション。これはですね、ちょっと言葉で説明するのが難しいんですけれども、既存の画像、ある画像のスタイルを参考に動画を生成するという。
例えばですね、モザイクの画像をベースに動画を生成すると、モザイクの動画が作れるような形になります。
そして4つ目がビデオスタイリゼーション。これはですね、既存の動画を別のスタイルに変更する機能ですね。
例えばですね、サンプルでは女性の方がランニングしている動画があるんですけども、その動画を女性をブロックのレゴのようなキャラクターにしたりとか、
あとはペーパークラフトのキャラクターにしたりというような動画から動画、動画のスタイルを変えるような機能も備わっています。
そして次の機能がシネマグラフですね。シネマグラフというのは画像のある一部分が動いているような画像ですね。
これをシネマグラフって言うんですけども、これをLumiereでは生成することができます。
例えば焚火の写真があって、その焚火の炎の部分だけ動いているような画像を作ったりすることができるそうです。
そして次の機能がビデオインペインティングですね。これは動画のある部分が欠損している場合に、その欠損している部分をAIが保管してくれるような機能ですね。
そして最後に動画の一部修正ですね。
サンプルではドレスを着た女性の洋服を他の色のドレスに変更したりといったことをしています。
これは他の動画生成AIでもある機能ですね。
生成される動画の品質を見てるんですけども、かなり品質は高いように見えます。
違和感なく動画が生成できているので、今からLumiereを使うのが楽しみですね。
市場の大手企業と動画生成AIの展望
現状の動画生成AIのプレイヤーについて軽く触れると、まず一つがRunwayのGen2ですね。
これがいろいろ動画生成AIはプレイヤーいますけども、一番クオリティが高い動画ができるのかなと思います。
無料でも使えます。本格的に使おうとするとちょっとお金がかかるんですけども、無料でも使えるので、まだ試したことがない方はぜひ使ってみてください。
RunwayのGen2ですね。
そして次にPica 1.0。これは以前PicaLabという名前だったんですけども、アップデートをして今Pica 1.0ですね。
これは無料で動画生成できるツールだったんですけども、ちょっと最近、有料というか無料で生成できる範囲が限られてきました。
ただ、Pica 1.0も急速にユーザーを伸ばしているサービスなので、こちらもおすすめです。
あとはステイブルビデオディフュージョンですね。画像生成AIでも有名なステイブルディフュージョンですね。
あと大手で言うとMeta。Facebookの会社ですね。MetaのMVDEO。
あとはバイトダンス。これはTikTokの親会社ですかね。バイトダンスのMagic Videoですね。
Magic Video V2。これも最近リリースされました。
このように動画生成AIの市場に大手、Metaやバイトダンス、あとは今回のGoogleですね。
が参入してきているので、2024年は動画生成AIの領域がちょっと面白いことになりそうだなとは個人的に思っています。
これからが楽しみですね。
はい、今日はこの辺ということで、本日も聞いていただきありがとうございました。
このポッドキャストでは毎週AIの情報を発信しています。ぜひフォローお願いします。
RoboSyncの公式サイトではChatGPTや画像生成AIを動画で学べるコースも提供しています。
興味のある方はカタカナでRoboSyncと検索してみてください。概要欄にも記載しています。
それでは今日もありがとうございました。また次の配信でお会いしましょう。
08:13

コメント

スクロール