1. 耳で学ぶAI、ロボシンク
  2. #14 【新サービス】海外で話題..
2024-04-17 19:35

#14 【新サービス】海外で話題になっている音楽生成AIのUdioを語る回🔥

新サービス、Udioについて解説 / 無料で月に1200曲生成可能 / 商用利用可能(クレジット表記必須) / Suno AIとの比較 / Adobeが生成AI搭載のPremiere Proを発表(Sora, Pika, Runway搭載)


「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。


【内容】

新しく発表された音楽生成AIのUdioについて解説。

音楽生成AIではSuno AIが有名ですが、どういった点が違うのか?曲の品質は?という点を掘り下げていきます。同じプロンプトで作成した曲の比較も紹介。

そして、先日発表されたばかりのAdobeが生成AI搭載(Sora, Pika, Runway)のPremiere Proを発表したことについても話します。


【リソース】

◎Udio

https://www.udio.com/


◎Adobe Premiere Pro

https://www.youtube.com/watch?v=6de4akFiNYM&t=7s


◎Alibaba EMO

https://humanaigc.github.io/emote-portrait-alive/


◎Adobe Project Music Gen AI Control(Youtube動画)

https://www.youtube.com/watch?v=J6jhWyU5lBY&t=1s


※このポッドキャスト内の音楽はUdioとSuno AIで作成しました

-----

◎ロボシンク公式サイト

https://bit.ly/3xlLcW0


◎Xアカウント

https://bit.ly/3Tx6maM


◎Youtube

https://bit.ly/4agZS78

サマリー

新しく発表された音楽生成AI、Udioについて解説されています。Udioはテキストから音楽を生成するAIで、月に1200曲無料で作成可能であり、商用利用も可能です。一方、数のAIも高品質な音楽を生成できますが、有料版から商用利用が可能であり、個人の好みによる違いがあります。UDOのバージョンはまだベータ版でバージョン1です。数のAIは現在のバージョンがV3です。UDOはすごいですね。アドビーも音楽生成AIのプロジェクトミュージックジェンAIコントロールという音楽生成AIを開発中と発表しています。

Udioの概要
みなさんこんにちは、ロボシンクの矢野です。このポッドキャストは、耳で学ぶAIをコンセプトに、初心者向けに生成AIを分かりやすく解説する番組です。
今回のテーマは、新しく発表された音楽生成AI、Udioを語る回🔥について話していきます。
はい、ということで今日は音楽生成AIのUdioについて話していきます。 みなさん、Udio使ってみましたでしょうか?
このサービスですね、先週発表されて海外で話題になったので、まだ知らないという人も多いと思います。
今回ですね、他のエピソードを取り扱おうと予定していたんですけども、結構ですね、私が思っている以上に海外で話題になっているので、今日はですね、音楽生成AIのUdioについて解説していきたいと思います。
今日のポイントは主に3つです。まず1つ目に、そもそもUdioって何?というところですね。 2つ目にUdioでできること、あとはの音楽生成AIの有名どころとして、数のAIというサービスがあるんですけども、
その数のAIとどういった点が違うかというところですね。 あとは3つ目にですね、音楽生成AI周りの話をしていきたいと思います。
では早速ですね、Udioについて話していきたいと思います。Udio、これあの綴りがUDIOですね。
UDIOと読むようですね。これはですね、簡単に言うとテキストから音楽を生成できるAIですね。
例えばですね、R&B、メールボーカル、男性ボーカルとかですね、そういったテキストのプロンプト、つまりはAIへの指示ですね。
を入力することで、それに対応した音楽が生成されるというものですね。 ちょっと試しにですね、Udioで曲を制作してみたので聴いてみましょうか。
はい、もう一曲聴いてみます。
はい、こんな感じで結構本格的ですよね。歌詞付きの曲を制作することができます。
このUdioという会社はどういう会社かということなんですけど、Udioはサービス名ですね。
運営する会社がUncharted Labs AIというニューヨークとイギリスを拠点にしている会社ですね。
アメリカの会社ですね。このUdioのメンバーにはですね、元GoogleのDeepMindに所属していたですね、AIの研究者とあとはエンジニアによって設立された会社という風に説明があります。
これ面白いのがですね、アーティストの方もこのUdioのプロジェクトに参加していて、例えばですね、Will.i.amやあとはCommonといったですね、海外の著名なアーティストも参加しているプロジェクトになります。
でこのUdioですね、ちょうど先週4月の10日、11日ぐらいですかね。 普段私海外のSNSでですね、AIの情報をチェックしているんですけども
海外のユーザーがですね、この音楽生成AIすごいっていう風にこう皆さん投稿されてて、実際に曲を聞いてみるとですね、これ結構すごいなーって思って知ったのがきっかけです。
Udioはですね、現在ベータ版なんですね一応。ベータ版なんですけど、月に1200曲無料で作れる。これ結構インパクト大きいですよね。
月に無料で1200曲、楽曲作れるっていうのは、私が知る限り音楽の生成AIのサービスにはないですね。
数のAIが、音楽生成AIの界隈で言うと有名なんですけど、数のAIでもですね、無料版で1ヶ月に300曲ぐらいなので、4倍無料で曲を作れると。
これはかなり大きいですね。まぁおそらくこういった理由もあってですね、 海外でバズったのかなぁなんて思ったりもしました。
で、あの歌詞付きと歌詞なしの音楽を生成できると。先ほど聞いた曲はですね、歌詞ありで音楽を生成したものですけども、歌詞なしの音楽も作成できるんですね。
つまりですね、例えばポッドキャストや、あとはYouTube、あとはそれ以外の動画ですね。 そういった動画などのBGMも無料で作れるということですね。
ちなみにですね、著作権周りの話も絡んでくると思うんですけども、UDOでは無料で作れる楽曲ですね、1200曲。
これはですね、商用利用可能です。 クレジット表記をすれば商用利用可能です。
これ大きいですよね。まああの数のAIもですね、商用利用はできるんですけども、 それは有料版からのみになるので、無料で1200曲作れてしかも商用利用できると。
なのでかなり攻めた内容、本気でユーザーを取りに来ているのがちょっとわかりますね。 でですね、あの有料はですね、長い歌っていうのも作曲できるんですね。
結構あの音楽生成AIのデメリットとして、一曲丸ごとまとまった音楽っていうのを作成するのは難しいっていう面もあるんですね。
そういった点もですね、有料はしっかり克服しているという形ですね。 ちなみにですね、日本語の歌詞でも作曲は可能となります。
英語、中国語、日本語、ロシア語、ポーランド語、ドイツ語、フランス語、イタリア語、現在8カ国語に対応しているようです。
あとはですね、プレイリスト機能なんかもあるので、例えばその自分が作った楽曲であったりとか、 他のユーザーが作った楽曲をですね、一つのプレイリストにまとめて作業用BGMなんかもですね、作ることができるわけですね。
これは数のAIでもこういったプレイリスト機能はあるんですけども、結構これですね、便利なんですよね。
普段、仕事中とかですね、音楽を聴いている方とかは、AIが作った曲で自分の作業用BGMを作れるという、そんな時代になったわけですね。
あとは利用規約もあるようですね、結構読み込んだんですけど、気になったのがですね、アプリに関しての記載があったんですね。
Appleのアプリに関する記載があったので、おそらくですね、ゆくゆくはアプリも展開するのかなぁとは思っています。
私が今確認した段階ではですね、日本のアプリストアにはUDEOのアプリはなかったですね。
でももしかすると海外ではアプリもダウンロード可能になっているかもしれないんですけども、おそらくまだ準備中かなと思いますね。
公式からそういったアナウンスはないので、規約の中にですね、ひっそりAppleのストアに関する記載があったので、もしかするとですね、今後アプリ版のリリースというのも検討しているのではないかと思いました。
ここから本題なんですけど、こういった音楽生成AIが出てくるとですね、皆さんこういうふうに考えられる方多いと思うんですね。
Udioと数のAIの比較
数のAIとどっちがいいのと。これ結構海外のSNSでも話題になっててですね、
UDEOが出てきて、これは数のAIの資格だとかですね、数のAI越えのサービスがやってきたとかですね、
これは新しいサービスが出るとですね、そのジャンルのトップの、そのカテゴリーのトップのですねサービスが比較対象になるというのは、これは世の常なんですけど、
実際ですね、私数のAIとUDEOを使ってみて、端的に言うとですね、どっちもいいサービスですね。
こんなに簡単に音楽作れちゃうのって、もうただただ驚くばかりですね。 ただですね、厳密に比較をしていくと、2つの側面から比較できると思うんですね。
一つは金額的な面、コスパ的な面とかですね。 あともう一つは音楽の品質面ですね。
まずあのお金の面、コスパや金額面で言うとですね、これはですねもうぶっちぎりでUDEOですね。
先ほども紹介したようにですね、月に1200曲無料で作成できると。 しかもクレジット表記をすれば商用利用可能ということですね。
数のAIよりも4倍無料で曲を作れると。しかも商用利用できると。 数のAIはですね、商用利用するには有料版に加入しないといけないんですね。
この有料版というのが最低で月に10ドル。 今のレートで言うと、月額1530円ぐらいですかね。
ものすごく円安が進行してますけど、お金の面で言うとUDEOが勝っているかなと思います。
で2つ目ですね。品質の面ですね。クオリティの面。 これが一番重要だと思うんですけども、
シンプルにですね、良い音楽を生成できるかという点で言うと、好みもあるので一概には言えませんが、個人的にはですね、
数のAIが若干上かなというふうに感じています。 もう本当これはですね、もう好みの問題なので、ただ私がそう思っているだけです。
実際ですね、海外のユーザー見てもですね、 数のAIよりも作る曲好きだっていう方達もいらっしゃるんですね。
それも本当に個人的な好みにはなると思います。 ただですね、数のAIで作った曲と比較すると、個人的には数のAIの方が若干好みかなという感じですね。
同じプロンプトで数のAIとUDEOで曲を制作してみたので比較してみたいと思います。
ちなみにですね、プロンプトはもうすごくシンプルなもので、 ジャズ、ヒップホップ、男性ボーカルというプロンプトにしました。
そうですね、まずはUDEOからかけてみましょうか。
はい、次に数のAIをかけてみます。
プロンプトを入力するたびにですね、生成される音楽の種類というか雰囲気は変わってくるので、一概に比較するのは難しいと思うんですけども、
同じプロンプトで制作するとこんな感じになりました。 あとですね、音楽生成AIって1曲丸ごと作るのってちょっと難しいんですよね、現状。
具体的にはですね、プロンプトを入れて楽曲を制作してもですね、最後がこうプツッと途切れてしまうような曲ができてしまうんですね。
例えば数のAIの場合だと、まず元となる曲を作って、そこからこうどんどんどんどん延長していってですね、最終的に複数の延長した曲、
例えばそうですね4パートぐらいの曲を作って、それを最終的に1曲にまとめるというような作業になるんですね。
1曲を丸ごと作りたい場合。UDOも同じような作業になるんですけども、操作性というか、そういった1曲を作る時の作業工程はですね、
AI音楽生成の現状
UDOの方が直感的でやりやすかったかなという印象を受けました。 現在ですね、UDOのバージョンがまだベータ版でバージョン1ですね。
ということを考えると、十分すぎるほどのクオリティがあるのかなと思います。 数のAIがですね、今のバージョンがV3ですね。
ちょうどあの3月、先月にV3というバージョンアップにしてですね、 音楽のクオリティが上がったんですけども、数のAIと同じぐらいのクオリティを出してきている。
UDOはすごいなぁとも思います。 これからのですね、バージョンアップに注目したいサービスでありますね。
どうでしょうか。2024年になってですね、特定分野の生成AIが盛り上がっている感じはしますよね。
具体的に言うとですね、もちろんその会話型、ChatGPTのような会話型のAIも盛り上がっているんですけども、
音楽とあとは動画ですね。このジャンルが熱いような気がしています。 例えばですね、以前のエピソードでも紹介したんですけど、
アドビーですね、フォトショップとかを作っている会社ですね。 アドビーもですね、音楽生成AIのプロジェクトミュージックジェン
AIコントロールという音楽生成AIを開発中というふうに発表しました。 先週ですね、ブルームバーグ、これは海外のニュースサイトになるんですけども、
アドビーが1分3ドルで動画データを購入しまくっているという報道がありました。 なぜこういったことをアドビーがしているのかというとですね、
アドビーも動画生成AIに力を入れてきているんですね。 で、これですね4月の15日の夜、もうほんとつい先日なんですけども
アドビーのYouTubeの公式チャンネルで結構あの驚きの発表がされたんですね。 というのも、アドビーが動画編集ソフトにプレミアプロという編集ソフトをすでに開発
販売をしているんですね。 そのプレミアプロに新しく動画生成AIの機能を搭載しますと。 それがFireflyのビデオモデルということですね。
このFireflyというのはですね、元々もアドビーがすでに開発公開している画像生成AIですね。 それの動画生成バージョンということで新しくプレミアプロに動画生成AIの
Fireflyビデオモデルを組み込むと。 これだけでもですね、結構なニュースなんですけども、さらに驚いたのがですね、この新しく
アップデートするプレミアプロにSORA、 PICA、 Runway、これらの動画生成AIをサードパーティーとして組み込むということも発表したんですね。
動画生成AIの進化
このSORAっていうのはオープンAI、チャットGPTの会社ですね。 開発する動画生成AIですね。まだ一般ユーザーは使えないんですけども
デモ動画が公開されていてですね、その仕上がり具合がすごすぎるっていうことで 話題になった動画生成AIですね。
残りのPICAとRunwayもですね、動画生成AIのジャンルの中で言うと有名なサービスとなりまして トップクラスのサービスなんですね。
そういったSORA、PICA、Runwayという動画生成AIのトップクラスのサービスが 新しくプレミアプロに搭載されるということですね。
もうアドビのプレミアプロで動画生成AIのオールスターが使えちゃうという これはかなり衝撃的でしたね。
アドビはですね、画像生成AIですでにFireflyというのを出しています。 音楽生成AIで新しくですね、プロジェクトミュージックジェン
AIコントロールというものを開発しています。 そして動画生成AIというかですね、動画編集ソフトもひっくるめて
アドビのプレミアプロに新しく動画生成AI機能を搭載した 新しい次世代の動画編集ソフトも開発していると。
画像と音楽と動画すべてをこうちょっと取りに来ている感じはしますよね。 これはですね、一応あのまだ実装されている機能とかではなくて
2024年の後半をメドにしているということですね。 いずれにしろですね、こういった機能がプレミアプロに搭載されれば他の動画編集ソフト
いろいろありますよね。ファイナルカットとかですね。 そういった競合に対してかなりアドバンテージがあるんじゃないかと思います。
アドビがYouTubeチャンネルで公開したアドビのプレミアプロの新機能ですね。 YouTube動画のリンクは概要欄に記載しておきますので気になる方はチェックしてみてください。
この画像と音楽と動画ってそれぞれ相性が良くてですね。 例えばですね、ミッドジャーニーのような画像生成AIで人物画像を作って
数のAIやユーディオで音楽を作って、それらを組み合わせて動画生成AIで人物が歌っているような動画を生成することもできるんですね。
例えばですね、個人でミュージックビデオを作るようなアイデアも面白いですよね。 ちなみにですね、中国のアリババっていう会社があるんですけど
このアリババがですね、エモっていうAIを発表したんですね。 これは研究目的で開発されたのでまだ一般ユーザーは使えないようなものになるんですけども
このエモがですね、公開している生成AIというのがかなりすごいんですね。 一枚の画像と音声をAIに投げるとそれだけでミュージックビデオを作れるような
生成AIですね。 あのこれすごいなぁと思ったのがですね、歌を歌ってない部分がありますよね。音楽の中で
その間奏の部分とかですね。そういった場面でも表情を作ってるんですね。 例えば目を閉じて物思いにふけたような表情をしたりですね
これですね、ちょっと言葉じゃ伝わらないのでリンク貼っておきます。 興味のある方はぜひ見てください。すごいですよ
ボーカルがないパートでもですね、表情を作ったりしてクオリティが頭一つ抜けてる印象ですね。
2024年は動画も音楽もあとは画像もですね もっとクオリティが高いものが誕生する予感がするので今後の展開にワクワクしますよね
はい今日はこの辺ということで本日も聞いていただきありがとうございました 番組ではAIの情報を毎週発信しています
ぜひフォローお願いします。ロボシンクの公式サイトではチャットGPTなどを動画で学べるコースも提供しています。
興味のある方はカタカナでロボシンクと検索してみてください。 概要欄にも記載しています。お相手はロボシンクのヤノでした。また次の配信でお会いしましょう
19:35

コメント

スクロール