1. 耳で学ぶAI、ロボシンク
  2. #8 Adobeが音楽生成AIの新サー..
2024-03-06 14:34

#8 Adobeが音楽生成AIの新サービスを発表!「音」の生成AIについて語る回🎧

1 Mention

Adobeの新サービス、Project Music GenAI Control / 「音」生成AIのプレイヤー達 / SOUNDRAW / SUNO AI / ElevenLabs / CoeFont / 音声AIの問題点


---

生成AIのニュースレターを始めました🎉 AIの最新情報や知見を効率よくキャッチアップできます。

登録はこちらから→⁠⁠⁠https://bit.ly/3Cq9LDG⁠⁠⁠

---


【内容】

Adobeが音楽生成AIの「Projects Music GenAI Control」を発表しました。このサービスの概要について紹介し、その他の「音」に特化した生成AIのプレイヤーを紹介します。

SOUNDRAW, SUNO AI, ElevenLabs, CoeFontなど音楽生成AIと音声生成AIのサービスを紹介します。

そして、音の生成AIが抱える問題点についても言及します。

---

👨‍💻パーソナリティ

矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。


◎note

https://bit.ly/3LvtP91


◎X: 矢野哲平

https://bit.ly/3Tx6maM

---

【リソース】

◎Adobeの新サービス(Youtube視聴)

https://www.youtube.com/watch?v=J6jhWyU5lBY


◎SOUNDRAW公式サイト

https://soundraw.io/ja/


◎SunoAIで作成された歌

https://twitter.com/Eiichiro_Staff/status/1737790262402064744


◎ElevenLabs公式サイト

https://elevenlabs.io/


◎CoeFont公式サイト

https://coefont.cloud/


◎Open Legal Communityの記事ページ

https://openlegalcommunity.com/ai-generated-voice-of-famous-charactors-how-to-enforce/

---

◎番組の感想や要望はこちら

https://forms.gle/VMyVYWzHSNKZFu787

サマリー

Adobeは音楽生成AIの新サービスを発表しています。音楽生成AIについて話し、他の音楽生成AIのプレイヤーについても説明しています。AIの音声生成機能について語る回で、音楽生成AIの新サービスについても紹介されています。音声生成AIの潜在的なリスクや著作権についても議論されています。

00:07
皆さんこんにちは、ロボシンクの矢野です。このポッドキャストは、耳で学ぶAIをコンセプトに、初心者向けに生成AIを分かりやすく説明する番組です。
今回のテーマは、Adobeが音楽生成AIの新サービスを発表、音の生成AIについて語る回、について話していきます。
はい、ということで、今日は音楽生成AIについて話していきたいと思います。皆さん、音楽生成AIは使っていますでしょうか?
チャットGPTなどの会話系のAIやですね、あとはミッドジャーニーなどの画像生成AIなどを使っている方は多いと思います。
ただ、音楽生成AIについてはあまり使ってないという方も多いのではないでしょうか。
そういった点も含めてですね、今日は音楽生成AIについて話していきたいと思います。
今日話すのは主に3つですね。まず1つはAdobeの新サービスを紹介。2つ目に他の音楽生成AIのプレイヤーについて話します。
そして3つ目に音楽生成AIの問題点について話していきたいと思います。
実はですね、今日ちょっと花粉症がひどくてですね、声がガラガラになっているので、ちょっと聞き苦しいところがあるかもしれません。すいません。
Adobeの新サービス
はい、では早速ですけども、まずAdobeの新サービスについて紹介していきたいと思います。
つい最近Adobeから発表されたサービスなんですけども、
プロジェクトミュージックジェンAIコントロールという、ちょっと長い名前なんですけど、
Adobeが音楽生成AIの新サービスを発表しました。
これはですね、簡単に言うとテキストのプロンプト、このテキストのプロンプトから音楽を生成できるという生成AIになります。
例えばですね、パワフルなロックを書いてとか、あとはハッピーな音楽などですね、
人間がテキストで指示をすることで、このサービスがですね、音楽を、その指示に基づいた音楽を生成してくれるというものになります。
イメージとしてはですね、音声版のチャットGPTのようなイメージがわかりやすいと思います。
このAdobeのサービスの特徴としてですね、生成した後の音楽、これを修正できるという特徴があります。
例えばですね、パワフルなロックの音楽を書いてということでAIに指示をして、
AAがどうぞと、できましたと音楽を上げてきます。
その上げた音楽に対して、いやここはもうちょっとテンポを早くしましょうとかですね、
ここはもっとスローにしましょうという形で、その生成した後の音楽を自由に人間が修正できるというような特徴を持っています。
これあのAdobeもコメントで言ってたんですけども、
フォトショップ、Adobeが展開している画像のサービスというかソフトですね、
フォトショップのようにピクセルレベルでクリエイターが微調整できるというふうにコメントしています。
このAdobeのこのサービスに関しては、YouTube公式のチャンネルがですね、YouTube動画を出しているので、
こちらをぜひご覧いただければと思います。概要欄にYouTubeのリンクを貼っておきます。
実際にですね、ちょっとYouTube動画でどういったものかっていうのを見ないことにはイメージが湧きづらいと思うんですけども、
やっぱりワクワクしますよね。テキストでプロンプトを打つことで音楽が生成される。
こういった経験というのはなかなかないので、ぜひ使ってみたいと思うんですけども、
残念ながらですね、一般公開というのはまだされていません。予定日などもですね、まだ現時点ではアナウンスされていないので、
このAdobeの新サービスですね、ちょっともう1回名前をお伝えします。
Project MusicGen AI Control。これはですね、今のところ一般公開はまだされていません。
ただですね、YouTube動画でも上げていることもあるので、そんなに遠くない未来、このサービスが使えるのかなと思います。
新しい情報が入り次第、こちらのポッドキャストでもお伝えしていきたいと思います。
他の音楽生成AIのプレイヤー
ここからはですね、他の音楽生成AIのサービスについても話していきたいと思います。
ちなみにですね、音楽生成AIのサービスって一口に言ってもですね、結構あるんですね。
例えばですね、会話系だったらChatGPT、画像系だったらMeet Journeyとか、あとはStable Diffusionですね。
結構その音に特化した生成AIっていうのはたくさんあるんですね。
例えばですね、このロボシンクのポッドキャストの冒頭のBGM、あれ実は生成AIで作ったものなんですね。
ちょっと聞いてみましょうか。
はい、これはサウンドローという音楽生成AIのサービスを使って作ったBGMになります。
概要欄にリンクを貼っておきます。
その他にもですね、音楽を歌詞付きで生成できるサービスにSUのAIというのがあります。
このサービスはですね、ワンピース漫画のですね、ワンピースの尾田先生が使ったということで話題になったサービスでもあります。
これあのワンピースの主題歌をですね、SUのAIで作ってXにポストされてるんですね。
ちょっとこちらも聞いてみましょうか。
はい、これあの音楽生成するのもすごいんですけど、歌詞付きで、ボーカル付きでですね、音楽を生成できるのがすごいですよね。
これあのXのポストへのリンクも貼っておきますので、興味ある方はこちらも覗いてみてください。
これまで紹介したのは音楽の生成AIのサービスになります。
音声AIのサービス
音のジャンルで言うと音楽以外にもですね、音声のサービスもあるんですね。
例えば11LABOという音声AIのサービスがあります。
これはですね、入力したテキストを音声に変換してくれるサービスになります。
例えばですね、そうですね、私がテキストでこんにちはロボシンクの矢野ですと入力するとですね、
その入力したテキストを音声に変換してくれるというものになります。
この11LABOにはですね、男性の声とか女性の声というサンプルがもうすでに用意されていて、
そういった声で音声を作ることができます。
ちなみにこの11LABOで面白いのがですね、自分の声を学習させて自分の声で音声を作ることもできるんですね。
これちょっとあのサンプルを撮ってみたので聞いてみましょうか。
皆さんこんにちは矢野てっぺいです。どうでしょうか。
今の音声というのはですね、私の声をAIに学習させて作らせた音声になります。
声は似ていましたでしょうか。ちょっともう1回かけてみます。
皆さんこんにちは矢野てっぺいです。
学習の量を増やすとですね、よりリアルな音声に近づいていくのかなと思います。
この11LABOはですね、無料からでも利用できます。
私がさっき使った機能ですね、自分の声を登録してそれをAIに学習させるという、
これは無料版では使えない機能なんですけども、
有料版のスタータープランでもですね、最初の初月が1ドルから使えるので、
興味のある方はこちらもぜひ試してみてください。
概要欄にリンクを貼っておきます。
この11LABOというのがですね、海外のサービスなんですけども、
国内で言うとですね、声フォントというサービスもあります。
これですね、まだ触ったことがない方いらっしゃったらですね、
ちょっとぜひアクセスしてみてください。面白いですよ。
これあの自分の声も登録できますし、
あとは声優さんがですね、すでにデータを提供しているので、
そういった声優の方とかナレーターの方とかのですね、
登録した方の声を使って生成することもできます。
で、これは面白いことにですね、
あのひろゆきさん、にちゃんの創始者のですね、
ひろゆきさんがあの音声のデータを提供しているので、
ひろゆきさんの声も生成できるんですよ。
これちょっとあのサンプルあるので聞いてみましょうか。
簡単にオイラの声を真似できるんですよね。
これですね、ひろゆきさんの声を録音したものを流しているわけじゃないです。
こちらでテキストで支持した内容をですね、
生成AIがひろゆきさんの声で生成した音声になります。
かなりですね、その声色が似てるのもありますけど、
欲要とか話し方とかそういった点も再現性が高いですよね。
ちょっともう一つサンプルあるので聞いてみます。
それってあなたの感想ですよね。
もうこれほぼほぼ本人ですよね。
この音声を聞いて、
AIが生成した音声っていうのを見分けれる人少ないんじゃないかなと思いますね。
この声フォントもですね、
サイトにアクセスするとトップページでいろいろ試せるので、
その中にひろゆきさんもいます。
試せるので興味のある方はこちらもアクセスしてみてください。
概要欄に貼っておきます。
ちなみにですね、チャットGPTでも音声出力っていうのはできるんですね。
これはテキストトゥスピーチというモデルが使われてるんですけども、
チャットGPTでも音声で回答を出力することができます。
ちょっと試しにかけてみます。
こんにちは。音楽生成AIについてどう思いますか。
生成AIについては非常に革新的であり、
音楽業界に新たな可能性を提供していると思います。
このチャットGPTの音声出力機能というのは以前から実装されてたんですけども、
やっぱり初めて使った時は少し驚きましたね。
音声がですね、何と言いますか、言い淀んだりとか、
うーんとかいうフレーズとかを使ってくるんですね。
妙に人間ぽいリアルさがあるような音声出力機能になります。
これはですね、アプリ版でも使えますし、
ブラウザでも使えるようになるという機能だったかな。
オープンAIの方からアナウンスがあったので、
こちらもぜひ興味ある方は使ってみてください。
この音声出力機能はですね、英語学習なんかに使っている人も多いみたいですね。
ちなみに私はですね、頭の整理とかをしたい時とか、
あとはジョギング中とかにチャットGPTのこの機能をオンにしておいてですね、
AIと会話をしながら頭の中を整理するみたいな使い方もしています。
ここまで音に関する生成AIについて紹介してきましたけれども、
音声生成AIのリスクと著作権
やっぱり問題点もあってですね、
やっぱり一番の懸念というのが、
この音楽生成AIや音声生成AIがですね、
悪用されるケースっていうのが懸念されますよね。
例えばですね、バイデン大統領、アメリカのバイデン大統領の
偽スピーチというのが最近問題になったんですね。
本人は話してないんです。
本人は話してないような偽のスピーチがインターネット上で出回ったと。
これはですね、生成AIが作った音声なんじゃないかというふうに言われています。
バイデン大統領の声を学習させてですね、偽のスピーチを作ったケースですね。
これは大統領レベルの話でなくてもですね、
例えば私の声を学習させて、
そうですね、私の母親にオレオレ詐欺の電話をかけるような、
そんな悪用の仕方とかもできてしまうわけですね。
例えばですね、アーティストの音楽には著作権がありますよね。
じゃあですね、声、この声自体には著作権はあると思いますか?
これですね、結構驚く方も多いんですけど、
声自体には著作権はないんですよね。
例えばのアーティストの方の音楽っていうのは、
ボーカルの声とか、あとはドラムとか楽器の音ですね。
そういったものが一つになった作品なので、著作権というのは認められてるんですけども、
個人のこの声、個人もですね、バイデン大統領も個人ですけど、
個人とか人の声には著作権っていうのは現状を認められていないんですね。
例えばですね、オープンリーガルコミュニティというアメリカの知財を開設するサイトがあるんですけども、
こちらの2023年10月の記事によるとですね、
声自体には現状著作権は認められていないので、
著作権侵害に対する権利行使が難しいというふうな見解が述べられています。
例えばですね、私の声で音声のAIとか作ってもですね、
ちょっと損害というか、高が知れてると思うんですけども、
例えば有名なミュージシャンの方の声を学習させて、
その方の声で知らない誰かが曲を作ってしまうと、
その曲に有名なミュージシャンの方のボーカルを載せる、
そんな使い方もできてしまうんですね。悪意のある方がいればですね。
これからQPitchで法整備が進んでいくと思うんですけども、
やっぱりその生成AIの進化の速さに、
現実のこの法整備が追いついてないのかなという印象はありますよね。
海外も日本も含めて、いろいろ著作権に対する法整備というのは、
QPitchで進んでいっているので、ロボシンクでもですね、
引き続きトピックを取り扱っていきたいと思います。
音楽生成AIの新サービスについて
今日はこの辺ということで、本日も聞いていただきありがとうございました。
今回のエピソード収録しててですね、
もともと入りはアドビの新しい音楽生成AIサービスだったんですけども、
音声AIについてちょっともっと掘り下げたくなったので、
来週も音声AIのトピックをちょっと取り扱おうかなと思っています。
次はですね、ポッドキャスターの文脈で取り扱おうかなと、
ポッドキャスターと生成AIについてエピソードを配信したいと思います。
このようにですね、AIの情報を毎週発信しているので、ぜひフォローお願いします。
ロボシンクの公式サイトでは、
ChatGPTや画像生成AIを動画で学べるコースも提供しています。
興味のある方はカタカナでロボシンクと検索してみてください。
概要欄にも記載しています。
お相手はロボシンクのヤノでした。また次の配信でお会いしましょう。
14:34

このエピソードに言及しているエピソード

コメント

スクロール