はい、では早速ですけども、まずAdobeの新サービスについて紹介していきたいと思います。
つい最近Adobeから発表されたサービスなんですけども、
プロジェクトミュージックジェンAIコントロールという、ちょっと長い名前なんですけど、
Adobeが音楽生成AIの新サービスを発表しました。
これはですね、簡単に言うとテキストのプロンプト、このテキストのプロンプトから音楽を生成できるという生成AIになります。
例えばですね、パワフルなロックを書いてとか、あとはハッピーな音楽などですね、
人間がテキストで指示をすることで、このサービスがですね、音楽を、その指示に基づいた音楽を生成してくれるというものになります。
イメージとしてはですね、音声版のチャットGPTのようなイメージがわかりやすいと思います。
このAdobeのサービスの特徴としてですね、生成した後の音楽、これを修正できるという特徴があります。
例えばですね、パワフルなロックの音楽を書いてということでAIに指示をして、
AAがどうぞと、できましたと音楽を上げてきます。
その上げた音楽に対して、いやここはもうちょっとテンポを早くしましょうとかですね、
ここはもっとスローにしましょうという形で、その生成した後の音楽を自由に人間が修正できるというような特徴を持っています。
これあのAdobeもコメントで言ってたんですけども、
フォトショップ、Adobeが展開している画像のサービスというかソフトですね、
フォトショップのようにピクセルレベルでクリエイターが微調整できるというふうにコメントしています。
このAdobeのこのサービスに関しては、YouTube公式のチャンネルがですね、YouTube動画を出しているので、
こちらをぜひご覧いただければと思います。概要欄にYouTubeのリンクを貼っておきます。
実際にですね、ちょっとYouTube動画でどういったものかっていうのを見ないことにはイメージが湧きづらいと思うんですけども、
やっぱりワクワクしますよね。テキストでプロンプトを打つことで音楽が生成される。
こういった経験というのはなかなかないので、ぜひ使ってみたいと思うんですけども、
残念ながらですね、一般公開というのはまだされていません。予定日などもですね、まだ現時点ではアナウンスされていないので、
このAdobeの新サービスですね、ちょっともう1回名前をお伝えします。
Project MusicGen AI Control。これはですね、今のところ一般公開はまだされていません。
ただですね、YouTube動画でも上げていることもあるので、そんなに遠くない未来、このサービスが使えるのかなと思います。
新しい情報が入り次第、こちらのポッドキャストでもお伝えしていきたいと思います。
音のジャンルで言うと音楽以外にもですね、音声のサービスもあるんですね。
例えば11LABOという音声AIのサービスがあります。
これはですね、入力したテキストを音声に変換してくれるサービスになります。
例えばですね、そうですね、私がテキストでこんにちはロボシンクの矢野ですと入力するとですね、
その入力したテキストを音声に変換してくれるというものになります。
この11LABOにはですね、男性の声とか女性の声というサンプルがもうすでに用意されていて、
そういった声で音声を作ることができます。
ちなみにこの11LABOで面白いのがですね、自分の声を学習させて自分の声で音声を作ることもできるんですね。
これちょっとあのサンプルを撮ってみたので聞いてみましょうか。
皆さんこんにちは矢野てっぺいです。どうでしょうか。
今の音声というのはですね、私の声をAIに学習させて作らせた音声になります。
声は似ていましたでしょうか。ちょっともう1回かけてみます。
皆さんこんにちは矢野てっぺいです。
学習の量を増やすとですね、よりリアルな音声に近づいていくのかなと思います。
この11LABOはですね、無料からでも利用できます。
私がさっき使った機能ですね、自分の声を登録してそれをAIに学習させるという、
これは無料版では使えない機能なんですけども、
有料版のスタータープランでもですね、最初の初月が1ドルから使えるので、
興味のある方はこちらもぜひ試してみてください。
概要欄にリンクを貼っておきます。
この11LABOというのがですね、海外のサービスなんですけども、
国内で言うとですね、声フォントというサービスもあります。
これですね、まだ触ったことがない方いらっしゃったらですね、
ちょっとぜひアクセスしてみてください。面白いですよ。
これあの自分の声も登録できますし、
あとは声優さんがですね、すでにデータを提供しているので、
そういった声優の方とかナレーターの方とかのですね、
登録した方の声を使って生成することもできます。
で、これは面白いことにですね、
あのひろゆきさん、にちゃんの創始者のですね、
ひろゆきさんがあの音声のデータを提供しているので、
ひろゆきさんの声も生成できるんですよ。
これちょっとあのサンプルあるので聞いてみましょうか。
簡単にオイラの声を真似できるんですよね。
これですね、ひろゆきさんの声を録音したものを流しているわけじゃないです。
こちらでテキストで支持した内容をですね、
生成AIがひろゆきさんの声で生成した音声になります。
かなりですね、その声色が似てるのもありますけど、
欲要とか話し方とかそういった点も再現性が高いですよね。
ちょっともう一つサンプルあるので聞いてみます。
それってあなたの感想ですよね。
もうこれほぼほぼ本人ですよね。
この音声を聞いて、
AIが生成した音声っていうのを見分けれる人少ないんじゃないかなと思いますね。
この声フォントもですね、
サイトにアクセスするとトップページでいろいろ試せるので、
その中にひろゆきさんもいます。
試せるので興味のある方はこちらもアクセスしてみてください。
概要欄に貼っておきます。
ちなみにですね、チャットGPTでも音声出力っていうのはできるんですね。
これはテキストトゥスピーチというモデルが使われてるんですけども、
チャットGPTでも音声で回答を出力することができます。
ちょっと試しにかけてみます。
こんにちは。音楽生成AIについてどう思いますか。
生成AIについては非常に革新的であり、
音楽業界に新たな可能性を提供していると思います。
このチャットGPTの音声出力機能というのは以前から実装されてたんですけども、
やっぱり初めて使った時は少し驚きましたね。
音声がですね、何と言いますか、言い淀んだりとか、
うーんとかいうフレーズとかを使ってくるんですね。
妙に人間ぽいリアルさがあるような音声出力機能になります。
これはですね、アプリ版でも使えますし、
ブラウザでも使えるようになるという機能だったかな。
オープンAIの方からアナウンスがあったので、
こちらもぜひ興味ある方は使ってみてください。
この音声出力機能はですね、英語学習なんかに使っている人も多いみたいですね。
ちなみに私はですね、頭の整理とかをしたい時とか、
あとはジョギング中とかにチャットGPTのこの機能をオンにしておいてですね、
AIと会話をしながら頭の中を整理するみたいな使い方もしています。
ここまで音に関する生成AIについて紹介してきましたけれども、