S2-34 AI楽曲生成の現在地【作ってみた編】

00:00

皆さんこんにちは、あっちゃんです。

ポッドキャストアーシスが無事に終わりまして、久々の通常回です。お聞きの通り、番組のオープニングも一緒にしてお届けします。

今回と次回ですが、2回にわたって AI作曲をテーマにお話をしていきます。

前半の今回では、実際に触ってみた AI作曲サービスのお話や、AIで生成をした曲の紹介、

さらに、生成してみてわかった現状の AI楽曲生成の課題について語っていきたいと思います。

次回の後半では、AI作曲を通じて気づいたアーティストの皆さんの凄さ、そして我々使う側が認識すべき倫理観についてお話をしていく予定です。

では、前編スタートです。さて、オープニングの曲、何か気づいたことはありませんでしたか?

実はですね、曲の歌詞が過去番組で配信をしたエピソードをインスパイアしたものになっていました。

そうなんです。オープニングの楽曲は、今回取り上げる

AIで生成をした楽曲になります。具体的にはシーズン1のエピソード12

宇宙航で駅弁を買いたい人たちの中で出てきました宇宙に向かう宇宙船の窓辺でたこ焼きを食べるというシーンをもとに

僕、あっちゃんが作詞をしたものになります。この作曲したものを

AI楽曲生成サービス具体的にはSUNOというサービスなんですが

こちらを使いまして楽曲として生成をしましたこのSUNOというサービスなんですが、何ができるかと言いますと

パートごとの歌詞であったり、楽曲スタイルといった入力の文章をもとにして BGMであったり

歌詞が入った曲を生成することができるものになってまして

日本語のボーカルを含む曲も生成することができるサービスとなっています加えてですね

曲の好きな再生時間から拡張生成というものもできて途中から楽曲のテイストを変えたり

03:06

この部分をちょっとこういうふうに変えたいんだよなっていうような指示をして生成をし直すということも可能になっています

オープニングの曲については AIで作曲した曲という前提を話さずに流していましたので

もう一曲作曲をして生成をした曲をご紹介したいと思います

こちらも僕自身が作詞をしていますのでぜひ僕の語弊力についてもご注目ください

タイトルは夏雲ですどうぞ

さてこの曲は僕がイメージをした中学生のけだるい夏を歌詞にしたものです

中学生の夏将来もわからずなんか全部だるいから全部サボってあてもなく

夏の街をさまよう感じを書いています具体的な話になると今とか将来とかくだらなくて悲観をするのに

なんか超人的な能力が自分には実はあるんじゃないかという妄想力は一丁前というような中学生時代

アスファルトが陽炎に昇っているような暑い夏にあてもなくさまよっていますたまたま視界に入った団地の集合住宅から入道グマが登っていて

なんか屋上から登っていけそうだなっていうふうに見えるんですけど屋上まで登ってみると

実はグマはもっと先にあって登ることができなさそう

そんな悔しい思いをしていたら入道グマは

06:02

入道グマは黙々と形を変えてゴロゴロと雷鳴を響かせる赤乱雲になって

そして夕立ちが降って土砂降りになってああ帰れない階段下で

雨雲が止むまで足踏みをするみたいなエピソードをイメージしていますということでもう一曲ご紹介しながら

AI作曲サービスを触ったお話をしていこうと思うんですけども初感としては自分が作曲した歌詞の内容はさておき

それっぽい曲になっててとても驚きました最初曲が出てきたとき

本当にびっくりしましたここまで手軽に曲が作れるということもそうなんですけども

歌詞がある程度破綻しない形でメロディーに合わせて歌えていることが本当にすごいなと思いました

この歌詞ですらチャットGPTとか使えば数秒で作ることもできますので

作詞作曲が数秒でできてしまうという世界がここまで来ているということに少し怖さすらも感じました

ただちゃんと曲を聴いてみると現在の楽曲生成についてはまだまだできていないことがたくさんあるということにも気づくことができます

例えば歌詞の漢字の読みこちらが間違っている箇所

実は何箇所もあったんですね鉄に扉と書いててっぴと普通は読むんですけども

曲の中では鉄扉と呼んでいたりオープニングの曲の中で出てきた宇宙港というところもよく聞くと宇宙港と呼んでいたりします

こちらはおそらく多言語の楽曲、歌詞で学習されている楽曲生成のAIモデルが十分な量の日本語のデータで

学習できていないことも一つの理由なんじゃないかなと思っていますこの生成AIというものは文字の並びであったり音の流れを学習しているので

学習が少ない単語であったり読み方が学習されていない単語というようなものは

データが十分ではないので正しい発音で発話がされていない

という可能性があったりしますあとは声質の揺れなんてものもあったりします

普通は曲といえば同じ人が最初から最後まで一貫して歌うのですが AI作曲の中では一部急に声質が変わることもあったりします

09:11

よくよく聞いていただくと声質が安定していない箇所が何箇所かあったりするのがわかるかなと思うんですけども

これも曲の流れを重視していてきちんとパートごとに一貫したものが

まだ出てきてないのかなと思っていますこの今使っている楽曲生成のAIなんですけども

おそらく今の音がこうだから次の曲はこうだろうという流れに沿ったものを順番にそれっぽく出しているだけなので

最初からすべてのパートが合成された状態で出力されている形になっていると思いますおそらくそのパート分けがきちんとされずにまとめられて生成されているところも

声質とかメロディーとか各パートの楽器が安定しない原因の一つかなと思っていますそうして生成された曲について感じた課題としては

良くも悪くも聞ける曲であるというところかなと思っていますというのもですね

今お話をしたように曲全体を一つの音として出力をしているためか曲が全体的にのっぺりした感じになっていたり

歌詞の声量と楽器の声量がきちんと調整されていなかったりきちんと歌詞が発音できないところが

いくつもあったことがこの良くも悪くも聞ける曲というふうに感じる原因なのかなと思っています曲聴いていただいたらわかるかなと思うんですけども

ステレオで出力されている点はすごいんですけど個別の楽器であったり歌声の音量バランスや

手効性もまだまだのっぺりされていてこれも改善されるといいなと思いました

ただ生成AIの面白いところはもしかしたら僕がこの歌詞とかスタイルを生成するところにまだまだ問題がある可能性があって

このAIへの指示の書き方の工夫でこののっぺり感とか手効性って変えられる可能性もあるんですよね

例えば今出力されたものに加えてクリアな音声にしてとか

曲と楽器の濃淡をもっとはっきりさせてというふうに指示を与えたりするともしかしたらこの辺ももう少し良くなる可能性が

12:02

あるというのはあるんですよねこの辺が生成AIの面白いところではあるんですけども

生成AIの能力を引き出すためには僕自身のその指示の仕方というところも一因としてはあったりするのかもしれません

あとはですねこういう形で全体の曲として出力をしていますが

パーツごとに出力をするというのも改善方法の一つの手かもしれません

例えばまずは bgm として出力をしてから歌声を乗せて統合したりとか

楽器ごとに生成をして個別に音量調整をしてから合成をするなんてやり方を使えば

今よりも良い曲を作ることができるかなと思います既存の AI の中にも

楽曲をパーツごとに抽出するというものもあったりするので一度全体を出力をしてから個別に分けて調整をして再合成をする

というやり方も実はあったりするんですけどもまあこれ自体も今後出てくるような

楽曲生成 AI ではもしかしたら調整できるようになっているのかもしれません

ということで一見すごくうまく生成できてるなと感じた楽曲生成 AI ですけどもよくよく聞いてみると曲のあちこちにまだまだ改善の余地がある

ということもわかったので楽曲生成を学ぶとてもいい機会になったかなと思いました

エンディングですということで楽曲生成 AI の前半戦作ってみた編はここまでになります

流れている曲が気になるなと思われた方はぜひ概要欄に記載のあっちゃんのSUのアカウント

ご覧ください次回後半編では正しく競争使用編と題しまして

僕らが持つべき倫理感であったり曲に向き合うアーティストの凄さみたいなところをお話ししていこうと思います

次回もぜひお楽しみください番組では感想をお待ちしています

Xのハッシュタグエコー3000までお寄せください AI や皆さんが気になる未来のことをコメントをお待ちしています

15:00

では今回はここまでです現代人の皆さんも未来人の皆さんもまた次回お会いしましょうじゃあね

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

拝啓、3000年の人類へ

感想

総スター数

コメント

感想を書く

こちらもおすすめ