1. 拝啓、3000年の人類へ
  2. S2-34 AI楽曲生成の現在地【作..
2024-07-16 15:14

S2-34 AI楽曲生成の現在地【作ってみた編】

2024年の楽曲生成AIの実力は?

触って生成した曲を紹介しながら、現状の楽曲生成AIの課題についてお話しします。


この番組は、西暦3000年の、未来を生きる人類に向けて、現代人が日々感じることや、ワクワクする未来への想いを発信し、今を生きる皆さんと一緒に、未来に音声を残そうとする番組です。



https://suno.com/@echo3000


BGM素材:DOVA-SYNDOROME、効果音ラボ


X@echo3000_radio https://twitter.com/echo3000_radio


感想等は #echo3000 でツイートしていただけると喜びマス

00:00
皆さんこんにちは、あっちゃんです。
ポッドキャストアーシスが無事に終わりまして、久々の通常回です。 お聞きの通り、番組のオープニングも一緒にしてお届けします。
今回と次回ですが、2回にわたって AI作曲をテーマにお話をしていきます。
前半の今回では、実際に触ってみた AI作曲サービスのお話や、AIで生成をした曲の紹介、
さらに、生成してみてわかった現状の AI楽曲生成の課題について語っていきたいと思います。
次回の後半では、AI作曲を通じて気づいた アーティストの皆さんの凄さ、そして我々使う側が認識すべき倫理観についてお話をしていく予定です。
では、前編スタートです。 さて、オープニングの曲、何か気づいたことはありませんでしたか?
実はですね、曲の歌詞が過去番組で配信をしたエピソードをインスパイアしたものになっていました。
そうなんです。 オープニングの楽曲は、今回取り上げる
AIで生成をした楽曲になります。 具体的にはシーズン1のエピソード12
宇宙航で駅弁を買いたい人たちの中で出てきました 宇宙に向かう宇宙船の窓辺でたこ焼きを食べるというシーンをもとに
僕、あっちゃんが作詞をしたものになります。 この作曲したものを
AI楽曲生成サービス 具体的にはSUNOというサービスなんですが
こちらを使いまして楽曲として生成をしました このSUNOというサービスなんですが、何ができるかと言いますと
パートごとの歌詞であったり、楽曲スタイルといった入力の文章をもとにして BGMであったり
歌詞が入った曲を 生成することができるものになってまして
日本語のボーカルを含む曲も生成することができるサービスとなっています 加えてですね
曲の好きな再生時間から拡張生成というものもできて 途中から楽曲のテイストを変えたり
03:06
この部分をちょっとこういうふうに変えたいんだよなっていうような指示をして 生成をし直すということも可能になっています
オープニングの曲については AIで作曲した曲という前提を話さずに流していましたので
もう一曲作曲をして生成をした曲をご紹介したいと思います
こちらも僕自身が作詞をしていますので ぜひ僕の語弊力についてもご注目ください
タイトルは夏雲です どうぞ
さてこの曲は僕がイメージをした 中学生のけだるい夏を歌詞にしたものです
中学生の夏 将来もわからずなんか全部だるいから全部サボってあてもなく
夏の街をさまよう感じを書いています 具体的な話になると今とか将来とかくだらなくて悲観をするのに
なんか超人的な能力が自分には実はあるんじゃないか という妄想力は一丁前というような中学生時代
アスファルトが陽炎に昇っているような暑い夏にあてもなくさまよっています たまたま視界に入った団地の集合住宅から入道グマが登っていて
なんか屋上から登っていけそうだなっていうふうに見えるんですけど 屋上まで登ってみると
実はグマはもっと先にあって 登ることができなさそう
そんな悔しい思いをしていたら 入道グマは
06:02
入道グマは黙々と形を変えてゴロゴロと雷鳴を響かせる 赤乱雲になって
そして夕立ちが降って土砂降りになって ああ帰れない階段下で
雨雲が止むまで足踏みをするみたいなエピソードをイメージしています ということでもう一曲ご紹介しながら
AI作曲サービスを触ったお話をしていこうと思うんですけども 初感としては自分が作曲した歌詞の内容はさておき
それっぽい曲になっててとても驚きました 最初曲が出てきたとき
本当にびっくりしました ここまで手軽に曲が作れるということもそうなんですけども
歌詞がある程度破綻しない形でメロディーに合わせて歌えていることが本当にすごいなと思いました
この歌詞ですらチャットGPTとか使えば 数秒で作ることもできますので
作詞作曲が数秒でできてしまうという世界がここまで来ているということに少し怖さすらも感じました
ただちゃんと曲を聴いてみると 現在の楽曲生成についてはまだまだできていないことがたくさんあるということにも気づくことができます
例えば 歌詞の漢字の読みこちらが間違っている箇所
実は何箇所もあったんですね 鉄に扉と書いててっぴと普通は読むんですけども
曲の中では鉄扉と呼んでいたり オープニングの曲の中で出てきた宇宙港というところもよく聞くと宇宙港と呼んでいたりします
こちらはおそらく多言語の楽曲、歌詞で学習されている 楽曲生成のAIモデルが十分な量の日本語のデータで
学習できていないことも一つの理由なんじゃないかなと思っています この生成AIというものは文字の並びであったり音の流れを学習しているので
学習が少ない単語であったり 読み方が学習されていない単語というようなものは
データが十分ではないので 正しい発音で発話がされていない
という可能性があったりします あとは声質の揺れなんてものもあったりします
普通は曲といえば同じ人が最初から最後まで一貫して歌うのですが AI作曲の中では一部急に声質が変わることもあったりします
09:11
よくよく聞いていただくと声質が安定していない箇所が 何箇所かあったりするのがわかるかなと思うんですけども
これも曲の流れを重視していて きちんとパートごとに一貫したものが
まだ出てきてないのかなと思っています この今使っている楽曲生成のAIなんですけども
おそらく今の音がこうだから次の曲はこうだろうという 流れに沿ったものを順番にそれっぽく出しているだけなので
最初からすべてのパートが合成された状態で出力されている形になっていると思います おそらくそのパート分けがきちんとされずにまとめられて生成されているところも
声質とかメロディーとか各パートの楽器が安定しない原因の一つかなと思っています そうして生成された曲について感じた課題としては
良くも悪くも聞ける曲であるというところかなと思っています というのもですね
今お話をしたように曲全体を一つの音として出力をしているためか 曲が全体的にのっぺりした感じになっていたり
歌詞の声量と楽器の声量がきちんと調整されていなかったり きちんと歌詞が発音できないところが
いくつもあったことがこの良くも悪くも聞ける曲というふうに感じる原因なのかなと思っています 曲聴いていただいたらわかるかなと思うんですけども
ステレオで出力されている点はすごいんですけど 個別の楽器であったり歌声の音量バランスや
手効性もまだまだのっぺりされていて これも改善されるといいなと思いました
ただ生成AIの面白いところは もしかしたら僕がこの歌詞とかスタイルを生成するところにまだまだ問題がある可能性があって
このAIへの指示の書き方の工夫でこののっぺり感とか手効性って 変えられる可能性もあるんですよね
例えば今出力されたものに加えて クリアな音声にしてとか
曲と楽器の濃淡をもっとはっきりさせてというふうに指示を与えたりすると もしかしたらこの辺ももう少し良くなる可能性が
12:02
あるというのはあるんですよね この辺が生成AIの面白いところではあるんですけども
生成AIの能力を引き出すためには僕自身のその指示の仕方というところも一因として はあったりするのかもしれません
あとはですねこういう形で 全体の曲として出力をしていますが
パーツごとに出力をするというのも 改善方法の一つの手かもしれません
例えばまずは bgm として出力をしてから 歌声を乗せて統合したりとか
楽器ごとに生成をして個別に音量調整をしてから 合成をするなんてやり方を使えば
今よりも良い曲を作ることができるかなと思います 既存の AI の中にも
楽曲をパーツごとに抽出するというものもあったりするので 一度全体を出力をしてから個別に分けて調整をして再合成をする
というやり方も実はあったりするんですけども まあこれ自体も今後出てくるような
楽曲生成 AI ではもしかしたら 調整できるようになっているのかもしれません
ということで一見すごくうまく生成できてるなと感じた 楽曲生成 AI ですけどもよくよく聞いてみると曲のあちこちにまだまだ改善の余地がある
ということもわかったので 楽曲生成を学ぶとてもいい機会になったかなと思いました
エンディングですということで楽曲生成 AI の前半戦 作ってみた編はここまでになります
流れている曲が気になるなと思われた方はぜひ 概要欄に記載のあっちゃんのSUのアカウント
ご覧ください 次回後半編では正しく競争使用編と題しまして
僕らが持つべき倫理感であったり曲に向き合う アーティストの凄さみたいなところをお話ししていこうと思います
次回もぜひお楽しみください 番組では感想をお待ちしています
Xのハッシュタグエコー3000までお寄せください AI や皆さんが気になる未来のことをコメントをお待ちしています
15:00
では今回はここまでです現代人の皆さんも未来人の皆さんもまた次回お会いしましょう じゃあね
15:14

コメント

スクロール