1. Audiostart News
  2. AIで音楽や声は作れる?最新技..
AIで音楽や声は作れる?最新技術がもたらす創作の未来とは?
2026-06-22 06:21

AIで音楽や声は作れる?最新技術がもたらす創作の未来とは?

このエピソードでは、音声メディアとAI技術の最前線を紹介します。プロンプトや歌詞から手軽にオリジナル楽曲を生成できる「CraftMusic.AI」
や、表現力豊かなボーカルや曲中のジャンル切り替えに対応したElevenLabsの「Music v2」
など、クリエイターの創作を支援する最新AIツールが登場しています
。さらに、NTTの音声AI技術を活用し、わずかな過去のデータからその人らしい声を日本語だけでなく多言語で再現する「Project
XrossVoice」など、声を失った方のコミュニケーションを支援する画期的なサービスも開始されています
。AIによって進化する「音楽」と「声」のテクノロジーが、私たちの表現や生活をどう変えていくのか、最新動向をわかりやすく解説します。

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

音声メディアの利用者が過去最高を記録する中、AI技術の進化により、誰もが簡単に音楽や音声コンテンツを制作できる時代が到来しました。これにより、創作のハードルが劇的に下がり、エンターテインメントだけでなく、病気などで声を失った人々を支援する社会課題解決にも貢献しています。さらに、リスナーが能動的にコンテンツを共有するようになり、企業や多様なコミュニティの参入も進んでいます。

音声メディアの驚異的な成長と制作環境の変化
Audiostart Newsへようこそ。この番組は、ロボットスタートによる音声広告やポッドキャストなど、音声業界の最新情報をお伝えする番組です。
今日も音声業界について学んでいきましょう。
あのー、今、アメリカの人口の半分近くがある同じ習慣を持っています。
ええ、音声メディアですね。
はい。本日の振興を担当します。エジソンリサーチの最新データによれば、アメリカの12歳以上の月間音声番組利用者が、推定1億6700万人に達しました。これは過去最高の数字です。
解説を担当します。本当に驚くべき数字です。
なぜ、リスナーのあなたが普段聞いているこの音声というメディアに、これほど人が集まっているのか。今回の深掘り解説では、この現象の裏側を紐解いていきます。
よろしくお願いします。
えーと、聞く人が増えている背景には、作る環境の劇的な変化があります。音を作るハードルが、かつてないほど下がっているわけです。
作るハードルが下がっているんですか。
その通りです。例えば、テキストや歌詞を入力するだけで、オリジナル楽曲を作れるクラフトミュージック.AIというサービスが正式リリースされました。
テキストを入れるだけで曲ができるんですね。
ええ。さらに、11LOVESのMusicV2は多言語に対応しています。生成した楽曲の商用利用も可能です。
なるほど。つまり、音楽制作の知識が一切なくても、頭の中のアイディアをすぐ音にできる状態になっているわけです。
はい。誰もが簡単に作れるようになっています。
AIによる社会課題解決と声の再現技術
ただ、そこまで簡単に作れるとなると、世の中に似たようなコンテンツが溢れすぎないか、少し気になります。
まあ、確かにそういう懸念はあります。しかし、AIの合成技術はエンターテインメントだけではなく、人間の声の領域で社会課題の解決にも使われています。
社会課題の解決に、ですか?
はい。withALSという団体のプロジェクトクロスボイスという取り組みがあります。これは、病気などで声を失う可能性がある方が、過去のわずかな録音データから、自分らしい声を多言語で再現できるというものです。
ああ、それはご本人やご家族にとってはかり知れない救いになります。自分の声で再びコミュニケーションが取れるようになるわけですから。
ええ、本当にその通りです。また、東京外国語大学で、ボカロイド開発者のケンモチ・ヒデキ氏が、合成音声と多文化共生について講演を行います。
これも、合成された声の社会的影響力が大きくなっている証拠と言えます。
コンテンツ拡散の進化とリスナーの能動的役割
なるほど。誰もが声や音を作れるようになった結果、次に起きているのが、その作られた多様な音声が世界にどう広がっていくかという変化ですね。
はい。番組自体も多様化しています。オーストラリアのランキングでは、ママミアアウトラウドという番組が主位を獲得しました。
そうなると、作ったものを多くの人に届ける仕組みも必要になりますね。
ええ。そこで拡散を支えるツールも進化しています。スポティファイは、番組のお気に入りの瞬間だけを切り取って、保存や共有ができるクリップ機能を導入しました。
リスナーが自分で切り取れるわけですね。
はい。また、レディオチョッピットは、月額1650円で、音声番組の見どころをSNS用の動画に変換できる新プランを始めています。
あの、音声をわざわざ動画にするというのは、音声本来の良さを消してしまうような気もします。
まあ、そこが今の市場を読み解く鍵になります。これまでの音声は、長い時間をかけて聞く受動的なメディアでした。
じっくり聞くものという印象です。
ええ。しかし、クリップ機能や動画化ツールの登場で、リスナーのあなたがお気に入りの場面を切り取って自ら拡散する能動的な役割に変わってきているわけです。
なるほど。動画化は音声を早く広く拡散するための手段として機能しているわけですね。リスナーが自ら発信を助ける存在になっていると。
企業参入と多様な価値観の発信
はい。それだけ熱量が高ければ、当然企業もその場を活用したくなります。
企業も参入も進んでいるんでしょうか。
ええ。ボイシーが企業向けの番組制作サービス、ポッドカストスタジオを開始し、ファンベースカンパニーとも提携しました。
企業が独自に発信する場を作っているんですね。
はい。さらに、IASはスポティファイの広告をエピソード単位で最適化する仕組みを提供しています。
広告の仕組みも整ってきていると。他の企業の動きもありますか。
日経MJが記者の取材の裏側を語るヒットの路地裏という新番組を始めました。また、周囲者が声優の朗読を無料で聞けるオーディオブック企画、夏オートを実施したりしています。
企業が続々と参入している理由はよくわかります。ただ、音声が持つ強みは企業のような大きな組織だけのものではないはずです。
ええ、おっしゃる通りです。むしろ、多様な価値観を届ける場として選ばれています。
どういった事例があるんでしょうか。
CNRが渋谷パルコでクイアと本をテーマにした公開収録を行いました。また、神奈川県の障害福祉番組ズレズレが、現場で働く方や当事者の出演者を広く募集したりしています。
音声は声のトーンや息遣いが直接伝わりますから、お互いを深く理解するための場として機能しているというわけですね。
AI時代の言葉の価値への問いかけ
はい。AIやツールの進化によって誰もが発信し、共有できる時代が到来しています。
1億6070万人という驚異的なリスナー数の裏には、テクノロジーによる制作のハードル低下とリスナー自身の行動の変化がありました。
ええ、本当に多くの変化です。
そこで、最後にリスナーのあなたに一つ考えてみて欲しいことがあります。
AIがあなたの声や音楽を簡単に作れるようになり、多様な価値観がかつてないスピードで共有される時代です。
はい。
その中で、あなた自身の本物の言葉の価値は今後どのように変わっていくのでしょうか。
ぜひ、ご自身の中で答えを探してみてください。
本日の深堀り解説は以上です。
今回のニュースは以上です。
もっと詳しい情報を知りたい方は、オーディオスタートニュースで検索してください。
ではまた次回お会いしましょう。
06:21

コメント

スクロール