1. Audiostart News
  2. #996 Stability AIが音声生成A..
2024-04-05 02:08

#996 Stability AIが音声生成AI「Stable Audio 2.0」を発表、プロンプト入力で最長3分の音楽生成可能

生成系AI開発のStability AIが、音声生成AI「Stable Audio 2.0」を発表しました。今回はこのサービスを紹介します。
00:01
Audiostart Newsへようこそ。ロボットスタートによる音声業界の最新情報をお伝えする番組です。
生成系AI開発のStability AIが、音声生成AI、Stable Audio 2.0を発表しました。
今回はこのサービスを紹介します。
Stable Audio 2.0とは、Stable Audioは、Stability AIの画像生成AIモデル、Stable Diffusionの使い方と一緒で、
プロンプトに希望する音楽を支持するだけで音楽が生成されるというものです。
最初のバージョン、Stable Audio 1.0は、2023年9月にリリースされ、タイムシの2023年ベスト発明の一つに選ばれています。
今回の最新バージョン、Stable Audio 2.0では、テキストからオーディオを生成するだけでなく、
オーディオを入力として、別のオーディオを生成することもできるようになりました。
もちろん、テキストとオーディオを組み合わせて新しい音楽を生成することもできます。
また、出力は44.1kHzのステレオで、最長3分間のきちんと曲として成立したものが生成されるなど、大幅にアップデートされています。
実際にやってみた。
とりあえず、実験としてジャジなヒップホップBGMを作ってみました。
プロンプトにはジャジヒップホップと入力しただけなんですけども、
ジェネレートボタンを押して待つこと数分間、曲が完成しました。
イメージした通り、チルアウトなローファイ感のある作品が完成しました。
蒸気再生ボタンを押すことで出来上がった曲を聞くことができます。
いかがでしょうか。他にも子供向け音楽やアフリカっぽい音楽などを生成してみましたが、
プロンプトの指示に近い形で生成されて満足度は高いです。
ステーブルラジオでチェック。
ステーブルオーディオで生成されたトラックをフィーチャーした24時間年中無休のライブストリーム、
ステーブルラジオをYouTubeで聞くことができます。
いやはやレベルの高さに驚きです。
ではまた。
02:08

コメント

スクロール