1. Audiostart News
  2. #212 rinnaがテキスト入力で音..
2023-06-13 04:00

#212 rinnaがテキスト入力で音声合成とフェイスモーション生成を同時に行う「Koemotion」発表!

rinnaがテキストを入力するだけで音声合成とフェイスモーション生成を同時にできるサービス「Koemotion(コエモーション)」の提供開始とAPIの公開を発表しました。今回はこのニュースをお伝えします。

【AD】
Audiostartでは、ポッドキャストに音声広告を掲載したい広告主を募集中です。詳細は以下のリンク先をご覧ください。
https://bit.ly/41jPwyu

【AD】
Audiostartでは、音声広告を掲載して広告報酬を受け取りたいポッドキャスターの方を募集しています。法人・個人問いません。詳細は以下のリンク先をご覧ください。
https://bit.ly/3GSVv5P
「声モーション」の開発の概要
Audiostart Newsへようこそ。
この番組は、ロボットスタートによる音声広告やポッドキャストなど、音声業界の最新情報をお伝えする番組です。
リンナが、テキストを入力するだけで音声合成とフェイスモーション生成を同時にできるサービス、
声モーションの提供開始とAPIの公開を発表しました。
今回はこのニュースをお伝えします。
今回提供開始となった声モーションは、
AIチューバーリンナで用いられている音声合成とフェイスモーション生成の技術を発展させ、
多種多様な音声の合成と合成した音声と同期するフェイスモーションを作り出せるAI生成サービス。
サービス名も声、エモーション、モーションを組み合わせた絶妙なネーミングセンスになっています。
声モーションで使われている音声合成には2023年3月に先行公開されていた声色マップが組み込まれており、
従来の音声合成製品のように事前に用意された特定の話者の音声を合成するのではなく、
二次元マップから任意の座標を選択することで話者の声色を多種多様に変更して音声を合成することができます。
座標の上の方は高い声で女性っぽく、座標の下の方は低い声で男性っぽく、
自分の好きな座標を画面でクリックして音声合成を試してみましたが、独自性のある声を作るのは簡単でした。
さらに座標で指定した話者の声色に7種類の感情、通常、喜び、悲しみ、怒り、恐れ、驚き、囁きを指定した上で音声合成することもできます。
「声モーション」の活用方法とプラン
また、入力されたテキストから感情をついて、予測して発話する機能も搭載されています。
使ってみた感じ、声のバリエーションは豊富すぎて選ぶのに迷うほどです。
いろいろやってみましたが、ささやきで合成した声は他で類を見ない仕上がりでした。
声モーションは、この音声合成声色マップで作られた音声と同期したフェイスモーションを生成することができるのが最大の売りです。
2D、3Dモデルや画像生成AIと組み合わせることで、キャラクターの表情を音声に合わせて動かせることができるようになるというわけです。
フェイスモーションのサンプル動画も公開されました。
ユーザーが指定したテキストで作られた音声合成と表情がシンクロするのだからすごいですよね。
この声モーションの活用イメージとして、アナウンスや電話での音声応答、多くのキャラクターが登場する小説のオーディオブック化や動画制作、
ゲームのNPCの音声、AIチューバー配信などが挙げられています。
利用はブラウザ上からもしくはAPI経由の2通り、料金は個人、法人向けに利用目的に合わせたプランが用意されています。
月額基本料金は0円から12万円、1リクエストあたりの課金料金は0円から2円となっています。
音声合成サービスにフェイスモーションを付けた声モーション、他社音声合成サービスとはかなり位置づけの違うサービスとして興味深いサービスだと思います。
ではまた。
今回のニュースは以上です。もっと詳しい情報を知りたい場合、オーディオスタートニュースで検索してみてください。
ではまたお会いしましょう。
04:00

コメント

スクロール