1. 耳ヨリな音の話-音マーケティング情報-
  2. #015 声優さん俳優さんの声を..
2023-10-03 24:53

#015 声優さん俳優さんの声をマスターにした合成音声サービスについて‐ゲストはGADGETの大藤友宏さん-

spotify apple_podcasts

<ゲスト>

株式会社GADGET 大藤友宏さん


<トークテーマ>

●AI合成音声について ()

  • AI合成音声とは?
  • AI合成音声の特長について
  • AI合成音声はどんなことに活用できるのか


●声優さん、俳優さんの「声」をマスターにした合成音声サービス ()

  • FutureVoice Actorsとは?
  • 著名人の声を再現した合成音声の生成
  • どんな声優さん、俳優さんの声が使用できる?
  • どんなことに活用されているか?事例の紹介


●AI合成音声を利用したオーディオブックアプリ()

  • VICKEの特徴
  • 声優による声による収録とAI合成音声の違い
  • 肉声のように聴こえる高音質な合成音声
  • 新聞・雑誌のニュース記事の掲載



<関連リンク>

FutureVoiceActors

https://www.futurevoice.jp/lineup/futurevoice-actors/


VICKE Audiobook&News(ビッケ オーディオブックアンドニュース)

https://app.vicke.world/

App Storeページ:https://apps.apple.com/jp/app/id6450325994

Google Playページ:https://play.google.com/store/apps/details?id=jp.gadgetinc.vicke_app.prod


GADGET(公式サイト)

https://gadgetinc.jp/

ウェビナーアーカイブはこちらからダウンロードください。


<Twitterハッシュタグ>

#ミミヨリ



<音マーケティング (note)>

https://note.com/d2cradmimi/

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

サマリー

AI合成音声を利用した各サービスについてお話しできればと思います。大藤友宏さんがゲストとして登場し、声優さんの声をマスターにした合成音声サービスについて詳しく説明しました。広告やオーディオブックなどのサービスを合成音声を使って展開することで、よりパーソナルな呼びかけや高揚感を生み出すことが期待されています。また、AI合成音声を活用したオーディオブックアプリビッケについても話し、将来的に展望が広がる技術として紹介されました。

AI合成音声の概要
耳ヨリな音の話-音マーケティンク情報-。
デジタル広告代理店D2C Rの、田無橋翔太です。
この番組は、音を使ったマーケティングについてお話しするポッドキャスト番組です。
本日は、私、田無橋が進行いたします。よろしくお願いいたします。
さて、本日のテーマはAI合成音声です。
AI合成音声を利用した各サービスについてお話しできればと思います。
前回はですね、アップブリューの一ノ瀬さんを交えて、
AI合成音声の広告活用についてお話をさせていただきました。
今回は、その技術がどんなことに活用できるのか、
AI合成音声の可能性についてですね、ゲストをお招きしてお話ししてまいります。
それでは、番組スタートです。
本日のゲストをご紹介いたします。株式会社GADGETの大藤友宏さんです。
大藤さん、よろしくお願いします。
よろしくお願いします。初めまして、株式会社GADGETの大藤と申します。
弊社では、設立してまだ10年の若い会社なんですが、
主に映画やCMなどの動画のコンテンツ制作ですとか、
あとはグラフィック、ACGとかですね、制作をしておりました。
現在では、ラガン3Dといってですね、新宿のアルタビル横にあるですね、
飛び出す映像とか、ご覧になったことあるかな?
ありますね。
あれのですね、UFOとか、あとディズニーさんのコンテンツの紹介とか、
八景島シーパーアラダイスのですね、飛び出す車地とか、そんなものを作っております。
結構、信号待ちしている人たちがですね、スマホをかざしてですね、
見て拡散するみたいなところがありまして。
すごく目につきますよね。
ありがとうございます。
もう一つがですね、本日のお話の中心となります、
AI合成音声の授業を3年ほど前から開始いたしました。
音声コンテンツですとか、音声広告、こういったところの授業を活動的に行っております。
ありがとうございます。よろしくお願いします。
ガジェットさんとは、まさにD2CRがですね、音声マーケティングに取り組み始めたときから、
諸々活動をですね、ご一緒させていただきまして、
まさに前回ゲストで来ていただいたアトブリウスさんみたいに、
AI合成音声を広告に活用するっていう分野を中心にですね、
ご一緒させていただく機会が多いかなというふうに思っております。
DAITOさんにつきましては、ちょうど先日ですね、
ウェビナーもご一緒させていただきまして、
そのときのウェビナーもですね、TikTokの動画でAI合成音声をうまく活用するには、
みたいなテーマで実施をさせていただきました。
実際ウェビナー一緒にやってみてDAITOさんいかがでしたか?
すごい楽しかったですね。
ありがとうございます。
もともと我々も動画作ってて、
動画を音声をうまく活用できたらなと思ってたんですけど、
非常にリチカさん、ご一緒された方もですね、活動的にやらせていて、
非常に面白かったです。
ありがとうございます。
ぜひですね、内容が気になる方はですね、
アーカイブの動画もございまして、
ガジェットさんの今、公式ホームページに掲載ございますので、
そちらにアクセスいただければなというふうに思います。
リンクも概要欄のほうに載せておきますので、
ぜひ興味ある方はですね、そちらからご覧いただければと思います。
皆さまに持ち帰っていただけるような情報が入ってるのではないかなというふうに思いますので、
ぜひぜひよろしくお願いします。
はい、では早速ですね、DAITOさんと最初のトピックについてお話ししていければなというふうに思ってますが、
まずはそもそもAI合成音声というものがどんな技術なのかみたいなところをですね、
少しお話しいただければなというふうに思います。
どういったサービスで、かつどんなものに活用されていっているのかみたいなところを、
AI合成音声の技術と可能性
まずはちょっとご説明いただけますでしょうか。
はい、AI合成音声っていうのは、もともと話をする方の音声をデータとして処理させてもらって、
機械的に作り出すことです。
従来まで音声合成っていうのはすごくロボット的な感情もなく、とにかく機械的に喋っているものだったと思うんですけども、
今ディープラーニングによって人の喋り方だったりとか、あとは文章、文節ですね。
この文章だったらこういうイントネーションとか、この文節だったらこのぐらい間を空けましょうみたいなものをどんどん学んでいって、
より人間に近しい感じで喋らせることができるのがAI合成音声ですね。
だからよりナチュラルな感じというか、自然な感じの音声が生成されるみたいなイメージっていうんですかね。
そうですね。あとは話者というか人の声の特徴ですね。
その人の声の音域だったりとか、そこに感情も伴うところもあるんですけども、
こういったもののデータを少量でも、例えば近しいデータと付け合わせることによって同じような音声が作られるので、
収録を例えば何時間もかけて今までやってたんですけども、これが効率的にデータとして処理できれば、
実際の声に近いものができてしまうようなものになります。
なるほど。これ需要があるかどうかわからないんですけど、
例えばこの棚橋さんの声もある程度の情報量があれば、それに近しい声で合成音声として生成できるみたいなイメージを持っています。
そうですね。
なるほど、そうなんですね。
声質というところと発話というところが別々に動いていて、
声質っていうのは、例えば棚橋さんの声質っていうのはある意味唯一無二なものがあります。
ただ棚橋さんがいきなりこれをフランス語で喋るとか韓国語で喋るとかって多分難しいと思うんですよ。
そうですね。
ただその唯一無二の棚橋さんの声質を使ってフランス語で喋ってみたりとか韓国語にしてみたりみたいなものはテキストの音声変換というところでできるので、
今後はそういった活用もできるかなと思っています。
なるほど。そう聞くとやっぱりいろんなところにきっと活用できるんだろうなっていうふうに思ってるんですけど、
今現在こういうところに活用されてますよみたいなイメージとかって何かございますか?
そうですね。今だと割とデジタルメディアにおいて使われるケースが多くて、
例えばテキストの情報を即時に音声に伝えるニュースの原稿を実際にアナウンサーが読み上げることなくバーチャルなアナウンサーが読み上げてくれたりとか、
あとオフライン上ではロボットで受付をしてくれる。
我々がちょっとやってたところはキティちゃんの声で受付をされている産業さんの受付はやられているけども、そういったところに使ったりとか、
あとデジタルサイネージ上でキャラクターと会話ができる、対話ができるっていうものとかそういったところに活用されてます。
ありがとうございます。デジタルサイネージとは動画とか静止画を映すと駅中とか、
AI合成音声の活用と広告的な可能性
あとはその周辺にあるデジタルの看板みたいなものを指すと思うんですけど、その認識だったんですよね。
ありがとうございます。
ざっくりですね、AI合成音声周りについてご説明いただいたと思いますが、
その中ですね、音社ではその技術を利用した新しいサービスも既にリリースされているということなんですが、
そちらについても詳しくお聞かせいただければというふうに思ってます。
声優さんとか著名人の方ってやっぱり声に結構特徴があるので、
その声をマスターにして合成音声サービスとして一般のユーザーさんにご利用いただけるサービスとして、
Future Voice Actorsというのがリリースいたしました。
これどんなものかというと、本当に手軽なツールでそのウェブ上にテキストを打ち込むことで、
いつでもどこでもその声優さんの声を生成できるようなサービスになります。
声自体も単調な喋り方から入ってちょっと感情を上げてみましょうとか、
もうちょっとシックな感じ、トーンを落としてじっくり話しましょうみたいな再現ができるツールになっていまして、
こちらのサービスはNTTグループのNTTテクノクロスさんと合成音声の技術を一緒に活用させていただいたのと、
あとキーになる声優さんの音声マスターですね。
こちらは声優事務所のアクロスエンターテイメントさんという、
秘密の刃のかまど炭治郎で有名な花江夏樹さんとか、
あとちょっと懐かしいんですけどアニメのラブライブの内田綾子さんが、
あとバラエティにも結構登場されているお尻かじり虫の金田智子さん。
もうちょっと聞いただけでめちゃくちゃ特徴のある、
ああいった方々のマスターを生成させていただき活用させていただいています。
なるほど。
声優さんとかってそもそもキャスティングとかあとは収録をしてっていうところを考えると、
その人たちの特有の声がある種手軽にというかツール上で生成できるっていうのは、
単純にそこだけ聞いてもすごくメリットが大きいんじゃないかなというふうに僕も感じるんですけども、
そういったところも踏まえて他にこういう特徴がありますよとか、
その特徴を用いてこんなことに活用してますよみたいな事例とかってあったりしますか。
そうですね。やっぱり音による純粋想起ってすごく高いと思っていて、
この人の声だとこの商品だよねとか、
この喋り方だとこんな感情になるよっていうのが音と声とかで直結すると思う。
なので一番は広告的な活用が今後は未来があるんじゃないかなというふうに思っています。
声優さんの声を活用した合成音声サービス
広告活用ですね。まさに我々も声優さんの声ではないんですけど広告活用という形で、
まさにツール上で手軽に音声を生成できることによって、
PDCへのスピードが、クリエイティブの差し替えのスピードが上がったりとかっていうメリットは肌で感じてたりもしますので、
そういったところにも多分今後はうまく活用できるサービスになっていくんじゃないかなというふうには感じております。
例えば某開店寿司チェーン店さんでは、
花江夏月さんの声でいらっしゃいませ、ありがとうございましたってあると思うんですけど、
あれが今後はその合成音声を生かすことによって、
花江さんいらっしゃいませ、花江さんありがとうございましたっていうパーソナルな呼びかけに変わっていくので、
より喜びというか高揚感というかですね、そういったものが生まれてくるかなと思っています。
確かにその場で生成できるっていうところをうまくメリットとして活用して、
一対一のコミュニケーションができるってなった場合に結構お客さんとしても多分テンション上がると思いますし、
また来たいなっていう印象にもしてくれるんじゃないかなっていうふうに思うので、
まさにそういったところにこのフューチャーボイスアクターズっていうのが、
今後展開としては予想できるんじゃないかなっていうのがすごくイメージが湧きました。
ありがとうございます。
実際に聞いてみますか。
実際に作った声があるので、皆さんに聞いていただくといいかなと思います。
ぜひお願いします。
市場調査会社デジタルインフォクトの推計では、
国内のデジタル音声広告市場は2022年に休信し、
2021年の50億円から2.9倍の145億円規模に、
25年までに420億円へ拡大する見通しを示している。
これですね、そのままウェブサイトにあるニュースの原稿を貼り付けただけなんです。
例えば市場調査会社っていうのは漢字ですし、
2022年とか50億円とか2.9倍っていうのはそのままテキストで数字の情報を入れただけなんですよ。
でもこれを読み取って漢字を表現も加えて読み上げるっていうものになります。
すごく自然な感じで、ナチュラルに聞けたなっていうふうに思ってます。
よく読むもそうですし、読むペースというかスピード感も含めて違和感なくというか。
本当そうですね、実際僕今日ここに来なくて原稿だけを渡して読んでもいいんじゃないかって思うぐらい。
そんなこともできちゃいけないかね。
そういうポッドキャストもなかなか新しい取り組みとしてはあるかもしれないですね。
ちょっとこっそりチャレンジしてみましょうか。
棚橋のボイスを。
これはクイズにしたりとか、これは生声なんでしょうかとかそういうのもあります。
確かにそれぐらいのクオリティになってきたってことですよね。
そうですね。
昔はやっぱり先ほどもありましたけど、やっぱりロボットっぽいイメージがどうしてもAI合成音声というか合成音声ですか、そのものにはあったと思うんですけど。
やっぱりそこから違和感を感じて、ある種商品だったりとかサービスを紹介してた場合にちょっと離脱してしまうみたいな、
ちょっとネガティブ寄りに働いてしまうみたいなこともあったのかなっていうふうに思ってますが、
まさにそこが今すごく自然体になってるっていうのと、
あとはこれは私個人感じる部分ではありますけど、
SNSとかの普及によってそもそもこういう合成音声に対しての許容度がユーザーの皆さんも広がっているっていうのもあるので、
ますますこういったAI合成音声が日常化していって溶け込んでいって自然なものになっていくんじゃないかなというふうには思ってたりしますね。
なんか結構一定リズムで喋ることによって多少ピッチを上げて、
例えば1.5倍速とか1.25倍速でYouTubeを見る人多いと思うんですけど、
あのリズムに合成音声って結構なじみやすくて、
同じリズムだからこそ情報がすんなり入ってくるっていうこともあるんですよね。
確かに。
で、そこにちょっと声優さんの掛け声とかそういうのをかますことでよりそこが強調されて、
頭の中に脳裏に焼き付きやすいところはあるかもしれないです。
確かにそのコントロールがしやすいのもならではですよね。
編集でできてしまうというか、ある種一つのパターンが出来上がったらそれにはめることもできるし。
なるほど。
メソッドを活かしやすいのもメリットの一つかもしれないですね。
オーディオブックのサービス展開
はい、これまでフューチャーボイスアクターズのお話を中心にしていただきましたが、
それ以外にも合成音声を活用したサービス、ガジェットさんの方でやられているというふうにお聞きしておりまして、
そちらについても教えていただけますか。
はい、我々その合成音声のサービスというか、エンジンを活かしてですね、
オーディオブックのサービスというのを始めました。
まず何より結構リスナーの皆さんも実感されているかなと思うんですけど、
外を歩いているとほとんど多くの人がですね、ワイヤレスヘッドホンというかですね、
つけてますね。
ハンズフリーな状態ですね。
私もつけてます。
いらっしゃる方多いかなと思っていて、
あれはやっぱりその情報を耳から入れていくことの便利さというのが非常にあるかなと思っています。
オーディオブックでも手軽に素早く情報収集できるということで、
だいぶサービスが進捗していて、
規模としてもですね、数年前の10倍規模に今増えてきている状況で、
21年度ですかね、今140億円程度で今推移していると。
ここはもう結構やっぱりAmazonさんですとか、
オーディオブックの著名なメディアさんが進捗されていると思うんですけども、
今後ですね、我々もAI合成のAI音声を活かしてですね、
コンテンツの生成というのをやっていこうと思っていまして、
そこで始めたサービスがございます。
つまりサービス名。
サービス名がですね、ビッケオーディオブックという名前です。
これはAI合成音声を活用されているHoyaさんという会社さんと、
リードスピーカーというエンジンを使いまして生成したサービスになります。
同じようにAI合成音声を活用して、
コンテンツを自動で音声化していくサービスになるんですけども、
なんでビッケというのかちょっと気になります。
僕も実際にそのアニメは見たことないんですけど、
30年くらい前のアニメですかね、
小さなバイキングビッケっていうのが昔々ありまして、
バイキングっていう海賊のキャラクターなんですけども、
ビッケちゃん自体はですね、暴力が大嫌いで、
心配性な性格なんですけど、
行く先々で降りかかる事件や困難を、
知恵と勇気で乗り越えていくっていうちょっと感動的なお話。
ちょっとそこにちなんで始めたサービスなんですけども、
一応日本初のAI合成音声によるオーディオブックというのを歌っております。
肉声のように聞こえる高品質と声優の声で楽しめるサービスになっていて、
先ほどありました声優の声でオーディオブックが聞けるというものになっています。
オーディオブックっていうと結構一般書籍とか雑誌が多いかなと思うんですけども、
特徴としては社会一般スポーツ芸能といった日々更新されるニュースですね、
こちらの情報も聞いて知ることができるので、
例えばその通勤時間帯にサクッと情報収集したい、
手には両手がスマホでふさがって、
そういった時に耳から情報を収集することができる。
または即時に緊急速報みたいなのが入ってきた時も、
ハンズフリー状態でヘッドホンをつけているとニュースがそのまま入ってくる。
そういったサービスになっています。
ありがとうございます。まさに冒頭お話しいただいた通り、
街を歩いていると半分以上の人がイヤホンをつけられている印象が僕の中でもありまして、
これを見ると音声コンテンツとか音声サービスっていうのが全体的に普及してきているんだろうなと。
その中でもいろいろラジオですとか音楽ですとかあると思いますけど、
一つがオーディオブックっていうところがサービスの普及も著しいのかなというふうにまさに感じていたので、
そこにガジェットさんもAI合成音声って元々やられた強みも含めて参入されているって聞いたので、
すごく興味が湧いているところであります。
実際にこのAI合成音声でやることによるオーディオブックのサービスとしてのメリットというか、
こういうところに強みがありますみたいなお話で言うと、
先ほど声優さんのお話とかもありましたが、その他に何かこういうポイントがありますっていうのはございますか?
AI合成音声によるメリット
そうですね、一番はロングテールなコンテンツを作るためには品揃えが大事になっていると思うので、
ここがテキスト情報さえあればどんどん音声が生成されるんですね。
先ほどありましたニュースの情報とかも即時に生成することができます。
またはその例えばニュースの情報で言うと急な情報の変更だったりとか差し替えっていうのがあるんですけども、
こちらも即時に反映できるというところが特徴かなと思います。
あとは制作工数とかもだいぶ削減できたりもするんですかね、AI合成音声にすることに。
おっしゃる通りですね。
現状のオーディオブックは声優さんの生声で収録してるんですね。
なので制作費がすごく高くて一冊数十万円ぐらいかかっちゃいし、制作期間も1ヶ月ぐらいかかるんです。
なので例えば売れ筋の本であってもなかなかオーディオブック化されないし、
されたとしてもリクープって結構難しかったりするんですよ。
ただそれを合成音声にシフトすることで制作費も10分の1以下に低コスト化できますし、
短期的に作れるので非常に売れ筋になったものもロングテールな作品も制作が可能なので、
一気に市場だったりコンテンツの爆増っていうのが今後見込まれるのかなと思っています。
ありがとうございます。なるほどですね。
コンテンツがどんどんどんどん増えていくっていうことは業界的にもすごく大事なことだと思ってまして、
コンテンツが増える、ユーザーが増える、業界全体が盛り上がっていって、
さらに利用者が増えていくみたいな、その好循環を生む上でのコンテンツの拡充みたいなところは、
多分、もともとオーディオブックの市場全体でも課題だったと思うんですけど、
それを少し解決に近づけるような、今回AI合成音声を活用したっていうところなのかなというふうには思っているので、
これをきっかけに市場全体も、市場全体はもうすでに伸びてはいると思うんですけど、
そこを後押しするような形になるとすごくいいなというふうに個人的には思っています。ありがとうございます。
では、最後のトピックスとしまして、AI合成音声とか、あとは今お話しいただいたオーディオブックのところですね、
ガジェットさんとして、今後こういう展望をお持ちだというところがもしあればですね、ご協力いただければなと思いますがいかがでしょうか。
はい、AI合成音声の活用って商材利用だけじゃなくても一般のお客様にも活用できるといいなと思っていて、
例えば個人の方の声を復活させたりとか、あとは今現像の方の生存の方の声を収録することによって、
今後その方がお亡くなりになられた時もその人の声とあとはグラフィックですね、
その様子っていうのを残してあげることで将来的にも思い出作りができたりとか、
それができたら素晴らしいな素敵だなと思ったりしますね。
確かにそうですね、どうしてもこういう仕事をしていると商用利用的なところに目が行きがちではもちろんあるんですけども、
やっぱり声って先ほど大東さんからもありましたが、個人個人が持っている唯一無二のものであるからこそ、
そういう個々に即したサービスだったりとか、よりパーソナルなものにもどんどん活用できるんだろうなっていうところがあるので、
まさにそういった可能性が広がる一つの技術なのかなっていうふうに今日のお話を聞いて改めて思いました。
ありがとうございます。
声の復活とパーソナルなサービスの可能性
本日は株式会社ガジェットの大東さんにお越しいただきまして、
AI合成音声とそれを活用したオーディオブックアプリビッケについてお話しいただきましたが、
大東さん本日はいかがでしたでしょうか。
とても楽しかったです。
将来的な話ができるっていうのはすごい素敵だなと思います。
ありがとうございます。
ぜひまたこの場に来ていただければなというふうに思っていますが、
最後に何か告知ですとかお知らせはございますでしょうか。
先ほどご紹介いたしました声優の音声サービス、
Future Voice Actors はウェブで声優合成音声と検索いただければ出てきます。
ご利用は音声ファイルの作成だったりとか、月額のサブスク、
あとは企業様のシステムに組み込むスクラッチ型のサービスも可能ですので、ぜひ検索してみてください。
もう一つオーディオブックのビッケですね。
こちらはアプリストアでVICKEと入力いただければ出てきます。
こちら月額制のサービスなんですが、現在初月無料でご提供しておりますので、
ぜひともこちらのほうもご興味ある方は検索してみてください。
ぜひ皆さまよろしくお願いいたします。
両サービスとも概要欄のほうにもURLを記載しておきますので、
ぜひそちらからもアクセスしていただければなというふうに思います。
改めまして大人さん、本日はありがとうございました。
ありがとうございました。
さて、この番組では皆さまからの感想や質問を大募集しております。
Twitterのハッシュタグでカタカナ耳寄りをつけてツイートしてください。
音マーケティングに興味がある方はD2CRサイトお問い合わせページよりお気軽にご相談ください。
それではまたお会いしましょう。
お相手はD2CRのたなはしでした。さようなら。
24:53

コメント

スクロール