1. PODCAST AMBASSADOR / ポッドキャストアンバサダー
  2. #124 音声技術の未来の話〜AI..
2022-06-06 10:52

#124 音声技術の未来の話〜AIからクローンまで

ポッドキャストを楽しむ番組 ポッドキャストアンバサダー

機械音声が進んでいる⁉️
AIからクローン技術まで、今の音声技術を使ってどんなもの?できることとは?

【本編で紹介した会社】

▶︎Descript:https://www.descript.com/

▶︎Resemble AI:https://www.resemble.ai/

【本編に関連するエピソード】

第21話 ポッドキャスト翻訳プロジェクト

→Appleはこちら

→Spotifyはこちら


▶お便りフォームはこちら→https://forms.gle/CQ5ANhnbQ8GG5Zqy6

▶Twitter @RinaAraiLevia でもコメントお待ちしております。

▶noteはこちら→https://note.com/rinaarailevia

サマリー

「音声技術の未来についての話がされている。自動音声やAIを使った音声技術はすでに身近であり、更に音声のクローン技術や翻訳技術も発展している。これらの技術を活用することで、人々は自分達の声を世界中に配信したり、ポッドキャストの編集を簡単に行ったりすることが可能になる。」

音声技術の現状
ポッドキャストを楽しむ番組、PODCAST AMBASSADOR。この番組では、ボイシーパーソナリティーポッドキャスターである、あらいりなが、ポッドキャスターによる、ポッドキャスターのための、ポッドキャスト番組です。
さて、6月に入りました、第1週目のエピソードです。今回はですね、ちょっと音声技術の未来の話をしたいなと思っております。
最近、巷でも耳にするようになった機械音声の技術、本当に今、進んできてるんですよね。
今日は、そんな音声技術の未来をテーマに、どんな種類があるのか、どんなことができそうかという、ちょっと楽しい話をしていきたいと思います。
それでは、本編をお楽しみください。
さて、今回は音声技術の話です。
音声技術というと、ちょっと硬いなと思われるかもしれないんですが、実はもうすでに皆さんも体験していらっしゃるかもしれないお話です。
音声技術というと、機械で音声を読んでくれるというようなイメージがあるかと思います。
ただ、その中にも実はいろんな種類がありまして、そこをですね、今、実際どんな種類があるのかといったところ、あとこれからそれを使ってどんなことができそうかという、ちょっと楽しい妄想の話をしていきたいと思います。
まずは、どんな種類があるのかというのをサクッとお話したいと思うんですけれども、まず、今身近に使えるもの2つほどあります。
1つ目はですね、自動音声と言われるものです。これ、ピンとくる方多いんじゃないかなと思います。
例えば、券売機でですね、チケットを買うときなんかに機械がありがとうございましたって言ってくれるよ、これまさにそれですよね。
それこそ機械とかソフトがあって、原稿さえあればですね、それを自動で機械が読み上げてくれるというものです。
結構棒読みのものとかもあったりするんですけれども、こういう種類も男性女性というのが選べたりとか、最近ではいろんなアニメのキャラクターっぽいものから選べたりっていうのもあるようです。
2つ目はですね、このその自動音声よりさらにちょっと精度が高いものとして最近耳にすることが多くなったもの、これがAIを使った音声ですね。
これ、何が違うかというと、人間の声により近いニュアンスで機械が読み上げてくれるようになっているそうなんです。
これ、例えばネット上でも検索すると、日本でも何社もですね、こういうAIを使った自動音声のサービスをしている会社結構あります。
これを使ったですね、例えばポッドキャストとかニュース記事とかっていうのも最近あったりするので、あれちょっと変かなというぐらいの違和感で、ただスラスラと例えば毎日のニュースを読んでくれたりとかするので、結構これもですね、ぐっと身近になっている音声技術のものではないかなというふうに思います。
これが今二つ、自動音声とAIを使った音声、これ結構身近に使っているかなと思うんですけれども、ここからはもう二つご紹介したいと思います。
これですね、海外で結構進んでいるものになるんですね。
その一つが音声のクローン技術です。
これその名の通りですね、自分の声のクローンを作ってくれるという技術なんですね。
例えばこの自分の声のデータさえあればですね、そこから自分が言っていない言葉とか文章でも、原稿さえそのソフトに打ち込めばですね、その音声を作ってくれるんですよ。
音声のクローン技術と翻訳技術
例えば、ポッドキャストでこのクローン技術を使った場合、どんなことができるかというと、たまたまですね、ポッドキャストは静かな環境で録音機をできないなという時にも、そのデータがある状態でですね、原稿さえ作ってしまえば、そのプログラムに入れて、自分は録音していないのに自分で喋ったポッドキャスターが作れてしまうというような技術なんですね。
それこそ忙しいポッドキャスターの方なんかには夢のような技術なんじゃないかなと思うんですが、このクローン技術、これを作っている会社でいくつかあってですね、その一つも私実は使ったことがあります。
これはディスクリプトというポッドキャスター向けのオーディオ編集ツールなんですけれども、これですね、オーディオの編集がものすごく簡単になるなというふうに思いました。
これどういうふうな使い方かというと、例えばポッドキャスターを収録しますよね、その音声データがあるという状態でそのプログラムを立ち上げます。
で、それをですね、そのデータをそのプログラムに入れると書き起こしをまず作ってくれるんですね、自分で。
で、その書き起こしの文章を見ながら自分が編集できるんです。で、その文字を見ながら、ここの言葉いらないとかカットをしたりできる上にですね、さらにすごいのが、この言葉を別の言葉に変えたいなと思ったら、
通常だったら自分でまた音を取り直さなきゃいけないんですけれども、このプログラムを使えばですね、その言語を書き換えれば、その音声も修正してくれるというようなプログラムなんですよ。すごいんですよね。
ただ一つ難点があって、当時はこのプログラムを使える言語は英語しか対応してなかったんですね。日本語には対応してなかったんです。
で、この会社だけではないんですけれども、こういうクローン技術、盛り上がっているものの、やはり日本語から日本語とか英語から英語とか、同じ言語感でするというものが結構大半多いんですね。
ただそれにしても、やっぱりこの編集がものすごく楽になるというところもすごくプラスのポイントだと思いますし、自分の声でいろんな、例えば文章とか言葉とかが言える、自動的に作ってくれるというのもものすごい技術じゃないかなというふうに思います。
さらに最後紹介したいのが、このクローン技術、さらにそれを超えようとしているものがあります。これが音声のクローン技術プラス翻訳がついたものなんです。
これ想像してみていただきたいんですけれども、自分が日本語で収録したポッドキャストがありますと、それを自分はフランス語とか英語とかスペイン語とかペラペラじゃないのに、自分の声でそのいろんな言語で同じ内容が世界中に配信できるというような技術なんですね。
これもリゼンブルAIというカナダの会社が作っている技術になります。これは言語間の翻訳機能というのもつけたクローン技術というのを今作っていっているんですね。
日本語は実はまだなんですけれども、現在でもすでに英語からフランス語とかスペイン語とか中国語とかいろんな言語に何言語か対応しているんですよ。これものすごく有名な話だなと思います。
こういう技術、なんで私がそもそもすごく興味を持っていたかというと、実は5年ほど前に私がポッドキャストでやりたかったことなんです。技術開発というのではなくて、もともとポッドキャスト翻訳プロジェクトというのを実はやりたくてポッドキャストを始めたんですね。まさにこれなんです。
このポッドキャスト翻訳プロジェクトというのは、このポッドキャストアンバサダーシーズン1でシリーズでリリースしたエピソードがあるんですけれども、要は自分の好きな英語のポッドキャストを日本語に翻訳して、日本語で吹き替えをしてリリースをするというプロジェクトだったんですね。これまさにこれなんですよ。
で、その当時私はすでに1本この英語のポッドキャストを翻訳して原稿まで作ってナレーターの人も選出してといったところまで実はやってたんですが、今ですねもう技術の方が先にやってきたという感じなんですよね。
さらにこの今の最後の技術を使えばですね、例えば他の他人が自分の声を吹き替えするんじゃなくて、自分の声でですね、本当に世界中にいろんなものが届けられるという世界線に来ているので、これはですね、ぜひ皆さんももしかしたら世界中に発信したいという内容があったときに使いたいと思う音声技術なんじゃないかなというふうに思います。
私もですね、こういった企業と組んで番組を配信するっていうなんてものすごい面白いことだなというふうに思いますし、私もぜひですね、こういった分野でポッドキャストアンバサダーとしてサポートできる役割どんどんしていきたいなというふうに思っています。ということで今回はどんどん進む音声技術についてお話をしてみました。
さて、今回のエピソードいかがでしたでしょうか。私も最近ですね、実は音声のAIのサービスとか音声技術に関してちょっと耳にする機会が多かったので、海外の方ではどういうふうになっているのかなっていったところも少し調べて一緒にお届けをしてみました。
ただこの声のクローン技術って結構モラルの点で難しい面があるんですよね。それこそ勝手に自分が意図しない内容のものがこういうふうにクローンでですね、作られて配信されてしまったりというようなケースもなきにしもあらずなので、こういったところを乗り越えた先にこういうふうにポッドキャストをいろんな言語でですね、自分の声で配信できるというような夢のような世界もあるのかなというふうに思いました。
皆さんどういうふうに思われましたでしょうか。この音声技術の未来の話、また皆さんの感想をお聞かせいただければ嬉しいです。今回のエピソードの感想はツイッターやお便りフォームよりお待ちしております。
ポッドキャストの番組概要欄にも記載しておりますので、ぜひチェックしてみてください。そして番組フォローやレビューも大変励みになります。ぜひよろしくお願いいたします。最後までお付き合いいただきありがとうございました。
ポッドキャストアンバサダーの新井里奈がお送りしました。それでは次回のエピソードで。
10:52

コメント

スクロール