3行まとめ
・文字起こしをAI読み上げする
・さらにはそれを自分の声で
・大臣のスピーチも変わるかも?
サマリー
このエピソードでは、文字起こしの可能性について話しています。音声のクオリティが問題であり、テキストデータを音声で読み上げる技術の進化により、よりリアルな音声メディアを楽しむことができるようになっています。
テキストデータの読み上げ技術の進化
おはようございます。前回は、このぼいろぐでは、 テキストを文字起こしするということを、
単なる音声のPodcastよりは重視したいという話をしたんですけれども、 この話をもうちょっと進めて話をすると、
技術がどんどん進化してきている中で、 可能性があと2つぐらい先に広がりそうなのかなという見通しを持っています。
1つは、もともとは喋った音声。 それの音声を生で聞くと、音質が悪いとか、ノイズがすごい多いとか、 すごい間が空いているとかいうのがあります。
Podcastのアプリで、間を取り除いてくれるアプリとかもありますけれども、 全体的に音質のクオリティが辛い。音が大きすぎる、小さすぎる。
いろいろあると思うんですよね。内容は面白いけれども、聞くに絶えないPodcastだから聞けないみたいなやつもあると思っています。
僕自身もそういう感覚を持ったことはあるんで。
それとは別の話として、テクノロジーの進化で、 最近はテキストデータがあれば、それを読み上げてくれるということがどんどんできるようになってきていると思うんですよね。
時々、漢字の読み方を間違えたりすることもまだまだすごく多いですけれども、 それでもかなりスムーズにリアルに読んでくれるし、
個人的にはそんなにリアルじゃなくても、ロボットボイスで読んでくれれば それはそれで楽しいんですけれども、
そういう感じで読み上げてくれるので、そうすれば音で撮ったやつがテキストになって、 さらにテキストから音になって、音声メディアとして楽しむこともできるのかなというふうに思います。
じゃあちょっと余談ですけれども、最近はMacだと結構読み上げしてくれるし、 最近Windowsでもできるんですけれども、Macのほうが簡単にできるかなと思っているのと、
あと最近一番簡単にできる方法としては、WebのコンテンツであればEdgeっていうマイクロソフトのブラウザーだと すごい簡単に音声読み上げをしてくれるかなというふうに思っています。
そうやって音声読み上げをやってくれるのがすごくいいんですけれども、 さらにもう一つテクノロジーとして、
これは今はAppleとかもやってるし、他でもやってると思うんですけども、 ちょっとやっぱり禁断のテクノロジー扱いされることもあるみたいですけれども、
自分の声で文字起こしをテキストファイルを音声でしゃべってくれるっていうことも、 テクノロジーとしてはほぼ実現はできる状態になってきていると思うんですよね。
そうすればまさに自分の声で自分が書いたテキストを読み上げてくれるので、 楽できていいなという世界が広がるんじゃないかなと思っています。
プレゼンテーションの進化
ここまで来ると、次に思うこととしてはプレゼンテーションですね。
今までPowerPointをめくりながらプレゼンの人がしゃべるみたいなプレゼンの方式とか、 最近はコロナになってリモート、リアル会場じゃなくてライブじゃなくて、
リモートからZoomとかでしゃべるとかということも増えてきているんじゃないかなと思うんですけれども、
そうすると、それは事前に収録しとくという形が現実的になってくれて、 最近はAppleのイベントとかもそんな感じで、
映画みたいにするという感じに切り替わってきていると思うんですよね。
ライブの良さ、収録の良さはそれぞれあると思うんですけれども、 そこの進化というのは考えられるのかなというふうに思います。
先日、CEATECというオープニングイベントの情報をどこかで見たんですけれども、
その時に首相とか大臣とかがスピーチとかするわけですけれども、
そういう時にしゃべれないよという、あまりアドリブでしゃべっていないと思うんですよね。
どういうことをしゃべるとか、場合によっては原稿があってその原稿を読み上げるみたいな感じになっているわけですけれども、
各人がすごいスキルを持ってテキストを読んでいるというのを、
いかにも今自分が読んでいるのではなくて、読んでいないふうにしゃべるというテクニックみたいなのがあるなというふうに感じまして、
そういうので一つのスキルとしてはあるんですけれども、
そういうのもテクノロジーで変えられる可能性のある部分なんじゃないかなというのを感じたりしております。
ということで今日は以上です。ではまた明日。
05:16
スクロール