音声メディアの進化
にゃおのリテラシーを考えるラジオ、読書と編集の千葉直樹です。
このチャンネルでは、読書とIT時代の読み書きソロ版を中心に、様々な話をしています。
今回のタイトルは、音声メディアとテキストメディアの行く先と、もっと先を予想する、というものです。
水曜日は、ITを中心とした技術的な話をしています。
このポッドキャストは、リッスンというサービスで自動文字起こしをしてみています。
リッスンは、日々機能が急成長しています。
ある日、自動で目字が作られるようになったと思ったら、ついこの間は話している人の声を識別して、文章にアイコンが付けられるようになりました。
対談形式の時に、文の頭にアイコンが付いていると読みやすくなります。
文字起こしも話者識別機能にしても、精度はまた向上するでしょうし、表示のデザインなどももっと使いやすくなるでしょうけど、
音声とテキストという、これまでは別物だったメディアの垣根がなくなるのを見ると、もっと面白いことができそうなので、今回は僕の想像を話してみたいと思います。
まず一つ目は、リアルタイムの文字起こしが使えるサービスが出てくるということです。
これはすでにYouTubeやZoomのようなテレカンファレンスサービスで実現されつつありますが、多分もっと手軽なメジャーサービスが出てくると思います。
サービスというよりも、スマホやパソコンの標準機能になるという方向でしょうか。
二つ目は音声合成です。
今でも音声合成でテキストを読み上げることができますが、もっと精度と自然さが向上します。
何より自分の声を学習させて喋らせることができるようになるでしょう。
これもスマホやパソコンの標準機能になるでしょうけど、それとは別にサービス化の方向も出てきます。
ブログサービスには本人の声で放つ機能が搭載されるでしょう。
そして話し方を高度にコントロールする方法が出てくるでしょう。
もちろん歌を歌うこともできそうです。
本人の個性を出すために、声や話し方を学習する機能が重要になります。
これを日常の音声で行えるようになりますが、音声のクオリティを上げるためのトレーニングが一般的なビジネスになるでしょう。
結果として、個性的な声データを販売することができるようになりそうです。
音声のクオリティとライブメディアの価値
今度はリアルタイムメディアの価値が上がってきます。
アーカイブではなく、ライブで話すことが今よりもずっと価値を持つのです。
そのためには、ライブであることを証明する仕組みが必要になるでしょう。
そうなると、一箇所に何万人も集めるライブの価値は少し下がるというか、大量生産される商品のようなランクになるでしょう。
少数が集まる、本当にライブの価値を感じられるイベントは、今よりもたくさんお金を集められるようになるはずです。
文章を書くこと自体は、AIとの組み合わせで一種のコモディティ化し、合わせて魅力的な話し方ができることが価値を持つようになるでしょう。
もちろん他の人に読んでもらってもいいですが、本人であることが価値を持つということが起きてくるかもしれませんし、コラボレーションの相乗効果が出てくる場合もきっとあります。
自分の書いた文章を好きな声優さんに読んでもらうということは、今より手軽にできるようになって、推し活はさらにはかどります。
音声で起きることは同時並行で、動画メディアでも起きてきます。
技術的に盛ることが普通になると、リアルな本人の価値が上がったり下がったりするでしょう。
盛るのではなく、オリジナルの自分であることを証明できる人に人気が集まるでしょう。
これ、角度を変えてみると、一歩先のメタバースの話のような気がします。
これまでのメタバースは、多分解像度が白黒テレビくらいだったのではないでしょうか。
Listenの自動持ち起こしは、一見大きな変化ではなさそうで、本質がガラッと変わることを予感させるサービスだと思います。
今回は、Listenの持ち起こしから、音声メディアとテキストメディアの行く先ともっと先を予想するという話をしました。
今日はここまで。
読書と編集では、ITを特別なものではなく、常識的なリテラシーとして広める活動をしています。
ITリテラシーの基礎を学べるオンライン講座をやっています。
詳しい内容については、概要欄のリンクから。
または、読書と編集と検索して、猫がトップページに出てくるホームページをご覧ください。
この配信の書き起こしをノートで連載しています。
概要欄にリンクがありますので、フォローいただけると嬉しいです。
今日もワクワクする日でありますように。
千葉直樹でした。ではまた。