1. ご当地ソングが好きすぎる
  2. 配信182:生成AIを使うと音声..
2025-03-10 05:23

配信182:生成AIを使うと音声配信はもっと楽しくなる

spotify apple_podcasts
AIを使えるようになると、音声配信がもっと楽しくなるという話。

【番組紹介】
・地名が出てくる歌のコレクターによる配信。
・国内唯一のご当地ソングメディア「ご当地ソング捜索隊」(府中コミュニティFMラジオフチューズ内のラジオ番組)のバックナンバーも、時々お届けします。
・ラジオ放送は、毎月第4土曜日 ~絶賛放送中。

【パーソナリティ】
◆ワタンド
本配信のメインパーソナリティ。地名が出てくる歌のコレクター。都市と音楽が大好き。多摩地域で暮らす。
◆しゃり
ラジオ放送のパーソナリティ。ご当地ソングは素人。オーストラリア在住のエンジニアで主にリモート参加。

【Twitter】
https://twitter.com/RRwatandia
【note】
https://note.com/localsong

サマリー

今回、生成AIが音声配信に与える影響とその活用方法が紹介されます。特に、プロンプトエンジニアリングや音声入力による表現の進化に焦点が当てられ、音声配信の便利さが実感されています。

生成AIの活用法
ご番です。この配信は、地名が出てくる歌が好きな ワタン・ドガーをお届けするポッドキャストです。
よろしくお願いします。
今回は、生成AIと音声配信の話です。
音声配信にどんな感じで生成AIが活用できるかなというところです。
生成AIを使ってますか?
GPTとかGeminiとかいろいろありますけども、
結構出てきた当時は、プロンプトエンジニアリングみたいな感じで
伝え方で全然アウトプット違いますよね、みたいな。
やっぱりこの伝え方が、プロンプトが重要ですよね、みたいな
イメージが結構あったかなというふうにも思います。
一方で、結構最近、生成AIを使う話を見る中では、
音声入力で、言葉でこうしてくれ、ああしてくれって言ったら、
言葉、交互表現でも十分生成AIが理解してくれて、
要点を抑えたアウトプットを出してくれるみたいな感じで、
言葉で伝えるのが多いですね、みたいな話題を結構見るんですよね。
これを聞いてから、音声入力をよくするようになったんですけど、
まあいいですね、まあいい、めちゃめちゃ便利になっているなというふうに感じます。
なので、結構音声配信にもGPTを使うようになってきましたね。
使い方としては、話題の構成みたいな、
こういった話をしようと思っているんだけど、
簡単に構成考えてみたいなところを、
簡単な話すメモ書きみたいなのを作ってもらうこともあるし、
あとは、出来上がった音声配信の結果を今文字起こししているんだけども、
その文字起こしを読み込ませて、
再構成というか、この話題の中で不足していたものは何ですかとか、
こういう話題があるといいんじゃないですかみたいなところを出してもらうみたいな、
反省会、一人反省会みたいなものもお願いするようにしてみました。
これが結構面白くて、
こういう話題も追加したほうが理解しやすいですよとか、
論理の中でこういったエピソードを間に入れたほうが、
少し伝わり、話の流れが良くなりますよみたいなこととか、
結構いい感じで出してくれるんですよね。
すごい勉強になるなというふうに思いました。
今どうなんだろう、
テキスト化したものを生成AIに読んでもらっているので、
そういう意味ではあくまでテキスト情報として評価してくれている感じなんだよね。
これを多分時間の問題だと思うんだけども、
ゆくゆくは多分音声データそのままに評価してくれるようになると思うんだよね。
そうすると、あなたの話し方の中でもっとこういう抑揚をつけたほうがいいですよとか、
このエピソードとこのエピソードの間はもうちょっと取ったほうがいいですよとか、
音声配信の未来
そういう評価がすぐに出せるようになっていくんじゃないのかなというふうにも思うんですよね。
本当にちょっとした癖の言い回しとかで、
この表現は独特であなたの強みですよとか、
そういったものも出てきたらすごい面白いなというふうに思っています。
最近、お笑いの漫才大会で、
下振明状の素子名さんの漫才の好評がすごい的確だみたいな記事を見たんですね。
確かにその漫才の好評の内容が、
これまでの漫才の好評って、すごい全体的に面白いかとか、
公正みたいな評価が多かったかなと思うんだけど、
素子名の漫才に対する指摘みたいなのが、
声のボリュームの話とか、間の取り方とか、
このボケの出し方とか、
すごい一つ一つの技術的な表現に対する評価も入ってて、
そこがすごい新鮮で、
ああなるほど、こういう視点も漫才ってあるんだって聞いてて面白かったんですよね。
それって多分すごい参考になるんだろうなと思って、
そういうことの積み上げできっと漫才もできてるんだろうから。
だからある種、もしかしたらこういうのが、
漫才はかなり技術的な面があるから、
AI化できるのかわからないけど、
もっと一般論的なところで、
言葉の表現、抑揚の付け方、
声のボリューム、
ヒゲって呼ばれるようなAとかRとか、
そういうのの多さとか、
そういったところの評価は十分AIでもできる範囲なのかなと思うので、
こういうのができてくると、
的確なプレゼン能力とか、
そういうのも見てもらえる時代が来るのかなというふうにも思ってます。
そういうのあったらぜひ見てもらいたいなというふうにも思って、
我芸?我芸じゃねえか。
音声配信とかは上手になって、
うまく伝えられるようになるといいなと思っているので、
そういった直接音声をAIが添削してくれたら、
楽しいなというふうにも思ってます。
そんなわけで、
今回はAIと音声配信の話でした。
またお会いいたしましょう。おばんでした。
05:23

コメント

スクロール