1. ピョン吉の航星日誌
  2. #465 音声メディアを文字に書..

ポッドキャストなどの音声メディアをAIによって、文字に書き起こしてくれる LISTEN STYLE(https://listen.style/)。文字にするだけでなく、自動的に音声メディアのブログ化みたいなことが実現できて面白いです。音声メディアの途中から聴くこともできるし、音声の引用も実現できます。音声と文字の良いとこ取りという感じです。まだ、文字の書き起こしは完璧ではないですが、いろいろと使い道がありそうです。

--- Send in a voice message: https://podcasters.spotify.com/pod/show/fukutan/message
音声メディアを文字に書き起こすサイト Listen Styleの紹介
はい、おはようございます。本日の放送は2023年の6月7日、水曜日です。 本日は第465回目の話となりまーす。
このチャンネルは福島県恒里間市在住の特撮アニメ漫画大好き親父のピョン吉が響きになったことをだらだら話をしていくという番組です。
そんな親父の一言を気になりまして、もしもあなたの心に何かが残ってしまったら、ごめんなさい。 悪気はなかったんです。
不幸にこの番組に興味を持ってしまったら、ぜひ今後もご協力のほどよろしくお願い致します。
今日はね、わけあってショートバージョンです。
最近ですね、リッスンというね、サイトを見つけてね、いろいろ試してるんですね。 リッスンでいいのかな?
このサイトはですね、音声配信メディアを書き起こしをしているサイトなんですよ。 この喋っている音声をですね、AIが自動的に文字にしているんですね。
リッスンスタイルっていうね、サイトなんですけどね。 リッスンっていうのが英語の普通の単語なんでね、検索してもなかなかそこにたどり着かないんですよね。
リッスン以外にですね、ポッドキャストとつければですね、多分出てくると思うんですよ。 ここですけどね、あのポッドキャストだとかね、あとスタンドエヘム、ラジオトークなどのですね、音声メディア。
それをですね、文字にしてくれて見出しをつけてくれるというサイトなんですね。 ハテナブーグなどのね、ハテナのね、創業者のね、近藤ジュニアさんという方がね、立ち上げたサービスだそうです。
オープンAIのね、ウィスパーというのを使ってね、ポッドキャストなどの音声をですね、自動的にですね、文字にしているんですね。
またですね、そのテキストですけどね、それを読みながらですね、好きな場所からですね、再生することもできるんですよ。
簡単に言えばですね、話していることはね、この音声のブログ化ということでしょうかね。 自分もこのようにですね、音声配信していますけどね。
正直ですね、これ聞く必要もないなぁということはありますよね。 ここを飛ばしたいなぁってね。よくよくあります。
文字だったらね、簡単に飛ばすことができるんですね。 でも音声だとね、例えば早送りしましょうとやっちゃうとですね、大事なところをね、
取り過ぎちゃったりしまして、 見つからなくてイライラーとすることってよくありますよね。
これはね、あの音声メディアの欠点だと思うんですね。 それはですね、この方式にやりますとないわけですよ。
音声とね、あと文字の良いとこ取りっていう感じですかね。 話している方もですね、このようにですね、話数が多くなってくるとね、
うちみたいに460とか超えちゃってますと、 これ以前話したよねーってことが多くなってきましたね。
それをですね、確認するのが一苦労なんですね。 それは確認するのが楽になります。
文字のね、書き起こしだけではなくてね、それぞれにですね、目字を作ってくれるというのも非常に便利ですね。
音声メディアの書き起こしですけどね、 実はスタンドFMっていうところで同じような仕組みをやってるんですね。
サマリーFMっていうですね、サイトを立ち上げてますね。 スタンドFMで話したことを文字化するサービスを行っています。
ですけどね、こちらの方はね、一つ一つですね、コピー&ペーストしなきゃいけないんですよ。 手間がかかる上にですね、ちゃんとなかなか動かないんですね。
そのね、サマリーFMと違いまして、リッスンの方はですね、 最初設定しますね、すべて自動でやってくれるんですよ。
460話を超えますね、自分の音声のやつもすべてですね、文字化してくれたんですね。
約4600分ですよ、4600分。 その音声をですね、文字化するのにですね、2時間ぐらいかかりましたね。
でも仕上げてくれたんですね。 先ほど言ったサマリーFMの方はですね、ですけどもいい点もあるんですね。
タイトルとですね、サマリー、ようやく、概略みたいなのをね、簡単に作ってくれる利点があるんですね。
もしもですね、これまでですね、概略を書くのは面倒でしてこなかったっていう人にとってはですね、まあ需要があるかもしれませんね。
自分はね、自分でようやく書いてるんでね、必要ないんですけどね。
またですね、サマリーFMの方はですね、日本語だけじゃなくてですね、それをね、概略を英語、中国語などでね、それに変換することもできるんですよ。
というわけで、世界を相手にした音声配信をしている人にとってはですね、もしかしたらですね、サマリーFMもね、需要があるかもしれませんね。
記事の要約に関する話題
まあとりあえずですね、言いたいのは、文字に書き起こすっていうのはね、音声メディアにとってもね、需要があるってことですよね。
そのうちですね、ラジオトークだとかね、あとあの、Amazon、Google、Appleなどのね、各ポッドキャスト、そちらの方でもですね、同じようなですね、サービスを始めるんじゃないかなという気がします。
ところがですね、良いことずくめのようなことを言ってますけども、このリスンのね、書き起こしですがね、間違いが多いんですね。
というかですね、間違いだらけなんですね。 例えばあの、毎回毎回出だしのところでね、福島県郡山市のって言いますよね。
ところがですね、郡山市っていうところでね、8割ぐらい失敗するんですよ。 福島県の方ね、ちゃんと10割ね、成功してるんですよ。
そしたらですね、福島県の市町村をね、選ぶべきなんですよね。 果たしてこんな市ってあんだろうかってね。そんな風な市の名前をね、勝手に作ってね、乗っけたりするんですね。
というわけで、これはオープンAIのね、性能が悪いせいなのかなぁと思うんですよね。 あの、ウィスパーっていうね、AI自身はですね、こういった日本語をね、文字化するのに非常に優れたね、AIらしいんですよね。
直すこともできるんですけどね。 1日で460話、すべてを直すのはまず不可能なんですよ。
で、こちらのね、発音が悪いのかなぁっていうのも気もするんですけどね。 まぁ、あとBGMをね、バックにつけてるのも関係あるのかなぁという気もするんですけども。
ですけどもね、えーと、まぁちょっとね、もうしょうがないなと。 諦めるしかないなという感じですね。
この間違ったね、言葉でね、検索で引っかかってね、来る人もいるかなぁって気もするんですけどね。
ここの部分だけではね、もっとね、性能を良くなってほしいなと思うんですね。 それからリスのね、面白い特徴としまして、利用者はね、コメントをつけられるっていう機能があるんですよ。
ラジオトークとかね、スタンドAMだとね、スマホから聞くのがね、前提でね。 そしたらパソコンから聞くことができなかったりとかするのもありますけども。
それにね、パソコンから聞くことができて、さらにコメントもつけられると。 またポッドキャストの方でもね、コメントもつけられるわけですよ。
こういうサービスね、これまでも海外にあったそうなんですけどもね。 音声メディアの間でね、配信者の中で交流がね、そうすると生まれるんじゃないかなってことも期待できるんですね。
また、ハテナブログのね、やっぱり発案者でありまして、全ての文章の中じゃなくて、その一部分だけですね。 その部分だけをですね、引用できるんですよ。
というわけで、音声の中のこの部分、この部分だけをね、ちょっと質問したいんですよっていう時にね、そういった使い方もできるので、非常に便利ですね。
というわけでですね、今このリッスン、リッスンスタイル、そちらの方ね、ちょっとね、面白いなと思って色々試しているところです。
今回もね、こんな感じで色んなね、機能がね、あの音声メディアの中で始まっていくと思いますんでね。 面白い世界になっていくかなというのは思っております。
はい、それではまた次回よろしく。ペンキスのお宅の話をお付き合いくださいね。 本日も来てくださいまして、誠にありがとうございました。
09:10

コメント

スクロール