▼今回のトーク内容
/Summary fm(サマリーエフエム)とは?
/音声プラットフォームStand.fmとは
/Summary fmの機能
/5種類の言語から音声を要約可能。Summary fmの機能
/裏側はChatGPT?
/Open AIの提供するText to SpeechのAPI
--
音声とマーケティングを考えるポッドキャスト『オトマーケ』。
今回は上記のテーマでお話しました。
#89 配信者必聴!ChatGPTゆずりの音声テキスト化・要約「Summary fm」が便利すぎる
▼Summary fm
https://bit.ly/Summary-fm
/アフタートーク:漫画『若ゲのいたり〜ゲームクリエイターの青春』のススメ
▼『若ゲのいたり〜ゲームクリエイターの青春』
https://bit.ly/wakage-no-itari
----------
▼AIが作成した要約:
今回のポッドキャストでは、AIを使った音声ファイルの文字起こしサービス「Summary.fm」について紹介されています。このサービスは、Stand.fmがローンチしたもので、登録した音声ファイルを勝手に文字起こししてくれ、それから要約を作成してくれるというものです。日本語、英語、中国語、ヒンディ語、そして絵文字の5種類から要約言語を選ぶことができ、非常に手軽で使いやすいとのこと。また、このサービスはOpenAIのJAT-GPTというサービスを使ったものであると予想されています。後半では、このサービスを用いたPodcastのマーケティングについても話されました。 このPodcastは、音声コンテンツを扱っており、このような文字起こしサービスによってPodcastの再生率が上がるという話がされています。Podcastのマーケティングをするときには、このような音声と文字起こしのサービスは非常に有用であるとのことです。また、アフタートークでは、田中圭一さんの新作漫画の紹介もありました。 影のいたりゲームクリエイターの青春という、ゲームクリエイターにまつわるエピソードを描いた漫画が、読み物としても面白そうだと紹介されています。
▼AIが作成した文字起こし(全文):
こんにちは、オトナルの八木大輔です。 今回は音声配信に使えるテクノロジーの紹介ということで、 音声配信プラットフォームであるStand.fmが AIを使った音声ファイルの文字起こしサービスを ローンチしたので紹介したいと思います。 サービス名はSummary.fmというサービスです。 4月3日にプレスリリースが出てまして、 音声配信プラットフォームのStand.fmが AI技術を活用した音声ファイルの文字起こし予約サービス Summary.fmをリリースという形で出しているリリースです。 まずStand.fmは国産の音声配信アプリで リスナーが聞くこともできるサービスです。 VoicyやRadio Talkに近いと思います。 Voicyは法的な配信によっていますが、 Stand.fmは双方向を大事にしていて、 2019年頃から運用されている音声配信プラットフォームです。 Stand.fmが何を出したかというと、 音声ファイルを登録すると勝手に文字起こしをしてくれる。 その文字起こしから勝手に予約を作ってくれるというサービスを ローンチしていました。 どんなことができるかは実際に使ってみてもらうのがいいと思うので、 ブラウザーなどで誰でもウェブサイトを開ければ使うことができます。 このエピソードはせっかくなので撮っていますが、 撮り終わったら、このStand.fmというサービスに実際に書いてみて、 そこで書き出されたテキストを この番組の説明欄に貼っておこうと思いますので、 ぜひこの文章、私が読んでいる文章と このポッドキャストのエピソードの中で 私が喋っていることがどれだけの精度で当たっているかを 見比べながら聞いてもらうと、このサービスの 便利さが非常にわかりやすいかなと思います。 その漢字のSAMARI.fmのURLも説明欄に貼っておきますので、ぜひ興味のある方は使ってみていただければと思いますが、 何ができるかというのを簡単に説明すると、 ウェブページ1枚のシンプルなサービスなんですけど、 音声ファイルのURLが音声ファイルをアップロードして、 つまり音声ファイルをこのページに加わせるという形で登録をし、 要約する言語を選ぶんですね。 あとはGOボタン、ポチッとなって実行ボタンを押すと、 数分、5分経たないくらいだったかな、3分くらい。 私がやってみたのは20分くらいのエピソードで、3、4分とかですかね。テキスト全文と、あと要約が吐き出されるというようなサービスになっています。 本当にサービスとしてはこれだけなんですけど、シンプルなのに非常に便利だなと思いました。 音声配信者の方全員使ったらいいんじゃないかなというぐらいの非常にいいサービスだなと思ったんですけど、 できることは音声ファイルを登録して、もしくはURLだけで登録できるのもいいですね。 なんかPodcastで公開していると、RSSフィールドのURLを開けに行くと、 その中にMP3のURLって必ず書いてあるんで、本源のサーバー上に置かれているURLですね。 これをそのままこのサービス、サムリーFMに登録して再生するだけで、ファイルのアップロードすら要らずに無条項使いできる。 すごいユーザビリティ高いなって思ったんですけど、簡単に無条項使いができる。 あとユニークだなって思ったのは、要約できる言語を選ぶことができるんですけど、 これが日本語と英語と中国語と、あとヒンディ語、そして絵文字っていうのがあります。 もう一回読み上げると、日本語、英語、中国語、ヒンディ語、そして絵文字という5種類の言語を選択して要約することができるという形です。 最初の4種類はその国の言語に訳されるだけなので、分かりやすいですねっていう形なんですけど、5種類目の絵文字がユニークで、これで要約すると何ができるのかなと思って試してみたんですけど、 今回のエピソードは今収録してるんで、前回の音マーケを要約にかけて、そして要約する言語を絵文字を選んでみました。 そうすると、20分くらいの、前回のエピソードというのは、コンテキストオーディオ広告について、これマニアックなテーマですけど、音声広告の最新テクノロジーの話をしてたんですが、 これを絵文字要約かけると、15種類くらいの絵文字で出てきました。面白いですね。これマイク、スピーカー、吹き出し、マイク、ラジオ、電球マーク、ロボット、人が喋ってる、影、スピーカー、耳、ロケット、お金、みたいな。これ面白いですね。 あの絵文字で私が喋った20分のエピソードを全部表してると。だからマイクのアイコンとか、ラジオのアイコンとか、吹き出しとか、言葉ですね。喋ったりトークだったり、声っていうとか、あとAIの話したんでロボットの絵があったりとか、音声合成の話してたからですかね。 なんか一つの絵文字で。このサービスは、おそらく裏側がOpenAIのJAT-GPTに関係するサービスを使っていると思われます。 後半ではそのあたりの話をしていきたいと思います。 はい、後半はStandFMの出していた、このSummaryFMというAIが音声からテキスト化と予約をしてくれるサービスと、 JAT-GPTの関連性というかそのあたりの関係についてお話していきたいと思います。 4月3日に出ているプレスリリースにこういうことが書かれています。 小見づりで違って、本プレスリリースはOpenAI社開発のJAT-GPTを元に作成されています。 この言葉以外にこのプレスリリースにはJAT-GPTという言葉はあまり書いてないんですけど、 この言葉もよくわからないですよね。プレスリリース自体がJAT-GPTで作られているのか、 それともこのサービス自体がJAT-GPTで作られているのかって、あまりはっきりしない書かれ方がされているんですけど、 一応プレスリリースにはJAT-GPTという言葉、そしてOpenAIという言葉が書かれているという感じです。 一方でちょっと別のアプローチでですね、全く別の話をするんですけど、 英語の検索エンジンでですね、JAT-GPT、Audio、Transcriptionって検索すると、 一番前に出てくるのは当然JAT-GPT関連のページなわけなんですけど、 それが何かっていうとJAT-GPTの最新バージョンであるJAT-GPT4のブログですね、 ブログが出てきまして、JAT-GPT Speech-to-Textというコンテンツが出てくるという感じです。これは2023年の3月8日に出されているブログなんですけど、これにJAT-GPT Speech-to-Textを使用すると、 音声ファイルをテキストに簡単に変換できるというような技術がありまして、 OpenAIが出しているJAT-GPT Whisper APIというのを使うと、 Speech-to-Text API内で2つのエンドポイント、文字を交出して、それをいろんな言語に翻訳するということをやってくれるということが書かれています。 なので、おそらくこのJAT-GPT Whisper APIなどを使って、Stand-FMはSummary-FMというサービスに使いやすくインターフェースを作って提供しているサービスなのかなというふうに思いました。/(文字オーバーにつき途中まで)
Learn more about your ad choices. Visit megaphone.fm/adchoices
/Summary fm(サマリーエフエム)とは?
/音声プラットフォームStand.fmとは
/Summary fmの機能
/5種類の言語から音声を要約可能。Summary fmの機能
/裏側はChatGPT?
/Open AIの提供するText to SpeechのAPI
--
音声とマーケティングを考えるポッドキャスト『オトマーケ』。
今回は上記のテーマでお話しました。
#89 配信者必聴!ChatGPTゆずりの音声テキスト化・要約「Summary fm」が便利すぎる
▼Summary fm
https://bit.ly/Summary-fm
/アフタートーク:漫画『若ゲのいたり〜ゲームクリエイターの青春』のススメ
▼『若ゲのいたり〜ゲームクリエイターの青春』
https://bit.ly/wakage-no-itari
----------
▼AIが作成した要約:
今回のポッドキャストでは、AIを使った音声ファイルの文字起こしサービス「Summary.fm」について紹介されています。このサービスは、Stand.fmがローンチしたもので、登録した音声ファイルを勝手に文字起こししてくれ、それから要約を作成してくれるというものです。日本語、英語、中国語、ヒンディ語、そして絵文字の5種類から要約言語を選ぶことができ、非常に手軽で使いやすいとのこと。また、このサービスはOpenAIのJAT-GPTというサービスを使ったものであると予想されています。後半では、このサービスを用いたPodcastのマーケティングについても話されました。 このPodcastは、音声コンテンツを扱っており、このような文字起こしサービスによってPodcastの再生率が上がるという話がされています。Podcastのマーケティングをするときには、このような音声と文字起こしのサービスは非常に有用であるとのことです。また、アフタートークでは、田中圭一さんの新作漫画の紹介もありました。 影のいたりゲームクリエイターの青春という、ゲームクリエイターにまつわるエピソードを描いた漫画が、読み物としても面白そうだと紹介されています。
▼AIが作成した文字起こし(全文):
こんにちは、オトナルの八木大輔です。 今回は音声配信に使えるテクノロジーの紹介ということで、 音声配信プラットフォームであるStand.fmが AIを使った音声ファイルの文字起こしサービスを ローンチしたので紹介したいと思います。 サービス名はSummary.fmというサービスです。 4月3日にプレスリリースが出てまして、 音声配信プラットフォームのStand.fmが AI技術を活用した音声ファイルの文字起こし予約サービス Summary.fmをリリースという形で出しているリリースです。 まずStand.fmは国産の音声配信アプリで リスナーが聞くこともできるサービスです。 VoicyやRadio Talkに近いと思います。 Voicyは法的な配信によっていますが、 Stand.fmは双方向を大事にしていて、 2019年頃から運用されている音声配信プラットフォームです。 Stand.fmが何を出したかというと、 音声ファイルを登録すると勝手に文字起こしをしてくれる。 その文字起こしから勝手に予約を作ってくれるというサービスを ローンチしていました。 どんなことができるかは実際に使ってみてもらうのがいいと思うので、 ブラウザーなどで誰でもウェブサイトを開ければ使うことができます。 このエピソードはせっかくなので撮っていますが、 撮り終わったら、このStand.fmというサービスに実際に書いてみて、 そこで書き出されたテキストを この番組の説明欄に貼っておこうと思いますので、 ぜひこの文章、私が読んでいる文章と このポッドキャストのエピソードの中で 私が喋っていることがどれだけの精度で当たっているかを 見比べながら聞いてもらうと、このサービスの 便利さが非常にわかりやすいかなと思います。 その漢字のSAMARI.fmのURLも説明欄に貼っておきますので、ぜひ興味のある方は使ってみていただければと思いますが、 何ができるかというのを簡単に説明すると、 ウェブページ1枚のシンプルなサービスなんですけど、 音声ファイルのURLが音声ファイルをアップロードして、 つまり音声ファイルをこのページに加わせるという形で登録をし、 要約する言語を選ぶんですね。 あとはGOボタン、ポチッとなって実行ボタンを押すと、 数分、5分経たないくらいだったかな、3分くらい。 私がやってみたのは20分くらいのエピソードで、3、4分とかですかね。テキスト全文と、あと要約が吐き出されるというようなサービスになっています。 本当にサービスとしてはこれだけなんですけど、シンプルなのに非常に便利だなと思いました。 音声配信者の方全員使ったらいいんじゃないかなというぐらいの非常にいいサービスだなと思ったんですけど、 できることは音声ファイルを登録して、もしくはURLだけで登録できるのもいいですね。 なんかPodcastで公開していると、RSSフィールドのURLを開けに行くと、 その中にMP3のURLって必ず書いてあるんで、本源のサーバー上に置かれているURLですね。 これをそのままこのサービス、サムリーFMに登録して再生するだけで、ファイルのアップロードすら要らずに無条項使いできる。 すごいユーザビリティ高いなって思ったんですけど、簡単に無条項使いができる。 あとユニークだなって思ったのは、要約できる言語を選ぶことができるんですけど、 これが日本語と英語と中国語と、あとヒンディ語、そして絵文字っていうのがあります。 もう一回読み上げると、日本語、英語、中国語、ヒンディ語、そして絵文字という5種類の言語を選択して要約することができるという形です。 最初の4種類はその国の言語に訳されるだけなので、分かりやすいですねっていう形なんですけど、5種類目の絵文字がユニークで、これで要約すると何ができるのかなと思って試してみたんですけど、 今回のエピソードは今収録してるんで、前回の音マーケを要約にかけて、そして要約する言語を絵文字を選んでみました。 そうすると、20分くらいの、前回のエピソードというのは、コンテキストオーディオ広告について、これマニアックなテーマですけど、音声広告の最新テクノロジーの話をしてたんですが、 これを絵文字要約かけると、15種類くらいの絵文字で出てきました。面白いですね。これマイク、スピーカー、吹き出し、マイク、ラジオ、電球マーク、ロボット、人が喋ってる、影、スピーカー、耳、ロケット、お金、みたいな。これ面白いですね。 あの絵文字で私が喋った20分のエピソードを全部表してると。だからマイクのアイコンとか、ラジオのアイコンとか、吹き出しとか、言葉ですね。喋ったりトークだったり、声っていうとか、あとAIの話したんでロボットの絵があったりとか、音声合成の話してたからですかね。 なんか一つの絵文字で。このサービスは、おそらく裏側がOpenAIのJAT-GPTに関係するサービスを使っていると思われます。 後半ではそのあたりの話をしていきたいと思います。 はい、後半はStandFMの出していた、このSummaryFMというAIが音声からテキスト化と予約をしてくれるサービスと、 JAT-GPTの関連性というかそのあたりの関係についてお話していきたいと思います。 4月3日に出ているプレスリリースにこういうことが書かれています。 小見づりで違って、本プレスリリースはOpenAI社開発のJAT-GPTを元に作成されています。 この言葉以外にこのプレスリリースにはJAT-GPTという言葉はあまり書いてないんですけど、 この言葉もよくわからないですよね。プレスリリース自体がJAT-GPTで作られているのか、 それともこのサービス自体がJAT-GPTで作られているのかって、あまりはっきりしない書かれ方がされているんですけど、 一応プレスリリースにはJAT-GPTという言葉、そしてOpenAIという言葉が書かれているという感じです。 一方でちょっと別のアプローチでですね、全く別の話をするんですけど、 英語の検索エンジンでですね、JAT-GPT、Audio、Transcriptionって検索すると、 一番前に出てくるのは当然JAT-GPT関連のページなわけなんですけど、 それが何かっていうとJAT-GPTの最新バージョンであるJAT-GPT4のブログですね、 ブログが出てきまして、JAT-GPT Speech-to-Textというコンテンツが出てくるという感じです。これは2023年の3月8日に出されているブログなんですけど、これにJAT-GPT Speech-to-Textを使用すると、 音声ファイルをテキストに簡単に変換できるというような技術がありまして、 OpenAIが出しているJAT-GPT Whisper APIというのを使うと、 Speech-to-Text API内で2つのエンドポイント、文字を交出して、それをいろんな言語に翻訳するということをやってくれるということが書かれています。 なので、おそらくこのJAT-GPT Whisper APIなどを使って、Stand-FMはSummary-FMというサービスに使いやすくインターフェースを作って提供しているサービスなのかなというふうに思いました。/(文字オーバーにつき途中まで)
Learn more about your ad choices. Visit megaphone.fm/adchoices
19:24
コメント
スクロール