1. 関西人たけのむのコンセプトなき思考
  2. 音声配信におけるテックを考え..
2025-03-15 09:33

音声配信におけるテックを考える(2025/03/15#85)

サマリー

音声配信におけるテクノロジーの進歩について掘り下げ、スタイフやSpotify、Apple Podcastなどの連携について話がされています。また、文字起こしサービスや同時通訳の可能性についても探求しており、技術の進展がもたらす新しい体験の楽しさに触れています。

音声配信の連携
こんにちは、たけのむです。昨日ですね、ちょっと今までめんどくさくてやってなかったんですけど
スタイフを各種別の音声配信の媒体に連携しました。
連携したのはちょっと前なんですけど、具体的にはSpotifyとApple Podcastですかね。
このスタイフを録音したら、スタイフで発行したRSSを向こうに登録してスタイフを参照するのかな?
ちょっといまいちよく分かってないですけど、そっちに自動で配信されるような設定をしました。
ちょっとリードタイムあるんですけども、確かにスタイフでこうして配信したものが
Apple PodcastとSpotifyに連携していることが確認できて、そちらでも聞くことができるというところですね。
やっぱりこのマルチに展開できるっていうのはすごい強いですよね。
今日音声配信におけるテックっていう話を書いたんですけど、一応私もシステムエンジニアの一人なので
この手のサービスがあるっていうのはもちろん理解はしてるんですけど、最初にやるのが結構手間というか
そんなに手間でもないんですけど、調べてパソコンで設定すると。
スマホでも設定できたりするんですけども、パソコンの方が操作しやすかったりするので、今回ちょっと設定をしてみました。
あとはAmazonだったかな。Amazon Podcastとかなんかにも連携できるんですけど、それはめんどくさくてやってないですね。
スタイフとApple Podcastに連携してればとりあえずいいだろうっていうところでそこしかやってないんですけど。
文字起こし技術の利用
昨日ちょっと午後時間があったのでやってたのは、リッスンっていうんですかね、文字起こしのサービス。
あっちにもちょっと連携をしてみたんですよ。
それも同じくめんどくさくてやってなかったんで、今までずっとスタイフで配信してたんですけど、スタイフでしか自分の録音した音声とかコンテンツは配信してなかったんですけども
リッスンにも登録してですね。課金モデルもあったと思うんですけど、あれ課金と無料とできること何が違うのかよく見てないんですけどね。
今のところ、私今までで80何回放送してるんですけど、たぶん全部文字起こしされてたように見えましたけどね。全部見たわけじゃないですけど。
すごいのは結構な精度でちゃんと文字起こしされてるんですよね。
仕事ではTeams使ってるのでTeamsの文字起こしとかの精度っていうのはなんとなく見てるんですけども、でもあれも精度上がってきてますよね。
最近お客さんとGoogle Meetで打ち合わせすることもあって、Google Meetの文字起こしもなかなかの精度で文字起こしされてるなというのを見てて、この辺の技術進歩っていうのがすごいですよね。
昨日そのリッスンを初めて使って文字起こしされるなっていうところで、ちょっとチャレンジしてたのは文字起こしされたテキスト、日本語のテキストですね。
それを英訳はどんなサービスでもできると思うんですけども、本当はスタイフで録音したものをスタイフって音声ファイル取り出せるので、その音声ファイルを英語の読み上げにできないかなということをちょっとやろうとしてたんですけど、
ちょろちょろっと調べたぐらいではちょっとわかんなくて、多分チャットGPTの課金モデル使えば日本語音声をそのまま同時通訳できるみたいなんで、録音する環境とかをちゃんと考えればできるんじゃないかなと思うんですけど、
ただ同時通訳なんで、私が喋ってるのをそのまま横で例えば英語に喋るっていう感じなので、録音はばらけてはしづらそうな感じはするんですけど、なので昨日私がチャレンジしてたのはスタイフでこうして喋って、日本語の音声ですよね。
その日本語の音声をリッスンで日本語のテキストに起こして、その日本語のテキストを英訳、私使ったサービスはクロードっていうサービスですね。
これはどっちかっていうと話し言葉をブログとかだと文章構成とか考えて記載するんですけど、そういうのに結構強いAIみたいですね。
私も今回初めて使ったんですけど、そこで英訳をして、その英訳された文章をブラウザーのEdgeってあるんですけど、マイクロソフトの。
言語の壁を超える技術
音声読み上げっていう機能があって、これ私も知らなかったんですけど、Edgeで英語の文章をペタッと貼って、それを読み上げてその読み上げた音声をスタイフで録音して機能テストとして配信してみたんですよね。
英語はちゃんと聞き取れるわけじゃないので、ざっくりなんとなくあってそうかなっていうところぐらいしか聞いてないんですけど、なんかまあまあの精度で取れてる感じがしたんですよね。
なので、何をしようとしてるかというと、せっかくSpotifyに連携するので、スタイフはあれですよね、日本のプラットフォームかな。
たぶんグローバルでそんなに使われてるプラットフォームじゃないと思うので、ただSpotifyは完全グローバルでガンガン使われてる。
Apple Podcastもそうかな。使われてると思うので、アカウントを分けて英語の音声放送をそっちに展開してみようかなという遊びですね。
なので、こういうソリューションを組み合わせるとこんなことできるんだみたいなのを実証するのって楽しいなと。いわゆるボックっていうか実証実験みたいな感じですよね。
もう一つやりたいのは、音声読み上げの声を自分の声で読み上げるようなサービスがあればやってみたいんですけど。
ありそうですけどね、これちょっとまだ調べてないんですけど、無料では多分ないと思うんで、有料ではあるんじゃないかなというところですけど。
今のところは無料でできる範囲のものでしか私はやってないので、別にお金が欲しいとかっていうわけじゃなくて、単純に機能を思いつきでやっただけなんでそこまで行き過ぎてないんですけど。
技術進歩ってすごいのでいろいろできるなということで。
もちろん翻訳って英語だけじゃなくていろんなマルチリンガルに翻訳できるので、それこそ中国語で放送することも多分できると思いますし。
なんかね、昨日かな一昨日かなニュースで、Appleの無線イヤホン、AirPodsってあるんですけど、あそこの機能に同時通訳の機能が搭載される予定みたいなのをどっかで記事で読んだんですよ。
いやーすごいですよね。もう言葉の壁がなくなるとやっぱり海外旅行とか困らなくなるというか。
もちろんね、とっさの時にしゃべればそれに越したことはないんですけど。文字なんかはね、もう今Googleレンズとかでパッと取ったらそのまま翻訳されたりしますし。
しゃべるのもね、Googleの翻訳で音声入力モードで会話モードとか使えば今でもできるんですけど、多分AirPodsの同時通訳モードってもうちょっとシームレスにできるんじゃないかなっていうところですよね。
この辺ね、できれば言語の壁っていうのはある程度取り払われてですね、自分の触れる世界とかがね、結構広がるなっていう感じはしますよね。
ホームページとかでも昔は英語のサイトとかってあんまり見なかったと思うんですけど、今も翻訳がもうブラウザに搭載されているのでそこもね、見るのがあまり苦痛じゃないので。
今後どんどんどんどん話し言葉もそうですし、同時通訳的なこともね、技術の革新でできるようになるっていうのはすごい楽しいなと。
ただいかにいろんなサービスあったとしても、組み合わせる、コーディネートするっていう技術は必要になってくるので、この辺りのセンスというかテクニックっていうのは身につけていきたいなというところで、温泉配信の今スタイフを入り口にしていかにシームレスにやっていけるかっていうのをちょっと考えていきたいと思ってます。
本日は以上です。ありがとうございました。
09:33

コメント

スクロール