1. Flexible Podcast
  2. #54 ポッドキャストをブログ化
2023-04-07 15:38

#54 ポッドキャストをブログ化

PodcastをTexterで自動文字起こし、GPT-4で編集してブログ化する話です。最後、余談がつまらなさすぎて音声をぶつ切りしました。初めての編集です。よろしくお願いいたします。

00:05
こんにちは、シロクロの伊藤です。
ポッドキャスト54回目。今回は、ポッドキャストのデータをブログ化しようというテーマで話したいと思います。
今日は2023年4月7日、金曜日です。よろしくお願いします。
結構前からずっと思っていたのが、ポッドキャストで話したのをブログにしようと思っていて、
自動文字起こしとかを試したりしていた時期があったんですけど、
そこから編集するのは大変そうだなと思って、ずっと止まっていたのが、
最近話題のチャットJPTが出てきて、それを使えばうまくいくんじゃないかと思ったので、
やってみたんですけど、それがいい形になったので、ちょっとその流れを紹介できればと思います。
これがうまくいくと、別にポッドキャストじゃなくても、
ポッドキャスト1回配信しなくても、ただ自分が思っていることを音声で録って、
それをブログにするっていうフローができるので、
結構いろんな人が使えるのではと思いました。
じゃあポッドキャスト、録ったやつをいかにブログ化していくかっていう流れなんですけど、
音声ダウンロードして文字起こし、チャットJPTで編集、
最後にもう1回自分で編集っていうフローになるかなと思います。
まずダウンロード。
ポッドキャスト、SpotifyだったりAppleポッドキャストとか、
Googleポッドキャストといったプラットフォームがあるんですけど、
その辺だとダウンロード機能はないんですよね。
厳密に言うと、もう再生している時点でそのデバイスにはダウンロードされているんだけれども、
欲しいのはMP4とかの形式なので、
そういった形式でダウンロードできる別のプラットフォームを利用すると。
探して見つけたのがHotmailっていうプラットフォームで、
そこだと再生もできるし、エピソードごとにMP4でダウンロードすることができたので、
会員登録とかも全然しなくてよかったので、非常に簡単にできましたと。
これで音声データがダウンロードできたと。
03:01
そこから文字起こしをしないといけないんですけど、文字起こしは結構いろんなツールがあって、
ローカルのMacとかWindowsとかのアプリケーション、
スマホのアプリケーション、あとWebサービス、
あとGoogle系、Googleドキュメントだったり、
Adobeのなんとかでもできるっていうところで、いろんなものがあるんですね。
問題はやっぱり品質、クオリティと、あとは費用面っていうところで、
できるだけ無料でやりたいなっていうところで、
Googleドキュメントが一番いいかなと思ったんですけど、
音声入力必要の設定を変えないとMac上ではできないっていうことが分かって、
それを利用するために別のアプリケーションで設定を変えないといけないっていう風に書いてあって、
個人的には何かやるのに別のアプリケーション入れるっていう流れがあまり好きではないので、
それは嫌だなと思って、
他だと、Other App AIっていうWebサービス使ったりしてみたんですけど、
費用面だったりクオリティだったりっていうところで、
TextureっていうiOSアプリ、これを試したら非常によくて、
どうなんだろうって、一応有料プランがあって、
今のところ僕は30分弱喋っている容量的に言うと20MBぐらいのやつを3本読み込ませてできていて、
どこかで引っかかるのかもしれないけど、
そのぐらいだったら無料で使えるっぽいので、
アラートが出るまでは使おうかなとは思うんですけど、
かつこれだと20分なら20分音声データがあったとして、
20分かからないんですよ、数分とかで済むので、
リアルタイムでレンダリングして、
自動を持ち起こしっていう風にならないので、
かなりスムーズにテキスト化してくれると。
それをコピーしてまたPCに持ってきて、
スマホ上で全部やってもいいんですけど。
これで持ち起こしデータができましたと。
06:03
ここからGPTで編集するんですけど、
ここでいくつかポイントがあって、
できれば自動持ち起こしした段階で、
こういう名詞、一番自動持ち起こしのポイントだと、
こういう名詞を微妙に聞き違えて、
テキスト化していることが多いので、
それを修正してあげると、あとはトラップかなっていうところ。
ShutGPTに投げるときはお決まりのプロンプトですよね。
命令があって、制約条件があって、
入力分があって、出力分があってみたいな。
それを、僕がやってるPodcastだったら、
Web系とかブランディングの話が多いので、
命令書としては、
あなたはWebのブランディングとかマーケティングに詳しいプロの編集者です。
以下の制約条件と入力分をもとに編集をお願いします。
っていうような命令を与えて、制約で、
元の原稿はPodcastで話したものを文字起こしたデータですとか、
これをプログに載せるので、読み薄くしてください。
ただ、あまり機械的になりすぎないように、
ある程度はニュアンスも残してくださいみたいな条件を伝えると。
あとは、文字起こしたテキストを入力分のところに入れて投げる。
ここで、今のChatGPTプラスにしてもそうなんだけれども、
投稿できる制限が4096トークンらしいんですよ、条件が。
これが1トークン1文字ではないので、
1トークンで750文字程度。
その750文字が1バイト文字な気がするので、
そうすると日本語だともっと少ないのでは。
2000文字ぐらい投げたらエラーが返ってきたので、
なので今小刻みに分割してくらないといけない。
ここが唯一手間のところですね。
20分30分話せると、人によるんだろうけど、
5、6千文字とかになってしまうので、
そのまま丸ごと投げれない。
だから分割して投げる必要がある。
最初、何文字だったっけ。
5千何百文字とかを2回、3回ぐらい。
2500文字ぐらいずつポンポンポンって投げてやると、
09:05
かなりはしょってようやくして結果が返ってきたんですね。
逆にかなり小刻みに何百文字とかを1、8回分割しておくと、
仮に500文字をうまくまとめてくれるっていう風に返ってきて、
だから結構細めに送ってあげて、
あまりはしょりすぎないように。
逆にかなり簡略化してほしい内容であれば、
なるべく長文でギリギリまで投げてもらうみたいな。
多分その前後のこのテキストを読んでるかどうかっていうのも大きいんだと思うんですね。
多分そんだけ無駄話が多いっていう。
例えば何だろう。AとBがあります。
Aはこういうことで、Bはこういうこと。
今回はAの話なんですけどっていうような話をすると、
もう全然Bの話はしなくて、Aはこれですっていうような編集をするんですよね。
だから次第としてはそれで合ってるけど、
ただそこでBの説明をもうちょっと触れることに意義があったりするので、
それが省略されるのはなーっていうところ。
だからある程度はしょりすぎないようにしてねっていう命令は、
与えておかないといけないのではないかっていうところですね。
で、そこまでできてやると、
かなりもう人が読める文章にもなってるんですよね。
そこで自分で編集する前の状態で。
文字起こししたデータはやっぱりちょっと、
そのままだと喋ったことをそのまま文字化してるだけなので、
若干読みづらかったり、話が脱線したりとか、
これ何だったっけみたいな単語が残ってたりするので、
そういうのを省略して、
ちゃんと文章として読みやすい状態になっていると。
最後に一応自分なりにちょっと文章つなげたりとか、
付け加えたり削ったりとかするんですけど、
でも本当にこれ僕も試したんですけど、
最後の自分の編集段階で、
多分2、30分ぐらいで済んだので、
それで完成。
だからトータル1、2時間くらいあればできてしまうんですね。
慣れたらもっと早いのかもしれないけど。
12:01
これを自動文字起こしまでは前もできたから、
そこから編集ってかなりしんどいというか、
多分やる気が起きないというか、
1からブログ書くのとあんまり大差ないというか、
なので今までやれなかったんですけど、
GPT-4のおかげで、
だいぶそこがうまく助けてもらえている。
ちなみに無料版のGPT-3の状態、
3、3.5どっちかな、分かんないけど、
でも多分それなりにいい結果は返ってくると思います。
より精度が高い状態にしたかったら、
クラスにしてGPT-4を使えるように。
月にいくらだったっけ、20ドルか。
20ドルでいろんなことができるから。
やっぱりTwitter Blueのよく分からない日和より、
全然いいですよね。
というところでブログ化ができると。
全部自動化するっていう仕組み、
サービスとかも多分あると思うんですけど、
テキスターっていう自動文字起こしも要約するサービスが
付属してるっぽいんですけど、
そこまでやると結構有料になるらしくて。
結局今やってるのは全自動化するだけの話なので、
当然それはできるって話なんですけど、
どっかでAPI使う分、
そのボタンとなるサービスを
他に発生させないことにはいけないので、
どこにお金を落とすかっていう話ですよね。
自動文字起こしもウィスパーっていうAI使ってるところが
品質高いっぽいので、
そことGPTのAPI結びつけて、
各個人自分たちでそういったシステムを作ってるっていうのも
記事も見たりはしたんですけど。
ただ今の流れだとテキスターを使って、
それを自分でGPTに投げてっていうので、
そんなに全然手間作業ではないので、
これでいけますね。
なのでやっとなんかこう、
今までずっとポッドキャストを
ネットの前のほか50回覚えていて、
これをブローク化できるってなると、
だいぶこうやってきた価値というか、
15:03
意義が見え出せるなというところで、
いくつかどんどんブローク化していこうと思っています。
どうしよう。
あともうちょいAIの話をしたいんだけれども、
別のテーマだから別の話題回にしたほうがいいかな。
Adobeのデータ版かな。
Adobe Fireflyの話をしようかなと思ったけど、
まあいいや、別にしよう。
15:38

コメント

スクロール