AIと文字起こしの活用
おはようございます。詩吟YouTuberのheyheyです。今日はですね、音声配信者がAIをフル活用するためには、listenの文字起こしを集めるしかないという、そういうテーマで話したいと思います。
まああの、音声配信してない人はなんじゃそりゃというところの、もうめちゃくちゃなテーマなんですけれども、とにかくですね、僕は今、音声配信の内容うまいことAIさんに頑張ってもらってですね、
爆速でKindle本を出版したいんですよ。これですね。で、これで先日、池早さんがGeminiの2.5 Proをですね、使うと8万文字ぐらいがですね、すごい勢いで作れてしまうという話をしていたんですけれども、
これにはやっぱりあの一つ注意点があってですね、池早さんの場合はもうこれまでに膨大な量のですね、もうコンテンツとしてテキストとして世の中にもいっぱい公開されている情報があるんですよね。
それがあるからこそGeminiでもあっという間にバーッと作ることができたんですけれども、やっぱりですね、そこまで世の中にコンテンツが公開できていない人にとっては、そこをまずAIに読み取らせる必要があるんですよね。
これがあるかないかで全然違ってくると。ただあの音声配信者の場合はやっぱり別でですね、この話してきた内容を多分一時期Listenっていう文字起こし自動でやってくれるよっていうのが話題に上がりましたけれども、あれをやっている人は全然違ってくると思うんですよね。
あそこにこのStyleでやった内容、僕の場合はStyleとリンクさせているんですね。Styleに投稿した内容は基本的にすべて載っています。
Listenの方で言ったら書き起こしされているんですよね。あれChatGPTのAPIと連携しているんで、ぼちぼちの精度で読み取ら、書き起こしされているというものです。
ところどころたまに狂ってる、全然なんか狂いまくってるような内容もあるんですけれども、それでもですね、そこが活用できる一番の素材になるということです。
だから今日はですね、僕はちょっと隙間時間でですね、コツコツコツコツひたすらコピペコピペでコピーしてはメモ帳に貼り付けて、メモ帳もですね、もう一個一個分けていったらめんどくさいんでですね、もうどれくらいだろうな。
2、30件分、2、30配信分を一つのメモ帳にまとめてみたいなのを、もっとかな、50くらいかな。それぐらいをまとめてまとめてみたいな感じで、一つのメモ帳が30万文字か50万文字ぐらいのやつをですね、今いくつか作っている感じです。
コツコツコツコツひたすら貼り付けていくんですね。めっちゃ地味な作業なんですけれども、これがやっぱりあるかないかで全然違ってくるんですね。
試しにその30万文字の書き起こし文章をジェミニにポイって投げたらですね、なんか結構あっという間に読み込んでくれて、その速さにまずは驚きました。
それに基づいた上で、この電子書籍の目次を作ってくれみたいな感じをやったらですね、そこの内容を引っ張った形で、書き起こし文章なんで結構雑な、何言ってるかよくわからないような、あーとかえーとかもそこそこ入っていたりするんですけれども、
そういったところも内容をちゃんと読み取った上で、そこからKindle本にどういうふうに反映したらいいかっていうのはですね、ジャガジャガジャガジャガ出してくれました。
だから、それがあるかないかですね、この一時素材があるかないかで誰でも言えるような内容なのか、今まで自分が発信してきた内容に基づく自分の喋り方や自分の言葉遣いも含めた、
自分独自の電子書籍ができるのかという大きな違いが出てくるわけです。
これ本当にめちゃくちゃに地味なんですけれども、やっぱり音声配信者はこれを最初にやればいいんじゃないかなと思いますね。
効率的なコンテンツ制作
これで何十万文字か百万文字か二百万文字か分かりませんが、それだけの書き起こし文章があれば、それを場合によってはクラウドとか一気にそこまで読み取れなかったら文革するしかないんですけれども、
いろいろそれをAIにそれぞれ、ちゃんとGPTプロとかプラスとかに読み込ませたりとかですね、やる必要があると。
ただ今とりあえずGeminiはですね、あっという間に読み込むことができたんで、それでいろんなバージョンの本の目次を作ってもらいました。
私銀の教科書の入門編、上級編、中級編、さらにその高み絵とかですね、発声だけに特化した本とか、いろんな切り口ですね、自分のやつをボーンと読み込ませて、あとはひたすら吐き出させるみたいなのを試しにやってみました。
これの目次の精度がどうなのか、ちょっととりあえず吐き出させただけなんでですね、そこはまだ比較できていません。
これをGeminiでやったやつとですね、ChatGPTのO1に読み込ませてやってみた場合で、クラウドさんにやってみた場合ですね、それぞれで違いをちょっと見て、どれでこの構成を作らせるのかがいいのかを選んでみて、
多分なんかChatGPTのO1が良さそうな話なんですけど、池谷さんが言うにはそれっぽいんですよね。それでやってみて、構成ができたらこの第一章ごとにGeminiで出力させていく。
でも多分分量が大したことなかったら、なんか結構ある程度一息でいけるんじゃないかなというふうにも思っています。
だからやるべきことはシンプルですね。音声配信でリスンと連携させている人はシンプルで、まずはもうひたすら地味にコピペコピペとやっていて、メモ帳の塊を作ると。
その次にそれをO1下で読み取らせて構成を作る。その次に各章ごとにGeminiに投げて、一気に気持ち悪いぐらいに早いリアルな文章を作り込ませていって、最後は手作業で直していく。
手作業で直していって、最後にもう一回チャットGPTかまして、なんか変な手に用派というか、なんか誤字脱字を見てみるとかもありかもしれないかな。
いやでもそんなことないか。生成してるからいいのかな。そんな流れでいけば音声配信者がいい感じにできるんじゃないかなと思っています。
一度その素材があればですね、そこからなんかAIがいくらでも調理できるということなんで、もう万能素材ができたということになるんですよね。
ということで、僕ももう少しこの地味な活動をコツコツコツコツやっていって、そこからジャカジャカジャカジャカ、もう擬音語が多すぎなんですけれども。
それでKindle本をですね、まずは色々作ってみたいなと思っております。ぜひ参考になりましたならば幸いです。最後まで聞いてくださってありがとうございました。バイバイ。