1. OKファームのノーテンキ農業(仮)
  2. #978 Geminiを使って文字起こ..
2025-11-04 09:12

#978 Geminiを使って文字起こしをしてみた

サマリー

Geminiを活用した文字起こしの効果や利便性についてお話しします。特に、音声ファイルのテキスト化が効率を改善し、検索しやすさを提供することが強調されています。

Geminiの導入と機能
おはようございます。OKファームのOKです。このラジオでは、脱サラして農業歴13年を超えた私が、新規就農者やフリーランスの方向けに、マーケティング情報や気持ちがちょっと楽になる話をお届けしております。
はい、今日は978回目、Geminiを使って文字起こしをしてみた、というテーマでお話をしていきます。
AIで言うと、代表格はChatGPTではないかと思うんですけども、僕はGoogleさんが出しているGoogle GeminiというAIツールを使っております。
もちろん、このChat機能を使って、自分の悩みについて答えてもらう、何とかのやり方を教えてくださいとか、
こういう風にやりたいことがあるんだけども、それを解決するためのロードマップを教えてくださいとか、相談に乗ってください、みたいなこともできるんですけども、
この度、やったようでやっていなかったなと思ったことで、文字起こしというやつをやってみました。
文字起こしというと、音声でラジオとかで流れているデータを、音声ファイルというやつをGeminiのファイルをアップロードしてくださいというところに投げ込んで、
これを文字起こししてとか、タイムスタンプというんですけど、何時何分何秒に話しているか、カウンターみたいなものをつけてみたいなことを言ったら、
タイムスタンプ付きで何々言って喋ってますよということが、結構スムーズに答えてくれました。
そしてこの文字起こしの内容は、Excelとかスプレッドシートに貼り付けられるように表形式で、僕の場合はご丁寧に出してくれたので、
これをそのままExcelとかスプレッドシートに貼り付ければ、何分何秒にこんなことを話しているよというのが、かなり見やすくなるんではないかなというふうに思っています。
それとこの表形式でバーッと出してくれてるわけなんですけども、やっぱり音声なんで、語字っていうのがあるじゃないですか。
どうしても人の名前であるとか、お話の中で出てくる商品名、企業名みたいなものが、どうしてもこれどう考えても間違ってるよねっていうものが出てきている場合でも、
このジェミニ君だったら、この何とかっていう語字をこれに直してっていうふうに言うと、それはもう一旦文字になっているものなので、音声がどうとかこうとかじゃなくて、
その文字を文章構成してくれるっていうことは、このAIツールの得意とするところなので、ジェミニ君がこの語字をこっちに正しいものに修正してくださいって言ったら、
長い文章でもあってもですね、かなり正確にその間違っているところだけを直してくれるというような使い方ができるようなので、文字起こし兼この何かさと修正するツールとして、
この音声ファイルプラスジェミニっていうのは結構使いやすいかなというふうに思っているところですね。
文字起こしの精度と課金
ただ、一点注意としてはやっぱり無料プランだと精度が低いところがあるかなというのと、多分どこかですぐ容量オーバーっていうんですかね。
もう1日に限り、1日の間でもうこれ以上できませんっていうラインが音声ファイルの大きさによってはかなりすぐ来てしまうんじゃないかなというような感じがします。
さっきも言ったんですけど、僕はもうこれに課金しているので、そのファイルの容量制限みたいなのにはかからなかったんですけども、
最初にやるときにですね、間違えて無料でも使えるジェミニの2.5フラッシュっていう早いんだけど精度がちょっと低いよっていう方を使っていたら、
途中でタイムスタンプの方がずれちゃったんですよね。プロっていう2.5プロっていうジェミニ君の脳みそが賢い方にすると、
その点はもう間違っていることを自分で気づいて完璧に修正してくれたんですけども、やっぱりここはどうしてもAIツールあるあるなんですけども、
無料ユーザーと有料ユーザーで使える脳みそが明らかに違うという風になっているので、文字起こしの精度を上げようとかね、
管理して何分何秒にこれを話しているとか、後から見やすくするためにはどうしても課金しておいた方が無難だろうなというような感じがしますね。
お仕事の内容とか、お仕事相手の都合とかによってはもうAIツールを使っちゃダメだよとか、やっぱりセキュリティの問題上でこのデータはAIに読ませてはいけないみたいなものも中にはあったりするかもしれませんが、
個人事業主でとか、自分が社長でAIを仕事をしていくという方だったら、AIツールの導入も結構気軽だと思いますので、
だいたい月額2000円から3000円くらいではないかなと思うんですが、この有料課金というやつをやってみると、始める前はわかんないと思うんですけども、
一旦その有料の方の脳みそに慣れてしまうと、無料の脳みその方では本当に物足りないというか、
AIが無料の方だとせいぜい高校生ぐらいの相談相手が一気にプロフェッショナルの相談相手、社会人になっているよとか、
むしろ自分よりも年齢が上、40代50代のベステラン上司の相談の回答がもらえるみたいな感じになるので、やっぱり仕事として使うとか、
本気で回答がもらいたいとか、文章とか情報整理の精度を上げたいっていうんだったら、やっぱりこういうところは課金を月額3000円くらい惜しまない方がいいのかなと思ったりしています。
テキスト化の利点
それとやっぱりデータ容量問題を文字起こしというやつはめちゃくちゃ解決してくれるなというふうに感じているところです。
最たるものは動画ですけど、動画でそのファイルを保存しようと思うとすぐ何GBという容量になってしまいますし、
動画じゃなくて音声でというふうに思ってもやっぱり5分10分のものになると4MBとか5MBぐらいの大きさになってくるので、
音声ファイルみたいなものも集めていくとどんどんファイルの大きさがでかくなってきて、スマホとかパソコンの容量を圧迫してしまうんですよね。
そこにきてこのテキストというやつの容量の小ささっていうのは本当にもう素晴らしくてですね、
音声にすると何MBあるよっていうのが何KBっていう少なさですよね。
昔でいうとフロッピーディスクでも管理ができますよぐらいのファイルの大きさになるので、
これはスマホとかパソコンのためにもテキスト化っていうのは結構意味があったりするんじゃないかなというふうに思いますね。
それとあとは検索のしやすさですよね。やっぱり自分のその人の音声で聞かないとわからないといけない温かみみたいなものとか感情の伝わり方っていうのはもちろんあると思うので、
音声は音声でもちろん魅力があるんですけども、あくまでそれを情報として摂取したいとか文字で見ても全然影響がないものであれば、
やっぱりこの自分でこのそういえばこの人こんな話してたなっていうふうに思ったときに検索キーワードみたいなもので打ち込んだら、
さっき言ったスプレッドシートとかエクセルみたいなもので何時何分にこんなことを喋ってますよみたいなのがパーンと出たりするので、
そういったところでも検索しやすさとか改めて全体像を読み直すみたいなときにはやっぱりこの文字にしておくというのがめちゃくちゃ効率的になるんじゃないかなというふうに思います。
音声ファイルでいつも聞いているとか音声で聞いているものをテキスト化しておくのは結構意味があるとか便利な要素も多いと思いますので、
ジェミニとかチャットGPT使っている方はアップロードのところに音声ファイルをぜひ投げ込んで文字起こししてみてというふうにお願いしてはいかがでしょうかというお話をさせていただきました。
普段は農家の方やフリーランスの方向きにマーケティング情報や気持ちがちょっと楽になる話というテーマで1日1つ音声配信をしております。
私OKのフォローがまだの方はぜひフォローで応援をよろしくお願いいたします。
はいそれでは最後になりますが皆様腰痛にならないように肩を上げ下げたり腰を回したりしながら体をリラックスさせたりしつつ、
今日やるべきことに向かって頑張っていってみてください。
ここまでのお相手はOKファームのOKでした。また遊びにきんさい。ほいじゃまたのー。
09:12

コメント

スクロール