1. じゅりんHACK|ラジオ館
  2. #35 AIの音声文字起こしは仕事..
2024-05-30 12:50

#35 AIの音声文字起こしは仕事の概念を変える!

今回は「AIの音声文字起こしは仕事の概念を変える!」についてお話ししました。いや…ほんとすごいんですよ。このポッドキャスト「Listen」もそうなんですが、今の日本語文字起こしの精度…とんでもなく上がっています。

それに伴って、仕事の仕方が大きく変わってきていると感じます。実際にぼく自身もAI活用の半分以上は「AIによる音声文字起こし」→「AIによる情報整理(議事録作成や書類作成など)」です。

これ…ほんっとうに仕事そのものが大きく変わるくらいのとんでもない変革だと思います…

 

↓ポッドキャストでも紹介しためちゃくちゃオススメのAI音声ノートツール

VoiceNotes

 

↓動画で解説しました

00:00
こんにちは、じゅりんです。じゅりんHACK|ラジオ館を始めていきたいと思います。
今回は、音声文字起こしは、仕事や時代を変えてしまうのではないかというくらい、すごいという話をしていきたいと思います。
前にも何回か、音声を文字起こしするAIを使ったやり方を紹介したりしているのですが、
本当にですね、これ、めちゃめちゃすごいですよ。
はい、どうですか?皆さんは使われています?
文字起こしですね。喋った言葉をね、AIにテキストに変換してもらうというやつなんですけど、
これね、本当に数年前までだったら、いわゆるAIがまだまだちょっとこう、発展していないような状態の時であると、
できないことはないんですけど、やっぱりどうしても誤字、脱字が結構多かったりして、
ちょっとね、現実的に使うにはなかなか難しいかな、みたいなことがあったと思うんですけど、
今のAIの賢さからするとですね、本当にこの文字起こしすごいですよ。
日本語でもかなり精度が高くて、誤字とかね、脱字とか、ほとんど修正しなくていいかなぐらいのレベルまで、
ちゃんときれいに文字起こしをしてくれたりするんですよ。
で、AI自体がその話している内容のテーマをちょっと読み取って、推測してくれるんですよね。
だから、いわゆる日本語で言う同音異義語みたいな、
雨と飴みたいな、お天気の雨と、それから舐める、食べる飴とかなんかもですね、
その話のテーマが天気のテーマだったら、ちゃんとお天気の方の漢字の雨にしてくれるし、
それが食事とか食べる方の話であれば、食べる方の飴にしてくれるし、みたいな形で、
AIが文脈から判断して、その変換というのを選んでくれてるんですよね。
だから、誤字、脱字がすごい少なくなっている。相当正確な文字起こしというのができるようになっているし、
こういう日本語というやたら難しい言葉であってもですね、
そういう正確さがかなり保証されているというか、
はい、のが実感します。
なので、もう本当にぼく、もう大概今、喋って記録するようにしてるんですけど、
以前にね、議事録の話したと思うんですが、
基本的に議事録、会議とかミーティングの場面では録音をして、
録音したものをテキスト化して、そしてそれを議事録にするみたいな形でお話をしました。
で、今回はちょっと違う形でやって、
今回もこれめっちゃ良かったみたいなことがあったので、少しお話をすると、
03:02
はい、でもこれちょっと打ち合わせがあったんですよ、実際に。
その打ち合わせの時に、ちょっと録音はやめておこうと、
初めての方だったので、初めてお会いする方だったので、
急に録音させてくださいみたいに言うのもちょっと失礼かなと思って、録音はしませんでした。
で、ちょっとメモを書くような、そういう時間もちょっとなかったんですよ。
そうすると、2時間くらいお話をさせていただいてみたいな形で、
いろんな話ができて、すごい良かったなみたいな形だったんですけど、
ただやっぱり2時間喋った内容っていうのを、何かしらちゃんと記録を残しておきたいなと思って、
で、その時に、今までだったらそれを後からバーっとメモ書きしてですね、
手書きとかそれからパソコンでカタカタカタみたいな形で整理をするっていうことが必要になってたんですけど、
今回はですね、とりあえずそのミーティングが終わって、話が終わって、
その後に車に戻って、ちょっと他のコンビニとかまで移動して、
コンビニで止めてからですね、とにかくスマホの録音アプリというか、
ぼくの場合だと、VoiceNotesっていう音声を録音して、
それをそのままテキストに、AIがテキストにしてくれるアプリ、
今までもちょっと紹介したそのアプリを使ってるんですけども、
これ何でもいいんです、録音さえできれば。
とにかくね、スマホに向かって20分ちょいぐらい喋りまくりました。
今回はこういう、何月何日にこういうミーティングがあって、
そのミーティングの中でこんな話があったんですよ。
こういうことが課題で、それに対してはこういうふうにしていくといいよねみたいな、
そんな話をしました。
あとこういうことも喋って、みたいなこととかですね。
とにかくその2時間のミーティングとかですね、
その話の中で出てきた内容っていうのをですね、思い出しながら、
うわーってですね、20分ちょいぐらいスマホの録音できるアプリにですね、
ガーッと喋りまくって、
その喋った後に、もうそのままそのアプリはですね、
AIがテキストにしてくれると。
なので2、30分喋って、
それがだいたいですね、8000文字から1万文字ぐらいになりました、バーッとですね。
でもただ、その状態だとまだぼくがとにかく思い出しながら、
もうとにかく記憶を掘り起こしながら喋っただけなので、
整理されていないような情報になっています。
特に話し言葉ですしね、喋ってますから。
えーとかあーとか、えーとかあーとか勝手にカットしてくれてるから入ってないか。
なんですけど、まだまだ使い物にはならない状態です。
でも今度はそのテキストのデータっていうのを今度はAIに読ませて、
以下の文字起こしのテキストから詳細な議事録を作成してください、みたいな形でAIにお願いをすると、
06:02
これがですね、めちゃめちゃですね、いい感じの議事録にしてくれるんですよ。
ほぼほぼ一発でした。
だからもう、今回は録音もしてないしメモも取らなかったんですけど、
その終わった後に、できるだけ時間差がないぐらいの状態で、
とにかく記憶の中にあるものを喋って喋って喋って、
それをテキストにして、そのテキストを議事録、AIに議事録にしてもらって、みたいな形でやったんですけど、
本当にびっくりするぐらいに整理された議事録が出来上がって、情報が出来上がって、
もう本当にこれね、すごいなと思いました。
あのー、もう今までだったら、これだけ整理された議事録作ろうと思ったら、
本当に数時間かかってたかなぐらいの勢いだったんですけど、
実際ね、ぼくがやったことっていうのは、20分から30分喋りまくっただけですからね。
なので、本当にね、この音声、この喋るっていうこと、喋ること自体は、
まだまだね、整理されてない状態で頭の中にあるものを、とにかくワーッと出してるので、
今もね、これ実は、このポッドキャスト、ラジオっていう形で喋ってるんですけど、
特に台本とか用意してないから、全部アドリブで喋っちゃって、
その時その時でね、思いついたこととかを喋っちゃってるんですけど、
これがそのまんまでテキストになっただけだったら、やっぱりね、まだまだ整理ついてないと思うんですよね。
で、聞いてるからね、まだ話として聞けるかなっていう形ではあると思うんですけど、
じゃあそれがそのまんまテキストになったからといって、ちょっとね、読めるものではないと思うんですよ。
話し言葉と書き言葉ってやっぱ違うので。
ただ、今度はそこにこの話し言葉の情報をAIで整理して、書き言葉の方に移していくと、
そうするとね、本当に整理された、いわゆるビジネスで使い物になる情報になってくれる。
もうね、ぼくはね、今、生成AIっていうのが出てきて、本当にね、いろんな仕事とかが楽になったなと思うんですけど、
その中でもね、ダントツで使えると思っていて、実用性の高さはピカイチ。
その音声をテキストに起こして、かつそれをさらに整理して、
議事録みたいな使える形にしていく、ビジネスでも使えるような形にしていくっていうのがダントツで使える機能だと思ってます。
なので、今、ぼくはこのListenっていうサービスを使って、このPodcastを配信してるんですけど、
これもね、本当にめちゃくちゃ便利。何が便利かというと、
もうね、この喋った内容っていうのを全部テキストに起こしてくれるっていうことなんですよね。
なので、このListenっていうところで聞いてくださっている方は、同時にぼくの喋った内容っていうのを全部テキストとしても見ることができるので、
09:02
聞けないっていう場面であっても文字として読んでいただくことができるようになっているし、
さらにぼくの場合はこのテキストっていうのを全部コピペして、そのテキストを喋ったテキストをAIに、
このテキストを元にしてブログ記事を書いてみたいな形でブログ記事を書かせて、別でブログとかも一個作れるようにしてます。
完璧なブログ記事はできないんですけど、それでも8割ぐらいは大体できてくれるし、
別に誰かのコピペじゃなくて、自分が喋ったことの内容をブログ記事の形に整理してるだけなので、
全然そこのところも問題ないし。
最後にね、ちょこっとだけ自分の言葉で少し補足を加えたりとか、そういう作業はちょこっとするんですけど、
それでも5分、10分ぐらいあれば1記事が完成する。
だから自分がラジオで、ポッドキャストで喋った、そしてその喋った内容がテキストになり、
そしてそのテキストを元にブログ記事ができて、
あとちょっと人間が訂正して、おしまいみたいな形の流れ作業が10分、20分ぐらいで1つ出来上がってるって考えると、
本当に一連の作業が楽になったなというふうに感じます。
なので、音声を使う文字起こしのAIの使い方ですね。
これは本当に何度も繰り返しになるんですけど、めっちゃ便利なので、
まだ使ったことがない、やったことがない方は是非やってみてください。
とりあえず、Clover Noteっていうアプリであれば、基本的に無料で使うことができるし、
他のスマホの中でもレコーダーアプリ、Google Pixelみたいなスマホを使われている方は、
レコーダーアプリを使えば、その機能の中に文字起こしっていう機能が入っているので、それでもいけると思います。
あとは、ぼくのPodcastで繰り返し紹介しているVoiceNotesっていうサービスがあるんですけど、
これは1分以内の音声文字起こしであれば、無料で繰り返し何度でも使えるものになっているので、
お試しで使ってみると面白いかもしれないです。1分でも結構喋れますよ。
有料版にすると無制限に喋って、それを全部テキストに起こしてみたいなことができるので、
ぼくはこれを有料版にして使って、10分、20分毎日パソコンに向かって、スマホに向かって喋りまくっているんですけど、
そういう使い方もありますみたいな感じですね。
このAIの音声の精度は間違いなくこれからどんどん良くなっていく一方なので、
基本的に良くなっていくはずなので、今の時点で多少、もしちょっとおかしい変化があるなと思っても、そんな気にしなくていいです。
12:03
絶対良くなっていくから。それよりはとにかく喋ったものがテキストになり、
テキストになったものを今度はAIに整理させるみたいな、そこの体験をぜひしてみてください。
本当にびっくりしますから。面白いと思います。
ということで、今日ぼくが自分がすっげーなーと思ったことを、とにかく喋りまくるぐらいな感じになっちゃったんですけど、
本当に音声、文字起こしからテキスト、そしてそれをAIに読ませて整理するという、めっちゃ良いので、ぜひ使っていただけたらなと思います。
ということで、今日も最後までお聞きいただいてありがとうございます。
それでは、今日も良い一日を。
12:50
Scroll