1. アシカガCAST
  2. 音声文字起こしツールMacWhisp..
2023-04-12 10:28

音声文字起こしツールMacWhisperが良さそう(第647回)

spotify apple_podcasts youtube

音声文字起こしツールMacWhisperを使ってみたところ、わたしの使用用途に合っていて、なかなか良さそうだという話です。テキスト部分の音声の再生ができて、テキストの検索もできます。
=== 目次 ===
音声文字起こしツールMacWhisper
無料版とプロ版の違い
Clova Noteは毎月合計600分の制限
Nottaは無料版ではあまり使えない
MacWhisperの残念なところ
MacWhisperがClova Noteより良い点
-------
#アシカガCAST
デジタル活用のヒントをスキマ時間で。
話題のサービス、注目のソフトウェアの紹介、デジタルツールの活用術など、テック系情報をわかりやすくお届けします。
月〜水 朝8時に更新
■Twitterアカウント
https://twitter.com/ashikagacast
Apple Podcast、Spotify、Google Podcastなどでも配信しています。
■アシカガCAST on アシカガノオト
http://bit.ly/ashikagacast_notion
■アシカガノオト
http://bit.ly/ashikaganote

00:00
アシカガキャスト。
音声文字起こしツールとして、MacWhisperというツールを見つけました。
使ってみたところ、私の使いたい用途に合っていて、なかなか良さそうだという印象です。
Whisperという名前でピンときている人もいると思いますが、
オープンAIが提供する音声認識モデルWhisperをベースにしているMac用のアプリです。
オープンAIは、今話題のChatAIのChatGPTや、画像生成AIのStableDiffusionを開発している団体です。
音声文字起こしツールの使い方として、私はインタビューやリモート会議の音声をテキストに文字起こしをして、
テキストからその部分の音声を再生させる、音声の頭出しをする使い方が多いです。
文字起こししたテキストをそのまま原稿に使うとか、会議の議事録に使うとかではないんですね。
原稿を書いたり、動画を編集したりする上で、あそこの部分なんて言ってたか、もう一回聞き直したいとか、
あの話題をしてたところを動画として切り抜きたいと。
そういう時の、その音声がどこかの頭出しをするためにテキストを利用したいということなんですね。
なので、ただテキスト化できればいいわけではないんですが、このMacWhisperはMacWhisperのアプリケーション上で、
テキストからそのテキストの部分の音声を再生することができます。
音声の再生速度を変えることもできます。
等倍のほか、1.5倍、2倍、3倍、0.5倍をクリックするごとに1段階ずつ変わる形式です。
音声を聞き直す際に、時短のために早く聞きたい、あるいはゆっくり聞きたいというケースもあるので、
音声の再生速度を変えられる機能は重要だと思います。
そしてテキストの検索もMacWhisper上でできます。
これも私の使い方では必要な機能です。
あの話題について喋っていたところを探したいという時にテキストで検索すれば見つかると。
その後すぐ再生できるので、音声を喋っている内容をテキストで検索しているような感覚ですね。
03:01
MacWhisperは無料で使うことができて、無料版でも扱える音声ファイルの長さとかに制限はないですし、無料版で問題なく使えると思います。
プロ版が16ユーロ、日本円にして約2300円で、サブスクとかではなく買い切りです。
プロ版にすると音声をテキスト変換する時により精度が高くなります。
Whisperで変換する時のモデルというのがあるんですが、プロ版だとより精度が高いMedium、Largeというモデルを使えるようになります。
買い切りで値段もそこまで高くないので、私はプロ版にしました。
精度が高いモデルを選ぶほど変換に時間がかかるんですが、テキスト化できたところから順次表示されるので、全て変換されるのを待つ必要はありません。
そこもなかなか気が利いてますね。
Mac Whisperは音声のテキスト変換は全て自分のMac上で行うので、データがどこかのサーバーに行くわけではありません。
セキュリティを気にする企業にもいいと思います。
あと、プロ版だと翻訳機能がついていたり、YouTubeの動画をURLを入力するだけでテキストに変換することもできたりします。
音声文字起こしツールを音声の特定のシーンを聞くための頭出しに使っている話は以前このアシカがキャストでしています。
その時にはツールとしてClover NoteとNotaを紹介しました。
Clover Noteは無料で使えてありがたいですし、機能的にそんなに不満もありません。
ただ、毎月合計600分までという制限があるんですね。
これ本来300分なんですが、サービス向上のためのユーザーデータ取得に同意すると合計600分まで無料で使えるようになります。
ただ、私の場合600分をオーバーしてしまうケースが出てきました。
その場合お金を払って追加とかもできないんですね。
1ヶ月ごとに残り時間が更新されるので、600分使い切ったら次に残り時間がクリアされるまで待つしかありません。
06:05
なので別なツールを探して見つけたのがNotaというツールでした。
Notaは無料でも月に120分文字起こし時間が利用可能と書いているんですね。
なので、クローバノートが時間オーバーした時にさらにプラス120分Notaで使えないかなと思ったんですが、この考えは甘かったです。
以前のそのアシカガキャストで120分近い119分の音声ファイルをアップロードしてみたけど、文字起こし時間が不足のためテキスト化できませんと出てきて、有料版に誘導されるという話をしました。
その後1ヶ月経ったので文字起こしを試してみたんですが、アップロードした音声データに対しては最初の5分しかテキスト化できないということがわかりました。
なので無料版の120分というのは、Notaが得意とするリアルタイムの音声からの文字起こしの類型ということなんでしょうね。
Notaの有料版を契約して完全にクローバノートから移行するということも考えたんですが、そんな中MacWhisperを見つけてクローバノートと併用するにはこれでいいんじゃないかと今考えているところです。
ただMacWhisperにはクローバノートと同等な使い方はできない部分があります。
それは音声を文字起こしした後、テキストをエクスポートすることはできるんですが、そのMacWhisperで開いている状態、テキストを選んで音声を再生させたり検索できたりするそのウィンドウを保存しておく機能がないんですね。
なのでそのウィンドウを1回閉じてしまったら、次もう1回音声ファイルを開いて文字起こしの処理をする。それなりに時間がかかるんですが、その処理をいちいちしないといけないということになります。
まあだいたい原稿を書いたりするときにはまとめてやってしまうのでしばらく開きっぱなしにできていれば大丈夫なケースも多いと思うんですが、昔のものを振り返りたいというときにはちょっと面倒ですね。
クローバーノートだと音声とテキストが連動した状態で一つのノートとして保存され続けるので、その辺がクローバーノートの良さですね。一方でMacWhisperの方が良い点としては、一度にアップできる音声データの時間制限がありません。
09:18
クローバーノートも制限は一つのファイルにつき180分までなので、十分といえば十分なんですよね。3時間なので。ただ私の場合、とあるミーティングでちょいちょい3時間オーバーになってしまうものがあるので、なかなか3時間半以上にはならないので、ほんのちょっとなんですがファイルを分割するのが面倒なので、制限がない。
MacWhisperはいいですね。あとMacWhisperはMP4 MOVの動画ファイルを直接処理できるところもクローバーノートより良い点です。
Zoomでミーティングを録画した動画ファイルを一旦音声だけのファイルを別途作らなくても、そのままMP4のファイルのまま補助越しできるので、ひと手間減って便利ですね。ということで今回は以上です。アシカガコウジがお届けしました。
10:28

コメント

スクロール