Mac用音声入力ツールWispr Flowを試してみました。本来のウリとなっている機能を試しきれてないのですが、自動編集や辞書登録、履歴、ささやきモードなどについて紹介しました。
=== 目次 ===
音声入力ツールWispr Flowを使ってみた
Mac標準の音声入力と手軽さは同等
じゃあFlowでの音声入力のどこがいいのか?
自動編集が成功した例
辞書登録、履歴、ささやきモード
競合音声入力ツールTalkTastic
■Wispr Flow | Effortless Voice Dictation
https://ref.flowvoice.ai/ashikagacast
↑アフィリエイトリンクになっているので、ぜひこのリンクからユーザー登録してください。
-------
#アシカガCAST
デジタル活用のヒントをスキマ時間で。
話題のサービス、注目のソフトウェアの紹介、デジタルツールの活用術など、テック系情報をわかりやすくお届けします。
月〜水 朝8時に更新
■アシカガCAST文字起こし要約|アシカガコウジ|note https://note.com/ashikagacast/m/mbc989fbedb84
■X(Twitter)アカウント
https://twitter.com/ashikagacast
Apple Podcast、Spotify、Google Podcastなどでも配信しています。
■アシカガCASTの聴き方
http://typebot.io/ashikagacast
■アシカガノオト
https://ashikaga.substack.com/
00:01
新しい音声入力ツールを試してみました。
Wispr FlowというMac用のソフトウェアです。
このWispr FlowをMacにインストールして、ホットキーを設定すると、
そのキーを押している状態で話しかけることで、自動で文字起こしされます。
Gmailでも、Slackでも、メモアプリでも、文字を入力できるところだったら、
どこでも音声入力を使うことができます。
ホットキーというのは、何か特定のツールだったり、機能を呼び出すためのキーを設定できるということなんですが、
どんな時でも特定のキーを押すことで音声入力ができるのは便利だと思ったんですが、
考えてみたら、Mac標準の音声入力でもできることでした。
今まで音声入力をあまり使ったことなかったんですが、
ファンクションキーのマイクのキーを一回押したら音声入力が起動して、
もう一回押すと終了します。
なので、音声入力を呼び出すためのお手軽さで言えば、
標準の音声入力もこのWispr Flowもあまり変わりません。
違いとしては、Mac標準の音声入力は、
キーを一回押したらスタートで、もう一回押したらストップなのに対し、
Wispr Flowの方はキーをずっと押しっぱなしの状態で音声入力を離したら終了ということになっています。
そして、Mac標準の音声文字入力では、
喋っている途中でも随時テキストが表示されていきます。
Wispr Flowの場合は、最終的にストップしてからテキストが表示されます。
話している途中でもどんどんテキストが表示される方がいいように思うんですが、
Wispr Flowが最後まとめてテキストを表示するようにしていることには意味があります。
キーを押しっぱなしで入力するということにも意味はあると思うんですが、
これに関しては押しっぱなしにしないでいいようなハンドフリーモードというのもあります。
音声入力を起動させるためのキーとスペースバーを同時に押すことでハンドフリーモードにできます。
03:03
ハンドフリーにする方法は他にもいくつかあります。
で、じゃあWispr Flowが標準の音声入力よりどこがいいのかということが気になりますよね。
公式サイトの説明によると3つのポイントが書いてあって、
1つ目が自動編集。
2つ目が状況に応じたテキスト化ができる。
3つ目がその人らしい文章になるということでした。
これ英語で書いてあるので、翻訳したらこんな感じかなということです。
自動編集というのは、しゃべったそのままが忠実にテキストになるわけではなく、
ある程度整理された文章として書き出されるということです。
なので入力途中にテキストが表示されないんですね。
例えば、じゃあミーティングは5時にしましょう。いや、6時にしましょう。
というと、じゃあミーティングは6時にしましょうとテキスト化される。
そういうことができるらしいんですが、これはなかなかうまくいきませんでした。
あとでうまくいったケースの話もしますが、
日本語ではこの自動編集は今のところあんまり使えない感じがします。
状況に応じたテキスト化ができるというのは、
メールの返事なのか、スラッグの返事なのか、SNSに投稿するのかなどの
状況に応じた文章を作ってくれるらしいんですね。
ただこれ私いろいろ試してみたんですが、
今のところその効果が出てるなと実感したことがありません。
日本語で使っているのでうまくいってないのかなと思っています。
例えば、斉藤さんから来たメールに返信するときに斉藤さんと喋って音声入力すると、
そのメールをくれた斉藤さんの漢字が正しい漢字の斉藤さんになるのかなとか、
そういうことだと思ったんですが、そんなに試してはないですが、
今のところ私が試した範囲ではこれはすごいとなったことはありませんでした。
その人らしい文章になるというのは、使い込んでいくうちにその人らしい文章を作るようになってくるらしいんですが、
これも今のところ効果を感じたことはありません。
ユーザーの話し方や文体を学習して、より自然な文章を生成してくれるらしいです。
06:08
日本語環境でもうまくいくのかはわかりません。
有料のプロ版のみの機能らしいんですが、最初の2週間はお試しでプロプランの機能が全部使えるようになっています。
次に私が実感したウィスパーフローのMac標準の音声入力とは違うぞというところを話したいと思います。
まずさっきの繰り返しになりますが、自動編集ですね。
成功した例を言うとちょっと微妙なんですよねみたいに言ったときにちょっと微妙なんですよねとテキスト化されました。
あと音声で編集指示をするということもできてテキストを選択した状態でフローこの文章をもっと丁寧な文にしてと言うと丁寧な文章に変更してくれました。
アルファベット表記にするように指示してちゃんと変更してくれたケースもありました。
ただこれも失敗するうまくいかないことの方が多いです。
なおこれもプロ版のみの機能ですね。
ウィスパーフローを紹介するPRする動画ではキーボードをノコギリで切ろうとしていてキーボードはいらないというのが強いメッセージになっています。
ただじゃあMacの標準の音声入力機能は随分前からあるのでそれでもキーボードはいらないみたいな流れにはなってないですよね。
なのでじゃあ音声入力でキーボードをいらなくするにはどうしたらいいかということを考えての自動編集であったり音声による指示でテキストを編集していく機能だったりするのかなと。
AIの力を借りながらキーボードを使わずに音声だけで文章の作成ができるようにということを本気で考えているツールなのかなと感じました。
ただ多分まだまだその道のりは長そうだなとも感じています。
他の機能として辞書登録の機能があって辞書登録しておくとその言葉が登録している表記でテキストになるのでこれはシンプルに便利ですよね。
09:02
例えばアシカガキャストというのをカタカナのアシカガにCASTというアシカガキャストで使っている表記で辞書登録しておくとアシカガキャストとしゃべるとその表記でテキスト化されるので便利なはずです。
あと音声入力した内容は全部保存されていて実は音声も保存されていました。
なので自分が何て言ったか聞き直すことができるんですね。
音声からテキストに再変換することもできます。
この履歴は検索もできるのでちょっとパッと言おうとは思いつかないですが便利な気がします。
あとささやきモードというのがあって小さな声でささやくような声でも音声入力ができます。
これは試してみたんですが結構すごいと思いました。
本当に聞こえないような声でもちゃんと変換できるんですね。
明らかにMac標準の音声入力よりも小さいささやき声でも拾ってくれるんですがMac標準の音声入力でも意外と小さな声でも認識するんだなと試してみて思いました。
また対話型AIのPerplexity に指示を与えることができて
Perplexity なんとかかんとかとプロンプトを言えば自動でブラウザーでPerplexity のサイトが立ち上がってプロンプトが実行されるらしいんですが
これは一度もうまくいったことがありません。私のPerplexity の発音が悪いせいかもしれません。
なおトークタスティックという競合ツールもありました。
このトークタスティックも状況に応じたテキスト化ができるというところを売りにしています。
トークタスティックは音声入力したときに喋ったそのままのテキストとAIが文章を整えてくれたものとのどっちかを選んで入力することができるそんな仕組みになっていました。
ウィスパーフローの方がトークタスティックよりも後に出ている高発のツールみたいなんですが私が使ってみた感じではウィスパーフローの方が洗練されてるなと思いました。
12:02
今回は以上です。アシカガコウジがお届けしました。
キャストアシカガ〜♪。
12:12
コメント
スクロール