2026-02-27 19:44

Typeless AquaVoice VoiceOS | 最新の音声入力ツール活用術と、仕事の生産性を爆上げするマイク選び #デブログfm #007

デブログfmは、現役エンジニアのinadyが、日々の業務で試したAI活用術や最新ツール、効率化のノウハウをシェアします。https://devlog.fm

番組の感想やリクエストは #デブログfm まで。番組のフォロー、星★(レビュー)いただけると嬉しいです!

【アンケート実施中】
より良い番組作りのために、アンケートにご協力ください。
https://yutaka-inada.notion.site/2fdcad0a5eee800487e5fb5b68b5e361

▼今週のトピック▼

  • - Typeless, AquaVoice, VoiceOSの違い
  • - おすすめの音声入力ツールは?
  • - DJI Mic Miniのすすめ
  • - 読影医と音声入力

サマリー

本エピソードでは、音声入力ツールの進化と活用法、そして生産性を向上させるマイク選びについて解説します。Typeless、AquaVoice、VoiceOSといった最新ツールの違いや特徴を紹介し、特にTypelessがスマホアプリ対応で優れている点を強調しています。また、LLM時代において音声入力がコンテキスト理解を深め、AIの精度を向上させる重要性を説いています。さらに、iPhone標準マイクの優秀さや、PCでの利用に適したワイヤレスマイクDJI Mic Miniを推奨し、音声入力の精度向上にマイク選びが不可欠であることを説明しています。

音声入力ツールの進化と重要性
おはようございます、inadyです。デブログfmでは、ProGridでエンジニアをしているinadyが、AI活用術や最新ツール、開発・生産性向上のノウハウをシェアします。
この番組は、YouTube、Apple Podcast、Spotifyで配信しております。ぜひ、お好きなプラットフォームからサブスクライブをお願いします。
では、今日のトピックをご紹介します。
最新の音声入力ツール活用術と、仕事の生産性を爆上げするマイク選びという話を、今日はしたいというふうに思っております。
まずはじめになんですが、みなさん音声入力ツールって使っていますでしょうか?
一番身近な例で言うと、iPhoneのキーボードの右下にある、あの何でしょう、ツールのことですけれども、
これを昔から使っている人もいれば、全く使っていないという人もいると思うんですが、
最近かなり時代が変わってきて、すごい使いやすくなってきております。
なので今日はこの話をしたいんですが、従来の仕組みであればですね、そもそも精度が低いですよね。
あと日本語で言うと、点とか丸とか開業みたいなのを、自分で話さないと実際に入れてくれないっていうのがあるので、
音声で入力したものを、例えば検索に使うこととかは全然できると思うんですが、
これを他人にスラックとかメールでそのまま送るみたいなことは、ほぼ不可能だというふうに思います。
一方でですね、最近はツールの精度がすごく上がってきて、まず音声の読み取りの精度が上がってきたと、認識の精度が上がってきたので、
誤字脱字間違いがすごく減ってきましたというところと、
これをさらにLLAも通すことによって、フィラーを消すとか文章を構造化するみたいな自動整形も可能になってきました。
なのですごく使いやすくなってきたと、簡単に言うとなってきたので、
本当にですね、スラックとかメールの返事としてそのまま音声入力をしたものを、
特に気にすることなく返せるぐらいの精度になってきています。
かつこの音声入力っていうのが、何で重要になってきているんだろうなと、ツールが便利になってきていて、
かつこれを何で使う人があるのかっていう話を補足をすると、
LLM時代においてコンテキストって重要ですよねっていう話は、
昔から言われているところだと思うんですが、
人間がタイピングをすると、どうしてもやっぱりタイピングって結構労力がかかることなので、
はしょったりとか、これ書かなくていいかみたいなところを書かずに、
本当に要点の部分だけタイピングしてLLMに渡すと思うんですが、
それだとLLMがコンテキストを理解していないので、
結局レスポンスが返ってくるデータが自分が思った通りじゃないってことが起こります。
一方で音声入力であれば、本当に自分が思ったことを思ったスピードで入力することができるので、
コンテキストが大幅に増えますよね。
かつ言い間違いがあったとしても、
それも全部含めて修正をしたものを入力してくれるツールが最近はあるので、
そういったものを使うことによってコンテキストがすごく増えて、
LLMの精度が劇的に向上するということがあるので、
このLLM時代において音声入力というのは非常に重要だということを改めてお話ししていきたいと思います。
ではですね、私がこの音声入力をどういうシーンで使っているかというところを話すんですが、
ちょっとその前に雑談を1個すると、
この音声入力を昔からめちゃめちゃ使っている触手があります。
これはドクエイというお医者さんなんですが、
影を読む医者と書いて、読む影の医者ですね。
ドクエイなんですが、放射線化のお医者さんのことです。
彼ら彼女たちは何をしているかというと、
レントゲン技師の人が取ったレントゲンのデータを見て、
こういう所見がある、こういう問題がありそうだ、特に問題がないというのをカルテに入力するというお仕事の方たちなんですが、
この方たちものすごくその入力が多いわけですよね。
カルテに次から次に画像を見ては入力してということをやる職種なんですが、
タイピングしていては全然精査性が追いつかないというところがあって、
音声でこのドクエイの結果を入力するというのがかなり前から行われているんですが、
なので独定の業種においてはめちゃめちゃ生産性が上がるというのがこの音声入力ツールでして、
このドクエイが使っているというものは、
このお医者さんが使う単語とかにすごく特化して作っているので非常に精度が高いんですが、
これがいろんな業種全ての職種の人が使おうとするとやはりちょっと難しいですというところがありますけれども、
最近のLLMの発達によってこのツール、このような音声入力の仕組みが、
ドクエイだけじゃないいろんな職種に広がってきている時代に来ているのかなというふうに思っております。
音声入力の活用シーンと具体的なツール紹介
話を戻すんですが、どういうふうに使っているかというと、
まずスラックとかメールの返信にはもちろん使っております。
それからノーションでドキュメントを書くときにもすごく使っていまして、
まずノーションAIとかで構造を書いてもらって、
その中身を書くときに音声で話したものを入れるようにしております。
次がジェミニとかカーサとかクロードコードとかに何かを支持するとき、音声入力をするときに使っております。
この音声入力するときは先ほどお話ししたように、
できるだけコンテキストを多めに話すように気をつけております。
最後がラバーダックデバッキングというらしいんですけれども、
アヒルさんの人形ですね。
ラバーの人形さんに自分が思っていることとかこういうバグがあるんじゃないかこうでこうでこうしたら治るんじゃないかみたいなことを一人ごととして話して、
自分の中の脳で整理をして問題を解決するというやり方が昔からあるらしいんですけれども、
これを音声入力とLLMを使ってより改善したものを私はよくやっていて、
まず問題が起きますよねとこういうことを解決したいというのがあったときに、
ジェミニとかノーションAIでもいいですけど開いて、
一人ごとに話しますと。
話すことによってまず自分の脳を整理して、
それを文章になっている文章を読むことによってさらに整理され、
かつその入力をLLMに渡すんですね。
渡して帰ってきたレスポンスを見て、
なるほどそういう考え方もあるんだなということを理解してみたいな使い方も結構やっていてですね、
私は言ってしまえば文字を書くっていうほとんど全てのプロセスにこの文字起こしツールを使っていて、
使わないシーンで言うと本当に2、3文字数文字書きたいという時だけはキーボードを使うんですけれども、
それ以外の時はほとんど全て音声入力で仕事を最近はやってきております。
ここまで音声入力ツールってすごいぞと偉そうに語ってきたんですけれども、
実は使い始めたのは割と最近でして、
なんで最近こんな感じに使い始めたのかというと、
スマホでこの音声入力ツールが使えるようになったというのがあります。
私はキーボードの入力がそんなに遅い方じゃないかなというふうに思っていて、
なのでいっかと音声入力使わなくてテキストでキーボードでやった方が早いんじゃないかというふうに勘違いをしてやっていたんですが、
スマホのほうに限って言うと流石に入力が遅くてですね、
なのでどういうことが起こるかというと長文のスラックが来たとか長文のメールが来た時に流石にスマホの画面で返事するのは大変すぎるということが起きるので、
今までであればちょっとじゃあ家に帰ってパソコンの前でやろうかみたいな後回しがちだったんですが、
スマホで音声入力できることによってパソコンがない環境であってもどんどん返信をして仕事を前に進めることができ、
すごく精査性が上がってきたんですね。それでハマってじゃあパソコンでも使ってみようってやってみたら、
なんだキーボード打つより早いじゃんみたいなところがあってすごくハマっているというところがあります。
なのでスマホで使えるツールも最近あるので、なのでパソコンで使うというイメージの方多いと思うんですが、
スマホで使ってみるというのをぜひ皆さんもやってみてほしいなというふうに思っています。
では次のトピックはじゃあどういうツールが今あるんですかねみたいな話をしていきたいと思います。
私も全て使いこなしているわけではないので、最近使ったツールの中からのご紹介になるんですが、
タイプレスとアクアボイスとボイスOSこの3つをご紹介したいと思っております。
結論から言うと使っているのはタイプレスで、このタイプレスというのはもちろん日本語に対応しています。
スマホとパソコン両方に対応しています。
入力の精度も非常に高いです。
かつ自分が言い間違えたこと、フィラーとかあとはこうだと思います。
いや違うやっぱりこうだみたいなふうに言い直したとしても、ちゃんと言い直した方だけ採用してくれるみたいな仕組みがあったりして、
本当に自分がテキスト音声入力したものをそのままスラックとかメールで送れるぐらいのレベル感に構造化して送ってくれるという仕組みがあるので非常によく使っております。
次がアクアボイスですね。
これは割と前からあるツールになっていて使っている人も多いんじゃないかなと思うんですが、
これの良さは音声の入力精度が非常に良いというところとタイプレスに比べてレスポンスのスピードが速いというところですね。
逆に言うとタイプレスみたいな構造化して文章を成形するみたいな仕組みはあんまりなかったり弱かったりするので、
これはどっちがどっちを取るかなみたいなところだと思っております。
例えばそれこそLLMに渡す文章みたいなものは構造化されていた方が便利だと思うのでタイプレスを使い、
かつそれこそ日記みたいな自分が言ったものを言ったまま文字を講習したいっていう場合はアクアボイスの方がいいのかなというふうに思っていて、
SNSなどを見るとタイプレスとアクアボイス両方使っていますっていう人も見かけるんですが、
両方課金するのは高すぎるなというふうに思っていてタイプレスだけ今扱っているという状況です。
最後にご紹介したいのは新生のボイスOSというもので、
こちらは仕組みとしてはタイプレスとかアクアボイスと同じように文字入力、音声入力ツールなんですけれども、
性能はタイプレス、性能って言ってるのは文字起こしの構造化するとかフィーラーを消すとか段落をつけるみたいなそういう仕組みですね。
タイプレスが一番良くてアクアボイスがあんまりないこの間ぐらいがボイスOSで、
テキストが実際に生成される前のスピードもタイプレスは結構遅いんですね。
構造化するLLMの処理が結構かかるので遅いです。
アクアボイスはかなり早いです。
この間ぐらいがボイスOSかなというふうに思っていて、
どれを使うかは使う芯次第ですし値段次第というところもあると思いますので、
ぜひいろんなツール使ってみて、だいたい1ヶ月無料とか1週間無料みたいなオプションがあると思うので、
ぜひいろいろ使ってみて自分が合うものをぜひ使ってほしいなと思うんですが、
自分がなぜタイプレスを使っているかというと、これは一言で言うとスマホアプリがあるからというところです。
先ほども話したようにスマホで音声入力ができるというのが、
自分の中ではかなりブレイクスルーになっているのでこのタイプレスを使っているんですが、
今年の3月ですね3月1日にアクアボイスもスマホアプリが出るというふうに言われているので、
ぜひ出たらですね私も両方使ってみたいなというふうに思っておりますし、
かつアクアボイス、ボイスOS、タイプレスに限らずこれからもどんどん新しいアプリが出てくると思うので、
出てきたらもっといいものが出てきたら、
明日にはタイプレスもう使えませんという時代がやってくるかもしれないというふうに思っております。
生産性を高めるマイク選び
今日の話の最後のトピックにすごいマニアックな話をしたいんですけれども、
マイク選びの話を最後にしたいと思っております。
基本的にスマホで使う時にはiPhoneの本体に入っているマイクで録っております。
iPhoneの標準のマイクの性能ってすごく良くてですね、
もちろん音質もすごい良いですし、ノイズも非常に消してくれてクリアな音声を録ることができます。
なので音声入力というのは、元の音声がいかにきれいかと、
ノイズが少ないか、音量が適切かみたいなところが精度に直結するわけですけれども、
iPhoneの標準のマイクであればそれは十分できるかなというふうに思っております。
一方でAirPodsみたいなBluetoothのマイクを使うと非常に音質が悪いです。
よかったら皆さんも音声メモとかでBluetoothの録音したデータを聞いてみて欲しいんですけれども、
すごい音質が悪いので、その悪い音質のままツールに送ってしまうと非常に精度が下がってきてしまいます。
これはですね、AquaVoiceの公式のサイトにもBluetoothのワイヤレスマイクというのは必須以上ですよということが明確に書かれております。
ではパソコンで使うときはどうかというと、パソコンも同様にですね、
MacでいうとMacの標準についているマイクの性能は非常に良いです。
なので一番お金がかからない方法はMacの標準のついているマイクを使うことなんですけれども、
課題があってですね、特に会社で使うときにはパソコンと自分の口との距離が結構あるので、
比較的大きい声でしゃべらないといけないですが、隣に同僚がいる中でなかなか大きい声でしゃべれないですよねというところがありますし、
あとは自宅で私仕事しているときはパソコンはもう閉じてクラムシェルモードにして、
かなり端っこに追いやって使っているんですが、そうすると距離が遠すぎて同じように音が入っていけないという問題があります。
一方でこういうヘッドセットマイクみたいなものを使うというのは一個解決策なんですが、
ケーブルがあるというのは非常に邪魔ですよね。お手洗いに行ったりとか、ちょっと席を外すとか、ちょっと向きを変えたいときにこのケーブルが邪魔になっているとか、
あとはオーバーヘッドの多い被さるタイプのヘッドセットだとちょっと圧迫感があるみたいなところがあるので、
これも貧乏だなというふうに思ったらやっぱりワイヤレスがいいと。
ただBluetoothは音質が悪いというところで色々探して見つけたのがこのDJI MIC MINIというやつなんですけれども、
中身はトランシーバー音を収録する部分と、レシーバーという音を録る部分と、あとマイクですね。
マイクがセットになっているもので、これが何がいいかというと、まずはこれBluetoothじゃないですね。
専用の通信機器でつながっています。おそらくWi-Fiの周波数帯だと思うんですが、
なので遅延も少ないですし、それから音質も非常に良いです。
なので理想は有線マイクなんですけれども、それに引きを取らないぐらいの音質の良さがありますというところと、
あとは非常に口元の近くに置くことができます。
私は自宅で使うときはこのマイクを首元にくっつけて、襟にくっつけて録音しておりまして、
そうすると非常に距離が近いのでクリアな音声を録ることができますというところがあります。
かつ会社で使うときはどうやっているかというと、このマイクをコンビニとかで言っているフォークに挿して、
本当に口元にガン付けして録れば、すごい小さい声で収容することができます。
なので今は結構自分の席でリモート会議するっていう人多いと思うんですが、
それぐらいの間隔でボソボソと喋って、隣の同僚に迷惑かけないぐらいのレベルで音声入力することができるので、
このDJIマイクミニみたいなワイヤレスのピンマイクを使うのをお勧めしていて、
その中でなんでDJIマイクミニがいいかというと、バッテリーの持ちがすごくいいんですね。
基本的に充電したり取ったり外したりってめんどくさいので付けっぱなしにしておきたいんです、仕事中は。
そうなってくるとバッテリーの持ちが少なくとも8時間6時間ぐらいあった方がいいかなという風に思っていて、
いろいろ見た中でこのDJIマイクミニっていうのがバッテリーの持ちが確か交渉で10時間持つんですけれども、
なのでもうずっと付けっぱなしでいいです、もちろん音質もいいですってところがあるので、
このDJIマイクミニをすごくお勧めしております。
まとめと今後の展望
では最後にまとめに入りたいと思っております。
昔ですね1年前ぐらいに音声入力ツールちょっと流行ったと思うんですけれども、
そこで1回使ってみて精度が微妙だなということでやめた人も非常に多いと思うんですが、
今かなり音声入力ツールが進化していて盛り上がってきているところなので、
ぜひ今一度試していただきたいなという風に思っております。
先日ですね、私の勤めている会社プログリッドの社長に音声入力ツールってすごい便利ですよって話したところ、
早速使ってくださってめちゃめちゃ生産性が上がったと、もうなくてはならないという風に教えていただきました。
なので何が言いたいかというと、とある上場企業の社長も気に入るぐらいすごく便利なツールですというところですかね、
すごく本当に便利なので、ぜひ使ってみていただきたいなという風に思っております。
ということで今回は最新の音声入力ツールの活用術と仕事の生産性を爆上げするマイク選びという話をしてみました。
ということで最後に番組のご紹介をさせてください。
この番組はYouTube、Apple Podcasts、Spotifyなどで配信しております。
ぜひお好きなプラットフォームからサブスクライブをお願いします。
ご感想、リクエストなどもしございましたら、ハッシュタグDevlogFMでつぶやいていただくか、
概要欄のフォーム、コメント欄よりいただけますと幸いです。
それでは次回の配信でお会いしましょう。ご視聴ありがとうございました。
19:44

コメント

スクロール