2026-02-07 19:36

AI音声入力頂上戦争⚡️最強は?Typless/Genspark Spleakly/Aqua Voiceおすすめは?新サービス vs 定番アクアボイス



Aqua Voice ※招待コードからで1ヶ月間無料

https://app.aquavoice.com/share?code=KT-N5GK

AI音声入力といえばこれと言われるほど、もはや定番となったAqua Voice。


ただし、とにかく不安定です。エピソードの音声内でも触れている通り、全く言ってもいないことを突如言い出すような「虚言癖」があり、使っていてイライラしてくることもあります。


もっとも、そのあたりを考慮してか、アプリの中から音声の再生成ができたりと、決して悪いことばかりではありません。また、後述する2つのサービスと比べると入力速度はかなり速い方です(とはいえ、特別に速いというほどではありませんが)。


最大のメリットは、他のサービスにはない「カスタム指示」をメモリ機能として登録できる点です。これにより、音声入力の際の挙動を制御することが可能です。



✅Genspark Speakly ※招待コードからで1ヶ月間無料

https://www.genspark.ai/speakly/invite/MGFiZjkxYTZMOGNjZkwxZDA0TDllMzZiNWMzZDBiOUw1YjUz


Aqua Voiceより安定?AI音声入力「Genspark Speakly」Macで使ってみた。精度は?セットアップ時のテスト


☑️デフォFn長押しで音声入力

☑️フィラーなどは自動削除(文章成形も)

☑️テキスト選択箇所の音声での書き換え指示

☑️選択箇所への質問

☑️Fn2回押しでエージェント起動>ジェンスパで回答


✅スマホ&PC対応「Typeless(タイプレス)」1ヶ月間 有料プランが無料使用

https://www.typeless.com/?via=KT99


Gen SparkやSpeaklyと機能が似ていますが、以下の点がメリットです。


  1. ​ショートカットキーの割り当て

Ctrl + 〇 のように複数キーが設定できます。

  1. ​マルチデバイス対応

スマホ版も使えるため、PCとスマホの両方で同じ体験ができます。


入力精度に関しては、Gen Spark Speaklyに近い感じで、Aqua Voiceのような不安定さは存在しません。


ただし、入力中に音声文字が反映されないため、感覚をつかまないと使いづらく感じることがあります。特にスマホ版は、音声入力の最後にボタンを押して停止しなければならず、少し煩わしいです。


また、処理にしばらく時間がかかるため、「本当に処理できているのかな」ともう一度録音しようとしてしまうと、実はちゃんと反応していて後からテキストが反映されるといった具合に、数テンポ遅れてしまいます。ここら辺はかなりストレスに感じます。


#音声入 #AI音声入力 #GenSpark #GenSparkSpeakly #AquaVoice #Typeless #効率化 #ニュース #ビジネス #アクアボイス #タイプレス





サマリー

音声入力サービスの競争において、各種サービスが比較され、特にAquaVoiceと新たに登場したTypless、Genspark Speaklyの特徴が論じられています。音声入力の精度や機能についての考察も含まれており、今後の音声入力技術の進化が期待される内容です。このエピソードでは、音声入力の新サービスであるTypless、Genspark Speakly、AquaVoiceについての比較が行われ、それぞれの使い勝手や特徴が語られています。特にTyplessの利点やユーザー体験が考察され、音声入力の精度と操作性についても触れられています。

音声入力サービスの紹介
まだタイピングしてるの?
音声入力も4,5年ぐらいやっている。
最近使っていたアクアボイス、そして新たに二声力登場したのをご存知でしょうか?
Twitterの方ではちょこちょこ触れているんだけど、TyplessというものとGenspark Spleaklyという2つの音声入力サービスが突如登場って言っていいのかな?
ざっくり触って、それを順番にツイートしているので、概要欄の方に貼っておくのでよかったらそこから眺めてもらうと。
わりと最近順番にそこは載せているので。
今回、ざっくりとだけどんな感じかというのを触れようと思うので。
音声入力って言ってピンとこない人もいるかもしれないし、音声入力は試したことあるけど微妙でしょうって。
特にスマホで使ったことある人とかそのレベルだと全然次元が違うので、ざっくりだけど今回ちょっと触れようと思います。
そして今度改めて、できれば動画付きのものをSpotifyで見られるものとしてちょっとあげようかなと思ったので。
今回もなんかどんな感じかっていうところ、新しいサービスについてというのと、そもそも音声入力っていうもの自体がどんな感じかっていう。
そこについて興味ある方は是非チェックしてみてください。
AquaVoiceの利点と課題
ケイティーです。
まず音声入力っていうところからついて触れると、例えばスマホで音声入力をタイミングタイミングでする人っているんじゃないかと思います。
どうなんだろうね。世間一般でどう使われているかってのは知らないけど、スマホだったら使う人はいるだろうなとは思っています。
逆に人によってはさ、音声入力っておじさんが使うものでしょうぐらいに思っているようなおじさんおばさんとかって思っている人も中には未だにいるのかなっていう印象もあるしどうだろうそんなことないのかなもう時代的には。
俺自身が言っているのはスマホとかでは使うのはもちろんなんだけど、そんなことよりもパソコン上で使えます。
特にこの番組聞いてくれている人だったら普通にバイブコーディングとかそのプログラムAIに指示を出してプログラムを組むとかそういうときに音声を使うとか、
あとはAIが普及してAIに対して音声で質問するとかってそういうケースが増えているか。
何にせよ俺が言っているのは例えばチャットGPTに話しかけるときだとか、あとはスマホで音声入力するときにマイクアイコンを押すとかさ、
Google、Androidとかでマイクアイコンを押してとかそういうことではないんだよな。
それに近いか。それに近いことがパソコンでもできます。
何かっていうとパソコンだったら基本的には例えばブラウザでチャットGPTの画面でマイクアイコンを押してしゃべるとかそういう感じになるんじゃないかと思います。
基本的に各対象ごとにアプリ単位でマイクアイコンがついているから押してしゃべるみたいな人はいるんじゃないかと思います。
でも俺が言っているのはそうじゃなくパソコンのOS上で常にマイク入力ができる状態。
対象の文字入力するエリアさえ存在していれば対象が何であろうが基本的には対象が何であろうが打てるっていう音声で入力ができるっていうものを指しています。
何となくわかるでしょうか。
例えばWindowsのメニューの下の検索バーのところにだって音声入力で入力できるしみたいなそういうイメージで考えてください。
それを聞いたときにWindowsの標準であるじゃんっていう人もいると思うんだけどWindows Hだったっけか。
ちょっとショートカットも忘れちゃったな。
Windows H入れてるやつ。マイク。マイクが出てこれも音声入力ってのはできます。
それだと精度が低いのでそこで去年の5月ぐらいから使い始めたものとしてAquaVoiceっていうサービス。
これは結構主流だったと思うんだけどそれを使っていました。
色々本当にざっくり触れると精度がそこそことかある程度高くて
なおかつ当時触れていたことだと例えばWindowsの音声入力とかスマホの音声入力は今どうなのかな。
多分固有名詞にめちゃくちゃ弱いんだよね。英語の固有名詞特に。
例えばオープンAIとかFacebookとかもっと分かりづらいものがいない。
クロードとかクロードコードとかそういうのって多分カタカナ表記になっちゃうものって結構あったりすると思います。
ただAquaVoiceとかだとそういうところにめちゃくちゃ強い。
もうひたすらそういう英語の固有名詞言っても全部きれいに英語で入力してくれるとか。
あとはもうちょっと言うと例えばChatGPTとかだとメモリの機能記憶してもらう機能って使ってる人もいるんじゃないかと思います。
多少でも活用してる人だったら。つまり自分でこれを覚えておいて登録をしておいた上で
普段のチャットの中でAI側がメモリされている情報から情報を引き出した上で回答してくれるみたいなイメージになります。
メモリ機能とかそういう感じの指示を含むようなこともできるわけだよね。
例えば質問に回答するときは必ずリサーチをした上でファクトチェックを行ってから回答してみたいなものを事前にメモリ機能として登録しておける。
そうすることによって普段のチャットとかAIに聞いたときの回答が最低限のラインのメモリ機能から引っ張った上でやってくれるから
毎回細かい指示を出さなくていいみたいな状況になります。
これ分かってる人多いと思うんだけど、今回触れているAquaVoiceっていうサービスにもそういう機能があって音声入力に対して
カスタムなんとかみたいなのがあって、そこに今俺が言ったようなルールを設定しておくことによって音声入力の際にその挙動で動いてくれる。
例えば俺がやってるものだと怒ってる漢字だったら怒ってる絵文字を付けてとか絵文字を実際に何個かパターンで入れたって
この中からランダムで出力してってしたりとか、また悲しそうだったら泣いてるアイコンにするとか笑ってたらWって付けるとか
例えば祭を草に変えるとか、そんな感じの指示ができたり。
あとはもうちょっと最近試してないけど、AquaVoice側のアップデートとかで挙動が変わってきちゃってるけど
2025年5月時点で俺がやったのは一番最初、喋り始める最初に翻訳モードって言った上で話し始めたら
その後に話した内容が日本語だったら英語の文章を日本語の文章の後ろに出してって
2言語同時出力みたいなこともできました。すごくない?
あとは例えばどこまでちゃんと機能してくれてるかってそんな明確に分かんないけど
例えば主語と述語の間にめちゃくちゃ余計な言葉が入ったりしたら
そこをうまく主語と述語を近づけて分かりやすい文章に変えてとか
そういう指示をしてちゃんと機能してくれてるなって感覚が得られた時もあります。
その他個人的に設定してめちゃくちゃ便利だなと思ったのが
例えば英語の固有名詞Instagramって入れた後には必ず日本語のカタカナで括弧に挟む形で
日本語の表記でInstagramってカタカナで書いてとか
2回目以降には同じことはしないで初回登場の時だけその文章の中で初回登場の時だけそれ入れてみたいな
完全な挙動で動くわけではないんだけどもある程度動作してくれて
そうみたいな感じで音声入力にも関わらず補完をしてくれたりとか勝手に修正をしてくれたりするわけ
これがめちゃくちゃ使い勝手がいいっていうのはあります。
AIの音声入力っていうのがどういうものかっていうのは今の感じだと把握してください。
とは言ってもAquaVoiceにはいろいろと難点があってちょっとこれ後で触れます。
そんな中個人的にはごまかしごまかし使っててめっちゃイライラしながらだったんだけど
Genspark Speaklyの評価
そんな中1週間2週間前くらいかな
James ParkっていうAIのサービスこの前俺年額課金をしたって言ったやつになるんだけど
そこが日本展開に力を入れていくって発表があったニュースについて
この前ポッドキャストで触れたと思うんだけどその中でも多分書かれてたのかな
ちょっと俺ちゃんと意識してなかったけどその中に含まれていた
James Park Speaklyっていう音声入力のサービス
これがまだベータなのかなんかわかんないけど一応使えるようになっています。
それをまず試しました。
そしたらとりあえず感じたのがAquaVoiceよりも全然精度が高いし
とにかく安定している。
さっき言ったみたいなAquaVoiceってめちゃくちゃ不安定なのでなんか知んないけど
言ったことが入力されなかったりとか
言ったことと全然違うことが入力されたりとか
例えばねこれしょっちゅうツイートもしててめっちゃ腹立つんだけど
お疲れ様、ご視聴ありがとうございましたとか
お疲れ様でしたとかおはようございますとか
おはようございますとかまだあかんじゃん
ご視聴ありがとうございましたってなんだこの野郎って話じゃん
っていうのが例えば長々と話してるんだよこっちは音声入力で
話してて結果ご視聴ありがとうございましたって出てきてめっちゃ腹立つじゃん
今まで喋ったのは何だったんだよっていう
でそれはAquaVoice側もそういう挙動になっちゃうの
把握してんのかなんかわかんないけど
一応ね対策としては設定画面とかアプリの画面
アプリがあるのでアプリに行くとちゃんと音声自体も残ってるし
文字起こしした結果ってのも残ってて再生成するってのもできたりします
でまぁ今みたいにご視聴ありがとうございますってなっちゃったものもあるから
再生成ってあれば直せるかな?試したことないわ
今音声も一応残ってるんだよね
再生成あればそれもできるかもねもしかしたら
まぁ手間はかかるけど
そうとかあとは一応オンオフはできるけど
最後に入力した内容を自動でコピーするとか
これはご視聴ありがとうございましたって出力されちゃった場合は
もうそれがコピーされてるだけだからダメなんだけど
例えばなぜかテキストエリアに入力されないことがあるの
そういう場合はコピークリップボードにコピーされてるから
Ctrl Vでペーストすればちゃんと入力されるなんてこともあります
とにかくねそういうことがコマゴマコマゴマと起きて
もう本当に俺9割音声入力なので
もうそれは9割ずっと9割ではないにしても
さっきも言ったように多分5年以上経ってるような気がする
音声入力歴としては5,6年
もうあれねスマホでちょっと入力するとかではなく
PCでガッツリやるっていうレベルで5,6年経過しています
そうっていう状態で考えて
考えてってことないななんだっけ
ジェンスパークスピークリーアクアボイスがダメだった話だね
何話したか飛んじゃった
とにかくアクアボイスが微妙で
そんな中タイプレスじゃない
ジェンスパークスピークリーっていうのを使ったら精度とか高いしね
めっちゃいい
ただアクアボイスにある機能がなかったり
さっきのカスタムの指示あったっけななかったっけな
多分なかったような気がします
ただアクアボイスで逆にできないことができて
例えば音声入力するだけじゃなくて
入力されている文章をテキスト範囲選択で選択した状態で
英語に書いてとか
こういう感じに書いてとか
適当にしゃべった
あらあらしい文章だったら
あらあらしい文章だったら
てめえこの野郎みたいな感じだったとして
それを全選択してビジネスメール風にしてとかやったら
試したことはないけどそういう感じで変化をしてくれます
もう一パターンあってテキスト選択した対象に対して
質問することができます
例文としてチュートリアルで富士山はみたいな富士山についてはごちゃごちゃと書いてある文章があったんだけど
それを全部選択して富士山って何とか漢字が難しい漢字があるから
バカでもわかるように説明してみたいなことを
音声でだよ言うとそれの回答がウィンドウが上がってきて
そこに表示される回答がみたいな感じができる
さらにその先調べるんだったらボタンを押すと
James Parkが起動するみたいな感じ
特定の音声入力のトリガーになるキーの設定ができるんだけど
これを2回押すと直接James Parkの方が起動して
エージェントモードになって音声入力して質問するとウィンドウが出るんだけど
その質問からもう一回ボタンか何か押すと
James Parkが起動してくれて
そこから回答が来るみたいな感じになっています
これがめっちゃ使い勝手良さそうで
アクアボイスから乗り換えようかなと思うくらい
しばらく安定性を試そうと思ったけど
とりあえず安定はしてるの
なんか謎に音声入力を開始する時の
トリガーになるキーボードのキーを設定するんだけど
1個しか登録できないの
音声入力の基本機能
つまりもうファンクションを前提としてるのかね
FNキーなのか分からんけど
例えば俺はアクアボイスだったらALT Wとかを設定したの
他のアプリでは使わないだろうものとして
そうやったんだけどそういうことができないの
コントロールとかALTプラス何々っていうのは
それに対してショートカットを設定する項目がいくつもあるの
元々そもそも翻訳モードみたいなのが存在してたりとか
カオスモードみたいなものが存在してたり
でもショートカットがキー1個しか登録できないわけよ
俺こっちの環境依存なのかな
とにかくできないのね1個のボタンしかキーしか
だから全然使い物にならないなってなって
結局使うのが止まっちゃってる状況です
タイプレスのレビュー
めちゃくちゃ使い勝手良さそうなのに
ここ数日かな急に現れたタイプレスっていう
音声入力
ここ数日って俺がTwitter上で見かけたのが
もっと前からあったのかもしれないけど
それが今話題になっていてそれも試しました
そしたら起動した時点でめっちゃ違和感というか
あれって思ったのがジェーンスパークスピークリと
ほぼほぼ同じなんだよねチュートリアルが
若干機能の差はあるんだけどUIからして一緒で
UIの大元のサービスというかモデルみたいなもの
モデルって言うとまた違うのかなわからんけど
その大元が一緒でその側だけ別の会社が使ってる
なんてケースだってあったっておかしくないじゃん
なんかそういうことなのかなと思ったんだけど
よくよく見ていくと機能がちょっと違うしとかで
ちょっとよくわからない状態で実際にアプリレベルで
開いてみるとまあ違うんだよなジェーンスパークと
タイプレスはそのタイプレス側が最終的に
一番いいなって現時点は思っていますなんか音声
入力する感じとかはもうジェーンスパークスピークリと
同じ感じなのさっき言ったみたいに選択範囲に対して
質問したりとか書き換えとかができるっていうのも
同じなのジェーンスパークスピークリとタイプレスは
ほぼ同じものなんだけどちょっと細かいところで
中身設定とか見ると若干の違いはありましたそこに
対して一番ね俺がタイプレスを選ぶ理由になったのが
さっきのジェーンスパークスピークリでは一つのキー
それがねタイプレスの方ができますそうだから
だったらタイプレスかなって今なっている最中
タイプレスのメリットっていうのも他にはあって
スマホ版がすでに存在していますiOSだけかもしれないけど
iOS側にもその同じタイプレスを入れて
あれどうなんだ?辞書とか共通化してんのかな
ちょっとそこまでは把握してないんだけどスマホで
試してみたらiPhoneでまあまあPCと同じ感じで
かなりね相当精度高く文字起こししてくれる
ただスマホである以上仕方ないかもしれないけど
音声入力始めるときがめちゃくちゃだるくて
まずキーボードとして設定します
キーボードの種類で設定できるんだよね
まあAndroidとかiPhoneでもできると思うけど
iPhoneも設定ができて複数パターンの
例えばGoogleの日本語入力を登録するとか
そんなことができたりとかキーボードの種類
丸いアイコン地球じゃないし丸っこいアイコン
長押しして指を動かすとキーボード切り替えられるんだけど
その中の一つとしてタイプレスの音声入力を
加える感じになります
だから音声入力をするようと思ったときに
いちいち長押しをして切り替えなきゃいけない
切り替えた上でもう一回マイクアイコンを押す
っていうのが結構まずだるい
音声入力の間は通常のiPhoneに備わっている
マイクアイコンタップしてるのと違って
喋り終わって停止ボタンを押すまで文字が見えないの
それがちょっと慣れるまでストレス
PC上ではもうそれが当たり前なんだけど
PCでは慣れてるからアクアボイスとかもそうだから
そんな違和感はないんだけど
とりあえず待たなきゃいけないのね
喋り切ってその後しばらく時間経たないと反映しなくて
ちょっとラグもあるっていうのもあるから鬱陶しいんだけど
スマホだと特に文字が見えてないのと
最終的に終了ボタン押さなきゃいけない
押すっていうのもあれだし
タイミング大丈夫かなみたいなタイムラグがあるかもしれないから
俺が喋り終わってからしばらく待ったほうがいいかなとか
一瞬考えたりもしたし
ボタンで停止をした後にさらに時間がかかるの入力されるまで
あれこれ本当に動作してんのかなみたいな
もう一回マイクを押して喋り直したほうがいいかなと思って
押そうとすると反映するみたいな
ただ精度に関しては圧倒的にめちゃくちゃいい
めちゃくちゃいいからどうするかってところだね
常に例えば四六時中動き回って
移動とかも繰り返しながらやるとかっていう
あんまスマホにも目やってらんないぐらいのレベルの人だったら
そういう人だったらまた話変わってるかも分からんけど
とりあえず長文を押した後にバーってメールでも何でもしたりとか
メールとかがいいのかな移動中に
その時にこの音声入力でバーって話終わった後に
最後に継承してっていう時には
まあちょっと試さないと分かんないけど精度が高いだけに
信頼しきって完全に任せて入力するなんて
使い方にはいいのかもね
じゃないとさそもそものiPhoneとかの音声入力だとそういうわけには絶対いかないので
絶対間違うからどっかしらちっちゃいところでも
ただタイプレスだったら
まあ95%ぐらいの感じでいってくれるかも
もちろんね特殊なこういう名刺とかあったらダメだろうし
業界用語とかそういうのがあったらダメかもしれないけど
これはぜひ一回試してみる価値あると思います
料金プランと最終推薦
ということでまあタイプレスかな
今のところちょっとスマホ版は微妙だから
ゴチャゴチャとツイートで文句みたいなの書いたりはしたんだけど
まあ今1個選ぶんだったらタイプレス
ただもう1個だけ難点を挙げるとこれちょっと特殊な話だから当てはまる人はいないと思うけど
俺はそもそもAquaVoiceの段階からして
キーボードでトリガーに音声入力って開始してません
ちょっともう1回振り返ると
特定のキーを押しっぱにしている間に話している内容が
反映する指を離した時点で
入力対象に反映するみたいなイメージ
簡単に言うとで俺はそれをキーボードを使わずに
マウスのサイドボタンに割り当ててあって
右手でそこだけホールドしておけばその間
喋っててどんどん反映していくみたいなイメージで考えてます
そんな感じで使っています
なぜかマウス側に設定すると反応してくれなくて
っていうのがちょっとだるくて
そこだけ難点
マウスからできないんだったらちょっと微妙だなと思っている最中ではあるんだけど
最初30日間プロ版の
通常お金かかる月払いだと
30ドルだっけ高いんだよな
年払いだと18ドルぐらいまで下がる気がするんだけど
30ドルつと3600円とかもっと低いか
だとちょっとめっちゃ高いなと思うんだけど
ちょっと金額ちゃんと曖昧です
何にしてもその額のものが
30日間はその有料版のプランが無料で使える
っていう風になってるからめちゃくちゃお得
絶対これは試してみるといいと思う
音声入力をまだ試したことないっていう人なんかは
特にちょっと試してみてもらいたいかなとは思います
ということでここら辺おすすめなので
概要欄にこの辺りリンクを貼っておくので
アクアボイスも貼るか
アクアボイスジェインスパーク
タイプです参照言っても貼っておきます
今の話の中で気になったもの
喋ったまんま素直に反映してくれるのと
速度が速いのはアクアボイスです断トツで
とは言っても若干の待つ瞬間もあるはあるんだけど
速さで言うんだったら断然アクアボイス
安定性で言ったら断然タイプです
ジェインスパーク使ってなったらスピークリーもありかなみたいなイメージになるかと思います
ということで概要欄にリンク貼るので
興味のある方は是非チェックしてみてください
今度また動画上げられれば一番いいかなとは思うけど
こんな感じでまた配信するので
今回初めての方よかったらフォローなどお願いします
さよなら
19:36

コメント

スクロール