AI音声入力ツールの現状と進化
ずっとラフ案
どうも、こんのです。
今日は、AI音声入力がアツい。仕事はどう変わる?というテーマで話していこうかなと思っています。
最近、本当に音声入力ツールがアツいんですよね。
特にこのAI時代になって、音声入力がめちゃくちゃ便利になったかなと思っていて、
今日は普段、僕がどんな感じで音声入力を使っているかというのを話していきたいなというふうに思っています。
まず皆さん、音声入力を使ったことはあります?
多分、iPhoneとか標準で音声入力機能があるので、ちょっと使ったことがあるよという人は多いんじゃないかなというふうに思っています。
ただ、iPhoneの音声入力ってめちゃくちゃ精度が悪くて微妙なんですよね。
もしかしたら英語だともうちょっと精度高いのかもしれないですけど、
日本語だと喋った内容通りにいかずに、日本語がところどころ崩れたり、おかしな文章になったりとかして、
うーん、これちょっと使えないなというのがちょっとあったりします。
ただ、ChatGPTが出てきたら辺で音声入力めちゃくちゃ精度高くなったかなというふうに思っていて、
ChatGPTにも音声入力機能が標準で備わっていて、
あれ、裏側はまた別なサービスが動いてるっぽいんですけども、
自分で喋った内容を音声でガーッと喋ってやると、入力欄に自動的に反映されるんですよね。
それもなかなか精度が高くて、言い間違いとかちょっとしたフィラーは削除してくれるんですよね。
ChatGPTの音声入力、そのときはこれめちゃくちゃ便利だなと思ってちょっと使ってたんですけど、
なんだかんだChatGPTを使うときにテキストをコピペしたりとかすることが多いので、
本当は時々しか使わなくなりましたね。
あと、NOTAっていうAI議事録ツールがあって、アプリもまあまあ精度が高くて、
録音ボタンをポチッと押すと自分が喋った内容を議事録のドキュメントとして残してくれるんですよね。
テキストとして残るので、後で自分で見返したりとか、それをNotionに連携する機能があるので、
Notionにドキュメントを写したりっていうのも時々やったりします。
特にブログを書くときは、こういう記事を書きたいっていうのをガーッと喋って、
それをNotionに送って、ちょっと文章を手直して公開するっていうのをよくやってました。
Typelessの紹介と利便性
最近、Typlessっていうアプリを知って、これがめちゃくちゃ便利なんですよね。
PC版とアプリ版、両方あるんですけども、
特にモバイルのアプリ版がめちゃくちゃ便利で、キーボードの切り替えにできるんですよね。
普段、キーボードってOSの標準のキーボードを表示するかなと思うんですけども、
そのキーボードを切り替えするときにマイクで喋れるUIが出てくるんですよね。
それでマイクで喋ると、喋った内容をそのアプリ上でテキストとしてドーンと追加ができるんですよね。
これのいいところは、アプリに依存しないっていうところかなと思っていて、
NotaとかChatGPTってそのアプリ上でしか入力できないんですけども、
Typlessのいいところは、いろんなアプリで音声入力ができちゃうんですよね。
音声入力が対応しないアプリでも何でも使えちゃうので、
メモアプリとかChatGPT自体にも使えますし、
あと僕が最近やってるジャーナリングのアプリでもよく使っていたりします。
なので、いろんなアプリに使えるっていうところがめちゃくちゃ便利かなというふうに思ってます。
Slackの変身とかNotionとか、もう何でもTyplessのアプリで音声入力ができるので、
めちゃくちゃ便利かなというふうに思っています。
PCはアプリを常駐するような形で、キーボードでショートカットを呼び出して、
マイクで喋るような小さいUIが出てくるんですけども、
そこで喋った内容がキーボードがフォーカスしている場所に入力される形なんですよね。
PCもアプリに依存せずに、いろんなアプリに音声入力が使えるというところがめちゃくちゃ便利かなというふうに思ってます。
あとこれ便利なのが、音声入力を喋った内容そのまま出すじゃなくて、
ちょっとAIが整えてくれるんですよね。
さっき話した言い間違いとかフィラーとかはもちろん整えてくれるんですけども、
それ以外にもちょっとこの文章の構成こうだったらいいんじゃないかとか、
ちょっと日本語として変な部分とかっていうのもいい感じにしてくれるんですよね。
これはちょっと1回やってみないとちょっと伝わらないかなというふうに思ってるんですけども、
自分が喋った言葉がすごい整った言葉に変えてくれるって感じです。
なので常にライターの人が隣にいるような感じにちょっと近いかなと思ってます。
自分が喋ったことがそのまま出るわけじゃなくて、ちょっと整った文章が出てくるというところがタイプレスの特徴かなと思ってます。
Typelessのデメリットと編集機能
ただこれデメリットでもあるかなと思ってて、
自分のちょっとした荒削りの言葉をそのまま出したいというときは、
タイプレスはちょっと合わないかなっていうところはありますね。
本当に整った文章が出てくるので、ビジネスでは使えるかもしれないけど、
ブログでちょっと自分の味を出したい時っていうところはそのままじゃあちょっと使いづらいかなと思ってます。
ただテキストのトーンというのも変えることができるので、
ちょっと手間ではあるかもしれないですけど、
1回音声入力をした後にそのテキストに対してちょっと柔らかいフラットな感じにしてとかってやると書き換えてくれたりします。
書き換え機能で言うと、ここの部分を過剰書きに整理してってやったりすると過剰書きにしてくれたりするので、
なのでテキスト編集ツールとしてもタイプレスって使えるかなというふうに思ってます。
あとはPC版だと簡単な質問検索っていうのができて、
今日の天気どうとか花粉の状況どうとか聞くと、
その検索結果の画面がポップアップで出て表示してくれるんですよね。
なので本当に使いようによってはいろいろできるかなというふうに思ってます。
Typelessの料金プランと今後の展望
これ無料プランでも結構使えて、僕はまだ無料プランなんですけども、
1週間にだいたい20分ぐらい喋れる計算になるっぽくて、
20分喋るってガッツリ使うと多分なくなっちゃうかなと思うんですけども、
ちょっと仕事の小紛れに使う程度であれば使えるかなというふうに思ってますね。
ブログを週1本書くぐらいであれば全然使えるかなというふうに思ってます。
とりあえずちょっと無料プランで使い続けてみようかなというふうに思ってます。
音声入力が仕事とUIに与える影響
それで音声入力がこうやってめちゃくちゃ便利になってきているので、
ちょっと僕らの仕事もちょっとずつ変わってくるんじゃないかなというふうに思っていて、
昔だったらキーボードのタイピングできて当たり前だったかなというふうに思っているんですけども、
音声入力当たり前になってきたら、別にキーボードを完全に覚えなくてもいいかなと思うんですよね。
自分の子供にキーボードのタイピングを教えたりすると、
改めてキーボードの入力ってめちゃくちゃ難しいなと思っているんですよね。
なんでこの配置なのかっていうのもよくわかんないですし、
本当に慣れるまでって体で覚えさせるしかないんじゃないかなと思ってるんですよね。
僕自身はもうキーボードを何十年もやってるんで慣れてますけども、
やっぱり新しく覚えるハードルってめちゃくちゃ高いので、
本当にキーボードって人間に作られたようなUIじゃないかなというふうに思っているので、
音声入力の方がやっぱり自然にできるかなというのが一個あるかなと思っています。
音声入力の課題と今後の考察
ただデメリットで言うと音声入力って場所を選ぶかなと思ってて、
うるさい環境だったりとかオフィスとか、
あと周りに家族がいたりするとしゃべりづらいかなというふうに思っているので、
そういった時はまたキーボードって生きてくるかなというのは思ってたりします。
あとUIデザインもちょっと変わってくるかなと思ってて、
今のUIってテキストを入力する前提で作られたことが多いと思うんですよね。
ブログだったりとかいろんなツールでテキストを入力する欄があると思うんですけど、
本当あれってキーボード入力前提のUIかなと思っています。
ただ音声入力が当たり前になってくると、
音声入力するUIに特化していて、
キーボードはサブ的な扱いっていうのも、
もしかしたら今後あり得るんじゃないかなというふうに思っています。
いろんな情報を音声でしゃべるような形にして、
どんどん画面を進んでいくっていうのも、
近い将来来るんじゃないかなっていうのはちょっと思ったりしました。
ということで、
今日はAI音声入力が熱い、仕事はどう変わるというテーマで話しました。
もうちょっとしゃべりたいなという気持ちがあったんですが、
今のTypeLessを使いこなしてから、
もう1回ぐらいPodcastでしゃべってみようかなと思っています。
まだやり始めて2,3週間ぐらいなので、
やればやるほど音声入力ってもっと気づきだったりとか、
僕らの仕事にどう変わってくるかってちょっと見えてくるかなと思っていたりします。
そうだな、キーボード入力する時と音声入力って、
たぶん使う仕事ってちょっと違うんじゃないかなって思ってて、
この辺ちょっと次回またPodcastで言語化していこうかなって思いました。
音声入力の生産性と番組紹介
ちょっと本当に音声入力めちゃくちゃ便利なので、
ぜひ皆さん使ってみてください。
そうだちょっと本題で言い忘れたんですけど、
キーボード入力するより音声入力する方が、
統計的に4倍ぐらい早く入力できるみたいなので、
めちゃくちゃ生産性は上がるかなというふうに思っています。
なのでちょっと引き続き僕も音声入力使いこなしていけるように
頑張っていこうかなというふうに思っています。
このPodcastはAIやWeb3、キャリアについて、
まだまとまっていない考えをそのままラフアウトして話す番組です。
毎週水曜日の朝6時に配信しています。
よかったら番組をフォローしてもらえると嬉しいです。
それじゃあまた。