2025-05-28 24:03

#030 音声入力の進化がもたらす圧倒的な効率化とAIとの向き合い方

今回のエピソードでは、音声入力の技術の進化とその影響について掘り下げます。最近の音声入力の精度向上に驚いた二人が、実際の使用体験をもとに、音声入力がどのように日常業務を効率化するのかを語ります。また、音声入力を活用することで得られるメリットや、今後の活用方法についても考察します。特に、AIとの相互作用や、音声入力を使ったコミュニケーションの新たな可能性についても触れます。


▼話したこと

- 音声入力技術の現状と進化

- 実際の使用体験から見る音声入力の利便性

- AIとの連携による業務効率化の可能性

- 音声入力を活用した新しいコミュニケーションスタイル

- 今後の音声入力の展望


▼ホスト

山田(株式会社オトバンク、スタジオオトバンク)

富山(株式会社オトバンク、ポッドキャスト事業PitPa)


▼SNSハッシュタグ

#うりなる


▼メッセージフォーム

番組への感想や質問、リクエストの他、ポッドキャストに関するご相談は下記フォームよりお問い合わせください。

https://bit.ly/3BNM3Rp


▼制作

PitPa(株式会社オトバンク)


▼キーワード

音声入力, AI, 効率化, コミュニケーション, テクノロジー, マーケティング

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

サマリー

音声入力技術の進化により、効率的なコミュニケーションが可能となり、特にビジネスにおいて大きな影響を与えています。本エピソードでは、音声入力の正確性やAIとの連携についての実体験を共有し、作業の効率化がどう進んでいるのかを探ります。音声入力技術の進化がもたらす効率性の向上とAIとの新たな関係について考察されます。特に、スマートフォンやパソコンを用いた音声入力の利用状況と、その文化的影響が探られます。音声入力の進化により、従来の作業が楽になり、AIとの新たな関係性が築かれつつあるとされています。番組内では音声入力の利便性や効率化の可能性について議論が交わされます。

音声入力の進化
で、売上になるんですか。今回のテーマは、先週僕のリクエストで、音声入力についてというね。
いや、急遽ですみません、ほんと。
いや、ここまで反応がいいか、反応がいいと思わなかったんで。
気になりますからね、やっぱ。どうなってるんだっていうところで。
先週話したので言うと、最近音声入力劇的に向上してて、タイピングしてないよって話したら、
山田さんが思った以上に食いついてきたんだよ。
とんでもない食って。
食って。
釣れましたからね。
ということで、今回は音声入力の話でございます。よろしくお願いします。
みなさんこんにちは。株式会社オトバンク、スタジオオトバンクチーム山田です。
みなさんこんにちは。株式会社オトバンク、ポッドキャスト事業ピタパナ富山です。
この番組は、音声を含めたマーケティング全般の話題、ニュース、音声コンテンツの制作などについて、広く、緩く話していく番組でございます。
ということで、気になる音声入力でございますけど、これパソコンですか?
パソコンですね。スマホも最近全然音声入力派になってきた感じですね。PCだとほとんどのPCもマイクついてるかなと思いますし、しゃべってっていうところで。
で、Windows、僕メインはWindowsで使ってるんですけども、WindowsだとWindows11になってから音声入力がデフォルトについてきて、ショートカットキーでWindowsキーとHっていうのを押すと音声入力がパッと立ち上がるっていうのはありますし、
Macだとデフォルトで言うとファンクションキー、これを2回押すとマイクが立ち上がって音声入力できますっていうのがあったり、Macはその辺ショートカットキーカスタマイズできるっぽいんですよね。
これってぶっちゃけ正確ですか?
かなり正確。もうびっくりするぐらい。結構長い分もいけるんですよ。
え?
5、6行?1行に30文字としても100文字、200文字ぐらい全然普通に書いてくれますね。
へえ、すご。
昔とかだと漢字変換とかすごい適当だったり。
ですよね。僕もそのイメージです。
逆にこれ長文で話すと、その全体の構成っていうか何を話そうとしてるのかっていうのを汲み取ってくれて、じゃあここで言ってるこの言葉はこの漢字だなっていうのをすごい正確に変換してくれるんですよ。
すごくないですか。
いや、そうなんですよ。
ここまで来たか。
ここまで来ました。
で、かつ結構噛んだり言い間違えたりするのって普通あるじゃないですか。
あります。
長文で話してるとそれも含めて、この人ここ噛んだな、ここカットだなっていうのも含めて書いてくれる。
頭良くないですか、それめっちゃ。
いや多分この1、2年のチャットGPT含めた生成AIの変化によって音声入力の性能がすっごい上がってますよ。
実用的な使い方
尋常じゃない進化ですね。
尋常じゃない進化です。
なるほど。
それ例えば、俺話聞きながら思ったんですけど、例えばチャットGPTの入力画面のところでワーって音声入力で喋って、この文章をメールでいけるように添削よろしく、勝ちで、もういいですよね。
全然それでいけますね。
恐ろしい。
Gメール使ってる人だとジェブニーがそれやってくれるんで。
そっか。
うん。
じゃあもうあの文面のところで喋ってジェブニーよろしくってやれば。
ぺぺぺぺーって音を直して。
えー。
飛躍的にスピード上がりそうですね。
飛躍的にスピード上がりましたね。
それいつ頃から飛び回しになってるんですか?
僕ここ2、3ヶ月ですかね。
じゃあ。
え?
言ってくださいよ。
いや、僕もね、あの本当に慣れるまであんまり人に言うのどうかなと思ったんで。
そっか。
ちょっと半信半疑というか。
そうですそうです。
どうなんだろうを確かめた2、3ヶ月で、ついにその刀を抜く時が来たんですね。
確信に変わりましたね、これ。
はー。そっか、でもそれって2、3ヶ月のうちに、ある意味アップデートじゃないですけど、より良くなっていってる感じもあるって感覚ですか?
その辺もそうですね、ここ2、3ヶ月もしかしたらそんな変わってないかもしれないですけれども、全然実用に足るなっていうその癖って言いますか。
はー、なるほど。
長文にすればするほど良い文章というか、変換がうまくいくとかっていうのも、2、3ヶ月やってて見つけた発見だったし。
なるほどな。それすごいな。
なんか、僕、中国の友人がいて。
はいはいはい。
その中国の友人は、ずっとLINEみたいな、いわゆる通信系のアプリ。
Weiboとか。
とかですかね。で、全部音声でガイドレッシャーしたんですよ。
はいはいはい。
テキストにもしないっていうのを見てて、そんなにしてるの?つったらこれでいけんじゃん?つって、録音してもボイスメッセージ送るんですよ。
で、こうやって聞いてやってて。
はいはいはい。
これは文化の違いなんかなって最初は思ってたんですけど、確かにそっちの方が早いよなっていう。
いや、効率的だなと思いましたね。
そうですよね。変な話にニュアンスも伝わるから、音声直覧だろうなと思いつつ、ただ今回に関してはそれをテキスト化するっていうのは別の話じゃないですか。
うんうんうん。
とはいえ、言いたいことは一旦全部出せますもんね。
あ、そうそうそう。そうなんですよ。
確かにな、なんか先週僕ちょっとラスト触れたんですけど、やっぱりこの口語の思考と、いわゆるキーボードを打つ時の思考って、なんか脳違いますよね。
あ、ちょっと違いますね。なんかその敬語だったりの使い方だったりとか、相手をおもんばかるって言ったですかね。
ですよね。
言葉使いはやっぱ違うので、音声入力はどちらかというと文語?各言葉で入力するっていうのがあるので、ちょっと慣れるまで口がついていかないっていうところ。
あ、なるほどなるほど。
そっかそっか、確かに。でもなんかそっちの方が伝えたいことはシンプルに出てきそうな気がしますね。
そうそうそうですね。
で、それをある意味AIに任して、これうまくちょっと構成し直しくないとか言うと、メールの文明作っておられると思うと、結構そこに時間かけてた節が自分はあったんですよ。
あーなるほどなるほど。
この文章でいいんだっけかとか、この伝え方どうなんだっけかっていうので止まって、いかいか入れ替えなきゃとか、全部あったんですけど、今聞きながら、あ、それ発明じゃんと思って。
こういうの伝えたい、うまい感じで伝えてって言うことですもんね。
そうそうそうそう。でも発してる言葉はどちらかというとそのままの通りには出てきちゃうっていうところがあるんで。
ただ、これうちの会社の代表の上田さんとかも言ってたんですけれども、
はい。
メール書くときとかスラッグ書くときって、いきなり言葉パチパチ打ってるっていうよりは、実は頭の中で音声として発信してそれを打ってるっていう脳の思考回路があるらしいんで。
ほーなるほど。脳内喋ってるって感覚なんですかね。
そうですね。音声的な言葉で出してそれをキーボードに打ち込んでるっていうのがあるんで。
あーそういうことか。
この回路順番だけで考えても、一個そこが飛ばせるっていうか。
ですよね。
コミュニケーションの変化
うん。なので非常に効率的ではあるとは思うんですよね。
すごいな。やっぱそれって皆さん実感として、コストというか、減ってます?削減できてます?
3分の1ぐらいだったよね。
マジ!?やばいっつってそれ。
いやだから、メールとか書くときって、いつもそうやってます。オトバンクの富山です。
ご返信ありがとうございますから始まるじゃないですか。
で、疲れるじゃないですか。そんなの1日に。
いやそうです。軽症になっちゃいますよ。
もうこれパワーッと喋ってるだけでパパワーッて作られちゃうんで。楽しくてしょうがない。今。
体幹3分の1っすよね。だから。
体幹3分の1っすね。
それって相当3分の1っすよね。だからわかります?このストレスというか、自分が打たなくていいってことがどれだけ楽なのかっていうか。
あとそうですね。それについて返信が早くなりましたね。何かに対する。
あーなるほど。わー喋って。
スラックとかで質問が来るじゃないですか。で、自分としては回答は頭の中にこれ回答したいっていうのがあるけれど。
はい。
ちょっと今キーボード持ってないし、スマホで打っていくのめんどくさいし。
うわ、わかります。
あるじゃないですか。
あります。
それの時にパーッと喋っちゃうと多分3分の1でかけちゃうんで。
確かに。
今返信しちゃおうっていう気になるっすね。
あー確かに。それめっちゃありますね。なんかめんどくせえなっていう。パソコン持って冷静な問題ってありますよね。
そうそうそうそう。
なんかこの話iPhoneじゃなーっていう時にバーッと喋るんですね。
音声入力の便利さ
スマホに向かって喋ってもいいですし、PCで空いてたらそこに向かって喋るでもいいですし。
いやスマホめっちゃ便利かもしれないですね。そう思うと。
スマホもそうですね。劇的に改善してますね。
やっぱりマイクいいし、入ってくれるしですよね。
これやっぱなんかパソコン、キーボード、カタカタ人生の長さに応じて変えづらいなって思う瞬間はある気もしますね。
あーそうそうそう。
意向に手間取りそう。
前まではでも2、3年前まではやっぱりそれでも長文だと途中で切れちゃうし、
変換もいまいちだったし、言い間違いは言い間違いでそのまま書かれちゃうしとかっていうので、
それを書き直す手間が大変なんで、なんか二度手間になっちゃうんだったらもう書くわっていう話だったんですけど。
なるほど。確かに僕もそのイメージでした。入れてなんかバックスペース押してとかやって、
変換し直してみたいなことが、すいません皆さん2025年現在もうそういう次元でありませんよと。
そうです。
これ耳寄り情報すぎるな。
いやすごいっすね。でもなんかそれって実はそうなってたみたいなことを、
なんか派手にというかこうなりましたよっていうタイミングってあんまないっすよね。
そうですね。だからあんままだそこ使ってる人っていないなっていう気はありますね。
文化的な変化
まだその日本人人の前でこうプライベートな話をベラベラするっていうのって、
なかなか文化的に馴染んでないっていうのもあるのかもしれないですけど。
ああそうか。海外だともっとあるんだろうなきっと。
多分そうだと思いますね。
そういうことですよね。さっきの中国の方の使い方と同じように。
それが当たり前であるっていうところとそれが当たり前になっている。
いやこれ確か外じゃ難しい気もするんですけど。
と思うんですけど。
家で働いてたら絶対しますね。
そう僕も家がメインだったんですけど。
あれ。
こう。やっぱ楽じゃないですか。
ははははは。
これ。
ははははは。
なるほど。
一回にやっぱ人間楽を覚えるってダメっすよね。
ああなるほど。
外でも恥ずかしくてもいいや。ちょっと聞かれてもいいや。
そっか。まあそれこそ機密な内容じゃなければ。
なければ。
了解しましたとかこうしといてねとかの話はできるようになってことですよね。
もう会社のデスクでもそのパターンになりつつ。
ああってことは富山さんはなんかすごい。
しゃべってるなみたいな。
誰に話しかけてるのみたいな。
ああでもこれリモートがあるからリモートかみたいな納得もできますもんね。
そうそうそうですよね。
変な話。
の割にはだいぶ固い口調だなみたいな。
ははははは。
確かに。
ご確認ありがとうございますみたいなことが。
ありがとうございますみたいな感じですよ。
あれみたいな。
なんか復唱してるぞみたいな。
確かに。
でもそうなってくると今後全部四方八方しゃべり始めたらとんでもないことになりますよね。
いやまあまあそうそうそうですよね。だから。
みんなあのオペレーターみたいな感じになってくるかもしんないですけどね。
なってくるかもしんないですね。
こう二刀流でしながらカタカタってしながら入れて。
でも確かにとんでもないスピードになりそう。
全然変わるなそれ。
全然変わりますね。
そうですよね。
まあなんか例えばポッドキャスト作っていく中でもなんかやっぱりあの喋りながら考える。
まあミーティングとかあるじゃないですか例えば。
その時にこの要請でほしいなとか。
なんかなんて言っていいですかね。議事録の取り方も変わりそうだなって思いました。
そうですね。なんかうちの会社だと議事録を取るような形で喋るスピードと書くスピードが同じぐらいでなんかやってる人とかもいるかなと思うんですけど。
もうぜひ全部音声入力に変えたら。
確かに最近あれですもんね。
もうリモートの打ち合わせとか全部文字起こしの。
そうですね。
入れてますもんね。
要約もしてくれるし。
そうそうそうそうそう。
確かにその時なんで気づかなかったんだろう。
もう音声入力になってるじゃんって。
いいじゃんっていう。
本当だ。しかも結構そのいわゆる音声入力だからゆっくり喋らなきゃのペースではないテンポで喋ってるし。
その結果結構正確に打ってくれてますよね。
打ってくれてますね。
こっからもっと良くなるってことですよね。
そうそう。
おそらく。
それで言うと、僕も自分で入力ずっとしているんですけども、多分学習されてるんですかね。パーソナリティ。
富山さんの癖とかスピードとか分かってきて、おそらくこの音だったらこの音だなみたいな。
はい。
ポッドキャストとかの話結構よくしてるんで、ちょっと僕がポッドキャストっていうのは聞き取りづらいやつだと、数ヶ月前始めたところだと結構ポッドキャストって変換してくれなくてホットなんとかってなってたりとかっていうのがあったんですけど、
最近はこいつやっぱポッドキャストの話してるやつだなって思われて。
なるほど。
大体ちょっと詰まってもポッドキャストに変換してくれるようになったっすね。
そっか。品質単語だなってことですもんね、あっちは。
そうそうそうそう。
それをこのパソコンとか学習していってってことですよね。
そうそう。
なのかなっていうのはなんとなく感じますね。
いろいろやっぱりAIは相棒というか基盤の部下になっていくというか秘書というかうまくいないっすよ。
なんかこれやっぱ使えた方がいいっすね。
いやー、そうですね。
もっと言うと試してはいいのか。
いろいろ試して逆に自分のことをもっと知ってもらうっていうか。
そうですよね。
学習してもらうっていうのはもしかするとあるかもしれないですよね。
いや、富山さんこれおっしゃってる今の言葉パンチラインでした。
いやこっちがAIを学習するもんだっていう。
うんうん。
使い方、うまく使うことを考えるじゃないですか。
どっちかというと。
じゃなくてあっちに学習してもらうんだって意識って実はこれまでなかったんじゃないかっていう。
あー、なるほど。
そうですね。
AI側に自分を知ってもらうみたいなことって恐らくなかったと思うんですよ、あまり。
その意識でAIを使うって思うと面白いかもしれないですよね。
そうですね。
だからいろんな会話を入力していくっていうか。
普段は確かに。
クーパープレキシとかチャットGPとか機能で使ってるんですけれども、惜しみなく個人情報っていうか。
あー、自分の思考とか含めてってことですよね。
オートバンクで働いてます、住まいはリマクですみたいなところとかっていうのはもう全然。
すごいですね、今ビビるぐらい出してますよ。
出てますね。
皆さんにも。
出てる。
それぐらいはいいかなと思ってて。
理想学習してるってことですね今。
あー、なるほど。確かにそれがインプットされてればあっちはそういう人だもんなーって思って。
出してきますね。
出してきますもんね。
だからお店の検索とかしたときに、基本やっぱ東京の今自宅とか会社近くのものをお勧めするようになってきてるというのがあったりしますね。
確かに確かに。それは面白いな。
しかもある意味個人情報的な話もありつつ、さっき言ったように音声入力は手間がかからなくなることが一番大きいじゃないですか。
で、その中の品質単語とかを学習してくれるっていうことって、それ自体がこれまでは頭になかったっていうか、
いかにナレーターみたいにうまく発音してあっち側の基準をすり抜けるかみたいな、ちゃんと通過できるのかっていう方が大きかったっていうか、
なんかそれじゃないんだなって分かったことってかなり大きい気がするんですよね。
確かに。インターネット思考だと出てくる情報を自分がいかに解釈するかっていうところですけど、AIはそこインタラクティブですよね。
なんかそれかなりキーポイントなんじゃないかなって。
言われるとそうですね。
なんかやっぱね、Xとか見てても、とにかくこれはやっぱりSNSを訴求なんですけど、AI使いこなしてなかったらもう危ないみたいな危機感を煽るじゃないですか。
でも確かに言ってると分かるんだけど、これ使いこなさなきゃいけないって頭になるとどんどん難しくなっていくっていうか、
上級者じゃないとAIは使えてないんじゃないかみたいな風に思うじゃないですか。
音声入力の進化と効率化
でもこういう話聞いてると、もっと身近なもので、もっとパーソナルなもので、それで革命的な何か変化を起こすんじゃなくて、
今やってる作業が楽になる。しかも自分のことを理解してくれるようになっていく。
なんとうれしいことか。
思い出しました。昔ポストペットっていましたよね。
お手紙に届けてくれるピンクのクマとか。
あの時にこのポストペットたちが自分のことを理解してくれてたらどんだけ嬉しいんだろうっていう風に想像してたんですよ僕は。
もっとこういう風に動いてくれと。
パーソナル、もうかなりこのメール来てるよみたいなとか、これ大変なメールかもねとか言ってくれたらいいなとか思ってたんですよ。
想像ですよ。ある意味それに近いですよね。
AIたちが自分の癖も分かってくれて、今日疲れてるかもしんないから、
ポッドキャスト、ポッドキャストって言ってて、でもポッドキャストだなって思ってくれてるみたいな。
優しいんですよ。
っていう発想転換はありますよね。
なのでそんなにハードルは高くなくて、本当に向こうも寄り添ってくれる感はすごい強いですよね。
確かに。これ忘れずにいきたいですね。
これ急遽用意したテーマで、話としてもどうなってくるか分かんなかったですけど、やってよかったですね。
やってよかった。
なんかもうこの後温泉入力に切り替わる男1名増えましたから。
どんどん使ってますからね。
僕はもう温泉入力使いますね。恥ずかしげもなく。
いやーこれすごいぞ。ぜひ皆さんもね、温泉入力チャレンジしてみて。
もちろん温泉入力以外にも、いわゆるAIでできることとかって実は広がってるから、そこ試してみるのが安そうですよね。
そうですね。興味ある自分の仕事が効率化できそうなものっていうのを見つけてはちょっと試してみてとか、全然できかない。
そうですよね。快適に暮らしていくためのこれはもうあれですからね。
そうですね。
方法ですからね。
でも車みたいなものですもんね。
そうですね。だから一回ちょっといじってみて、試乗してみて。
で、たぶんこれ俺に合わないわとかちょっと難しすぎるなとかUIができてないなってあるので、そういう場合はもう全然諦めてっていうか、これは使うねっていうような。
確かに。
でもはっきり言えるのはご安心くださいと。
富山さんが何かしら試してるんで、またその2、3ヶ月後に何か多分こういう話になりますと、そん時に聞きましょうってことですよね。
そういうのもありますね。
はい。
リスナーへの呼びかけ
試してる、実験台でいろいろ頑張ってます。
これはもう売り鳴る聞く一つの価値ですからね。実験台してくれてるっていう。
はい、ということで皆さん聞いてくれてありがとうございます。
この番組は企業のマーケティング活動、企業ブランディングに携わっている方に聞いてもらいたい、そして悩んでる仲間集めたいと思ってます。
ぜひね、概要欄のお便り本部からメール送ってください。
そして、X、ハッシュタグ売り鳴る、ひらがなで売り鳴るでございます。
富山さんのアカウントにDMでも構いません。
感想、こんなこと思ったよとか質問とかあれば、ぜひぜひお待ちしております。
はい、ということで、毎週水曜更新予定でございます。
お相手は、今日から音声入力を始める株式会社オートバンク、スタジオオートバンクチーム山戸。
株式会社オートバンク、メインが音声入力になっているポッドキャスト事業機構の富山でした。
ありがとうございました。
ありがとうございました。
素晴らしい。
最近あれですね、やっぱり滑舌が良い方が入力の割合が良いので、仕事始めが今、アナウンサーみたいに、
ああ言え、わお、言おうから始めてますね。
珍しい。
冗談抜きで。
すごい。
口がやっぱあれが必要になる。
ですよね。
音声入力やろう。
ぜひぜひやってみてください。
決めました。僕ももうすぐします。
これSiriで、あ、これか。キーボード音声入力。
えーやばい。
ほんとだ。
なるほど。
これすごいわ。
確かに入力ますね。
ちょっとまだ専門用語とか、あんまり世の中にないような言葉とかだと大変化が起こったりするので、
部分とかはちょっと手直しとか必要ですけど、それを深めても全部キーボードで叩くよりは全然早いです。
全然早いですよね。ちょっともう早速やってみます。お願いします。
いやーありがとうございました。
ありがとうございました。
24:03

コメント

スクロール