00:18
はい、シゴクリラジオ大橋です。よろしくお願いいたします。 このシゴクリラジオは、パーソナリティである私、仕事クリエイター大橋が、仕事づくりに関して話をしていく番組となっています。よろしくお願いします。
ちょっと巻き気味になりますが、今回はAIというよりも音声入力ですかね。AIの話にも重なりますが、ある会社と言ってもPFUですが、キーボードですね。プログラマー向けのキーボードを出したと。
そういうニュースがありました。それ自体はそうなんだというぐらいなんですけど、プログラマーの人が今後キーボードを叩くのかということを素朴な疑問として思いまして、要はAIがコーディングをしていくということが多くなっていくと、
単純にAIへの指示がキーボードから打つというふうに変わってきます。コーディングをする時間よりもキーボードでAIに指示をする時間が長くなっていく。もしくはキーボードを打つということはAIの指示が長くなっていく。
AIの指示に対してになりますよね。コーディングというのはプログラムを書くことですね。って思ったんですよ。だからキーボードがいらなくなるとはもちろん思わないんですが、もしくはだんだんと少なくなっていってキーボード自体も売れなくなっていくんじゃないか。
もしくは展示ですね。音声入力ってね、ここでもたまに話題にしますけど、リスナーのあなたはですね、使ってますか?音声入力やってますか?しゃべってね。スマホとかがやりやすいですけど、PCでもマイクがあればできると思います。
そこから入力して文字起こし、もしくはそれをAIの指示とするというような話ですけど、使われている方もいるんじゃないか。だけど体感では結構少ないんじゃないかなって思ったりします。使ってたらすみません。いや、むしろ教えてほしいです。
今回は音声入力で見かけた記事、その記事は紹介はしないんですが、観点としてどうなんだろうと思うことがありました。
今回は音声入力とキーボードを叩く、書くですね。打つでもいいんですけど、違いについて少しだけさらっと短めに話していきたいと思います。今回もどうぞよろしくお願いします。
03:13
はい、シゴクリーダージョー大橋です。よろしくお願いします。若干巻き気味な感じでいきたいと思います。今回のテーマは音声入力と打ち込むこと。つまり話し言葉と書き言葉に近いかもしれないですかね。厳密には違うかもしれませんが。
話すということは音声を発している、それを入力する、いわゆるマイク等にしゃべる、もしくはスマホとかに話しかけるというような感じです。はい、話し言葉。一方ですね、打つ言葉、書き言葉、ここでも何度も扱っていますが文章を書くということがあります。書き言葉だとなるかなと思います。
だから、話すときだとフィラーと言いますか、僕は結構言っています。えーとかあーとか、そうですねーみたいなやつとか、そういうフィラーと言われているもの、行き継ぎ的なね、考えたりするときのものとかが入っちゃうじゃないですか。そうですねーみたいなね、うーんとかね。
そういうのって書き言葉には入らないですね。入らないというよりもセリフだったらいいですけど、スマホで私は話しましたみたいな、書き言葉を書いたら、文章、ごめんなさい、それを話し言葉でいくとスマホで話しかけたんだよねとかね。
だいぶ違いますよね。だから口調が変わるというのもありますし、伝え方も変わるし、だいぶ違うんですよね。似てはないな。だいぶ違ってくるんですよね。話すということは誰かに向けて喋っているということはありますから、この一人ポッドキャストだとだいぶ違ってくるんですが、ただこの話している言葉はリスナーの方が受けているということを信じて、実際は一人言ですが、それを信じてやっています。
話し言葉、キーボードですね。キーボードがどうなっていくかちょっとわからないんですが、キーボードが売れなくなっていくんじゃないかなということを素朴に思ったというのが冒頭で話した通りです。
プログラマーというところを一旦取り上げると、AIでコーディングする場合、話している人ももしかしたらいらっしゃるかもしれないですけど、自宅とか周りに人がいないとかという状況じゃないと、もしくはすごい固執を与えられているとかね。
06:07
あと、しゃべっても問題ない、もしくは周りの声が入らないようなものでないと、そのAIに対して何々、ここがこうじゃなくてここだよみたいなコーディング、もしくは設計とかわかりませんけど、そういうのを指示できないじゃないですか。しゃべれないから。
だから書いている人の方が圧倒的に多いんじゃないかなと思っているんですね。これが違っているかもしれないです。
ただ、今回お話ししたいところでは、話すと書くってやっぱり違うなって僕は思っていまして、話すときに話していって思考の整理ですよね。
自分は何を伝えたいんですかね、みたいなことを整理するのって、話す目の壁打ちってあるんですけど、ありそうですけど、雑談したりね。
自分こういうことを考えているんだなということに気づいてあるんですけど、そうやって相手とのやり取りで気づくことであって、自分で独り言でしゃべっていって、まさにこのひとりポッドキャストみたいにしゃべっていって、
私は僕は音声入力をあまりしていないんだなって気づくということをリアルタイムでやっていくのって相当負荷がかかるんじゃないかなって思ったんです。
だから1点目の論点としては、音声入力、要は話して客観視、もしくはメタ認知でもいいんですよね。
自分話してて違いますとか、こうじゃないですっていうふうに、僕もやりますけど、話した後に気づくし、それを回収していくのって結構大変で、
あと聞いている人はもっと大変で、入れ子になるんですよ。入れ子っていうのはプログラムとかにもあるんですけど、Aという処理が走っていってBという処理が走って、その中でさらにCが走って、
じゃあCが終わってBが終わってAが終わるみたいな順番ですよね。
だから何か会話というか、聞いている方が言った時に、僕のこのポッドキャストは脱線がたまりしますので、一応メイン路線はあったとしても、
そのサブ、さらにそのサブサブみたいな感じで、どんどんフックとか違う方向に流れていった時に、最後のメインの方に戻ってこないと、この人何言ってんだっていうことになるじゃないですか。
だから戻ってこれるようにしつつ、メインの主流のところから外れずに一応戻ってこようとするというのがあるわけですよね。
でもそれがたくさんになっていくと、どこまで行くんだろうみたいな風になって、迷子とは言いませんが、聞き手を置いてけぼりにしてしまいがちになると。
その話すということについて、話しながら思考整理したり考えるということができるというような話を見かけたんですけど、
どうだろうなーって、もちろん得意不得意とかあったりすると思うんですけど、話しながらまとめると結構難しいよな。
09:06
僕が想定できるところでは、話をして何度も繰り返してこうだこうだっていうふうに、脳内のワーキングメモリーもしくはエピソードみたいなのをいっぱい作って定着させていくぐらいだから、結構時間かかるんじゃないかなと思ったりします。
だからそういう意味では書き言葉の方が有利というか、僕にとっては優れてるんじゃないかなと思います。
そんなに覚えてられないっていうね。書いて整理してみようみたいな方がいいんじゃないかなと思ったりするわけです。
という意味で、だいたいしないというかやっぱり違うんじゃないかなって思うわけですね。
例えば話してて、自分の考えたことをまとめるみたいなのも、別にそれがダメってわけじゃないですよ。やるなってことじゃないんですけど、
自分で書きながらこういうことを考えます、書きましたっていうのとは、やっぱり似て非なるものじゃないかなっていうのが一つ目の論点というか話でした。
なので、自分の考えっていうのを話で伝える、話して伝える、言葉で伝えるっていうのがやりやすいですか?
リスナーの方は問いかけてますね。やりやすいですか?それでも書いて伝える方がやりやすいですか?
話した方がいいっていうのはわからないんでもないんですけど、それは自分の考えや思考を伝えられるかっていうところでいくと、
相手がコミュニケーションで補ってくれてるからできるっていうのもありますよね。一旦そこの相手の補助はない状態での話をします。
つまり、自力で自分で一旦何もないところで相手の補助ないしサポートないところで伝えるって時にどうかなって話なんですよね。
書かないと何を考えてたりどういうものが要素があるかわからないんだったりするんで、ごちゃごちゃになるんじゃないかなって思ったりします。
だから故に何度も何度も考えて話してそれを繰り返せばできるんですけど、それはやっぱり時間がかかるよなっていうような意味で若干違和感があると。
そうですね。だから書くっていう方が書き言葉の方が書いて考える方が思考っていう意味では整理できるし深められるんじゃないかっていう感じはします。
例えば用意どんって言って話して整理する、書いて整理するっていうのがあった時に、僕はですよ、あくまで僕は書いて整理する方が圧倒的に早いんじゃないかなって思うんですね。
この時に喋る文字、喋る数って言ったらワード、単語の数とかは圧倒的に喋る方が多いはずなんですよ。
僕だったら一文で100文字とかが書けるんですけど、4倍はないのかな。2倍3倍は絶対話せるはずなんで喋ってる。
12:06
でも冗長なわけですよ。だから無駄がいっぱいある。ということでどっちがいいのかなっていうのは正直わからなくて、量で言うと。
話す量が多いからすごい重要なことがあるとは限らないじゃないですか。
手前味噌じゃないですね。これは手前醸油?よくわかんないですけど、例えば40分ぐらい喋ってる時もあるわけですよ。
今回長いなとか短いなとか思う方いらっしゃるかもしれませんが、40分の回と、今回もう12分経ってるんで終わっていくんですけど、
別にリスナーが聞いてる方にとっていいかどうかっていう、ある人だけであって、長ければ面白いわけでもないし、短ければつまんないわけでもない。
短かったら面白いわけでもないし、長かったら面白いわけでもない。よくわかんなくなってきましたけど、要は長さ関係ないじゃないですか。
その内容をどう伝えるかっていう話になってくるんで、話す量が多いから文字量が多い、データが多いからいいものができるっていうのはちょっと違うなーみたいなことも思ったんですね。
この辺りはまた話題にしていくかなと思います。
なので直接的にマイク使って話してそれを入力するっていうのは確かに楽っぽいしいいような気がするんですけど、
やっぱり書くのと構造が違うのと、慣れたら違ってくるのかなとか思ったりするんですけど、実際に環境としてそれを喋ってまとめられるっていう環境が、
車で移動するとか、あと一人時間が長いとか、周りに人がいないような状況があってそれが使えるという人じゃないと、でもそれってなかなかないんじゃないかなと思うんですよね。
職場とかお勤めの方とかが大勢だと思うんですが、そこでブツブツ喋って入力できるのかっていうと多分あんまり良くないですよね。
あと入力環境が整ってないような気がします。分かんないです。
っていう意味で物理的にやっぱり音声入力ってまだまだしづらいのと、したところで整理はまた別というふうになりますから、結局入力したところでAIが良し悪にまとめてくれても、
それ本当かいなっていうのと、ハルシネーションとかもありますし整理しなきゃいけないんで、あと話し言葉だから違うんですよね。
だから僕自身も話したやつをまとめるとかは、ようやくとか一時期やってたんですけど、なんか言ってることがちょっと冗長だったりとか端的じゃないなみたいな時に書き言葉の方が有用な気がするなぁと思いました。
抽象化できるというかね。ちょっとなくなりそうなんでこの辺りにしたいと思います。
15:03
次ですね、その話し言葉と書き言葉の違いみたいなもの。特に思考において。だからAI使うっていう時もそうですけど、
何が違うかあるか考えるきっかけで何か考えてみると面白いかもしれません。
今回は以上となります。四国理ラジオ大橋でした。ここまでお聞きいただきましてありがとうございました。以上失礼いたします。