1. resize.fm
  2. #163 音声UX
2023-12-15 1:05:35

#163 音声UX

「音声UX」という本を読んでLLM/MMM AI時代の音声UI・UXの考え方や、サービスの期待値調整などについて話しました。

📝ShowNote: https://resize.fm/ep/163-voice-ux

おたよりお待ちしてます💁‍♀️
おたよりフォーム(Googleフォーム): https://forms.gle/hkHbCpdTfe54MSyq9

サマリー

DeguchiさんとMotoyamaさんは、東京ドームのチケット販売で苦労した経験について話し合っています。安藤さんの本「音声UX」では、スマートスピーカーのデザインや音声UI、音声UXの考え方の変化や進化について考察されています。また、音声UIやUXの考え方の変化とAI技術の進歩による音声UIやUXへの影響、そして音声の操作方法についても考えています。この中で、言葉だけでなく、画像認識や表情読み取りなどを含めたAI技術の発展が可能性として示唆されています。さらに、ボイスユーザーインターフェースや音声EXについても考察されています。テレビのAndroidOSにGoogle Homeが搭載されたり、GPT-4などのAI技術の進歩により、音声インターフェースの重要性や期待値が高まっています。なお、GPTやSiriなどの音声会話機能では、機械的な回答よりも人間的な感じを求める傾向があり、期待値調整が重要であることが示されています。そして、日本語での音声会話機能では、聞き取りやすい日本語やフランクな話し方が好まれる傾向もあるようです。また、音声UXに関しても考えています。チャットGPTの音声会話機能やカスタム指示による応答設定など、インターフェースの進化が進んでいます。今年に登場したボイスUIに関する本の著者である近藤氏は、音声UXについて語っています。AIチャットや音声対応のカスタマーサポートなど、音声によるコミュニケーションの潜在力についても言及しています。

00:18
Takaya Deguchi
こんにちは、Deguchiです。
kudakurage
こんにちは、Motoyamaです。
resize.fmは、MotoyamaとDeguchiが最近気になっているサービスやデザイントピックスを取り上げて、のんびり話すPodcastです。よろしくお願いしまーす。
東京ドームのチケット販売
Takaya Deguchi
お願いしまーす。Motoyamaさん、例のチケット買いました。東京ドームの。
kudakurage
東京ドーム、オードリーのやつですか。
Takaya Deguchi
そうそう。
kudakurage
いやー、買えなかったね。
Takaya Deguchi
ですよね。
なんか、先行のやつ、全く当たんなかったもんね。
僕は一応、買えたは買えたんですけど、ていうか、まあそもそも、先行の抽選が4回あったんですよね。で、全部落ちて。
kudakurage
全部落ちたね。僕も全部落ちた。
Takaya Deguchi
で、昨日、昨日というか、まあ昨日か、収録日の昨日、一般販売があったんですよ、朝の午前の11時から。
kudakurage
うん。
Takaya Deguchi
で、11時に、まあ当然アクセスしたんですけど、全く繋がらず。
kudakurage
うん。
Takaya Deguchi
で、40分虚無の画面をリロードしまくりながら、し続け、そしたら、ステージ裏体感席っていう、なんかまあステージ見えませんよ、みたいな席が。
kudakurage
はいはいはい。なんかついた感じだね。
そう。そこだけはまあ唯一、買えて、まあ一応それは買ったんですけど、ていう厳しい感じでしたね。
僕もだから、もう落ちたから、一般まあ買うかなとか思ってたけど、僕はあの、そういえばと思って、その、ゲームマーケットっていうの出店してたんで、その、ちょうどその時間。
ちょうど11時、その開、開演っていうか、その、始まるんですよ、ゲームマーケットが。
はいはい。
お客さん入ってくるみたいな時間だから、もう、そんな暇なかったよね、もう。
でも、もう忘れてたし、もう、すっかり。
Takaya Deguchi
いやー。
kudakurage
そんな余裕がないみたいな。
Takaya Deguchi
忘れてていいと思いましたよ。全然。
だからもう、あれですよ。
kudakurage
あれですよ。帰ってきて、ああ、そういえば今日チケットだったなと思って見たら、まあもちろん売り切れてましたよ、もう。
うん。
Takaya Deguchi
なんかもう、まあ僕もいろいろライブとかフェスとかなんか、チケット争奪戦探したことあるけど、なんかもう、過去一厳しかったですね。
えー、あ、そう。
もうなんか、何の、何の手応えもないみたいな。
なんか、まあチケットピアだったんですけど、なんか基本なんかまあ、どんだけ争奪戦でも一回繋がるとか、なんか繋がって注文画面行くんだけど。
うん。
でも、なんかクレカ入力とかしてる間に売り切れちゃうとか、なんかこう。
kudakurage
はいはいはいはい。
Takaya Deguchi
あるじゃないですか。多少のなんていうか手応え。
kudakurage
多少のね。
うん。
はいはい。
カートには入るけどみたいなことね。
そうそうそうそうそう。
Takaya Deguchi
で、今回もちろん事前にログインしといて、もう、なんていうの、詳細ページの一歩手前ぐらいまで進めといて、みたいなことはもう当然やってるんですよ。
うん。
なんですけど、なんかどうやら、多分だけど、どういうなんかインフラ構成になってるかわかんないけど。
多分だけど、サーバーに到達する前のレイヤーで、なんか多分アクセス絞ってるんでしょうね、なんか。
うん。
で、だからまあ、そこから弾かれると、もう、なんていうの、500の画面みたいな、もうそもそも真っ白の画面にサービスアクセス集中しておりますみたいなのが出てくるだけみたいな、本当虚無の画面が出るんですよ。
っていう感じで、もうなんかもうそれ以上何も進めないみたいな感じ。
うん。
で、しかもそういう500っぽい画面だから、その。
その、果たしてチケットが本当に売り切れてるのかすらもわかんないわけですよ。
なんかこう。
はいはい。
でもまあ、で、こうTwitterとか同時で見てると、あ、もう開始2、3分で売り切れたみたいな話とか流れてきて、いやマジかと思いながらリロードし続けてたら、まあなんか一応ステージが見えない席っていう、なんか一応それが出てきて撮れはしたんですけど。
うん。
いやー、厳しいし。
うん。
だからもうちょっとなんか、このチケットペアのこの仕組みはもうちょいなんかやりようないのかなと思っちゃいましたけどね。
うん。
kudakurage
こう、せめてなんかね。
なんか、最近だとあれだもんね、なんか、なんか順番待ちみたいな感じですよね。
そうそうそう。
なんか。
まあその順番待ちがいいのかっていうのもあるかも、どう、わかんない可能性あるけど。
いやでも。
順番待ちでさ、もうなんてね、なんか500万いいですみたいなの出ちゃったらさ、あ、無理じゃんみたいな。
Takaya Deguchi
いやでもまだマシですよ、その。
まだマシかな。
なんていうの、アクセス集中しておりますっていうだけの白い画面を見せられるよりは、どれぐらい並んでるのかとか、もうすでに売り切れたのかっての分かればいいけど。
kudakurage
あーまあまあまあ。
Takaya Deguchi
わかんない。
kudakurage
売り切れたっていうのがわかればね、まだ。
Takaya Deguchi
そう、わかんないのに、40分間リロードし続けるっていうマジで無駄な時間をすごいね。
kudakurage
でもなんか順番待ちだとさ、もう500万いいだったらもう無理じゃんって、多分なるじゃん。
うん。
だけど、その順番待ちじゃなかったらさ、ワンチャンあるかもみたいなさ。
Takaya Deguchi
まあね。
kudakurage
そういうのもあるじゃん。
まあでも、なんか売り切れたかどうかは教えてほしいよね、その。
Takaya Deguchi
せめてなんか、リアルタイムじゃなくてもいい、5分遅れとかでもいいから、なんかこう、数字出すぐらいはできるでしょって思うんですけどね。
kudakurage
なんか確かさ、あのグッズも、グッズはまあピアじゃなくて、ローソンの方だったっけ。
うん。
なんかそっちで、HMVとかで販売してたと思うから、ある程度なんかさ、順番待ちみたいなのあったよね。
あったっけ。
うん。
僕も買ったんだけど。
うん。
あった気がする、確か。
Takaya Deguchi
うん。
kudakurage
だから、僕はさ、グッズは買ったんだよ。
Takaya Deguchi
はいはい。
kudakurage
グッズを買っていかないっていう、もうなんかね、変な空回りお祭り男みたいになっちゃったんだよ、今。
Takaya Deguchi
いや、なんか、うん、あんま運営のやり方もあんま良くなかったんですよね、あれは。なんていうか。
おうおうおうおう。
期待値をこう、徐々に弱火で温め続けて。
最高潮になってから落とすみたいな、なんかそういうことに結果としてなっちゃったから。
kudakurage
あー、そうね。
Takaya Deguchi
あー、なんかね、なんか、もうちょいなんかこう、なんとかならなかったのかなっていうのを思いながら、こう。
あとなんかこう、なんていうの。やっぱね、4回抽選落とされるっていうのは、なんか体験良くないっすね。
うん。
kudakurage
そうね。
うん。そう。
Takaya Deguchi
うん。うん。そう。
いや、結構ツイッターも荒れてましたね、なんか。見てたけど。
うん。
虚無の画面をリロードしながら。
kudakurage
まあ、しょうがないってしょうがないけど。
まあ、僕は最初の抽選の時に、なんかもっと小出しにせずにバンってやれよって言ったけど、それもあるんじゃない?やっぱり。
Takaya Deguchi
そうね。いや、だから結構、まあ多分、その、席がどれぐらい売れるのかっていうのが分かんないから、小出しにしてると思うんですけど。
うん。
でもこう、やっぱり、別に抽選は全然、抽選何回かやるのはいいんだけど、なんかこう、なんかこう、ロイヤリティが高い人にちゃんと渡るような、なんかね、仕組みがあるといいなと思うんですけどね。
うん。
チケットピアの問題点
Takaya Deguchi
なんかチケットピアに、なんか一応プラチナ会員みたいなのがあるんですよ。
kudakurage
あ、ありますね。
Takaya Deguchi
で、それやると抽選当たりやすくなるとか、なんか、まあ、それが今回効いてるのかどうかはよく分かんないんだけど。
うん。
でも、別にチケットピアのロイヤリティ高めてもしゃーないよなみたいな。
kudakurage
だから僕みたいにグッズも買ってさ
Takaya Deguchi
いやそうそう
kudakurage
宣伝ポスターも貼ってさ
毎回会議で宣伝してる
人間のことも考えてほしいよね
やっぱり
Takaya Deguchi
だからこういうところで
なんかこうね
NFTじゃないけど
仕組みはなんでもいいんだけど
そういうロイヤリティを示す
仕組みかつそれをもって
抽選の
NFTだとよくあるんですよそういうのって
kudakurage
ありますね
どれくらいコミットしてるかみたいなロードが残るからね
Takaya Deguchi
全部オンケーに残ってるから
そういうの加味してエアドロップするとか
なんかこう
あと抽選の仕組みも
だいたいNFTの人気のプロジェクトって
争奪戦になるからキューイングの仕組みがあって
列に並んでその列が
割とその人のロイヤリティによって
考慮されるとか
いろいろあるんですよねそういうの
なんだかんだやっぱそういうのは
公平感
公平というか妥当感あるな
っていう
結局転売も結構回ってるし
転売の
するなと言うけど仕組みで
できないように担保されるから
kudakurage
転売あるんだ
Takaya Deguchi
全然普通に
二次流通見たら並んで
転売されてましたよバリバリ
kudakurage
なんかアカウント売ってたりするみたいな感じなのかな
Takaya Deguchi
いやいや普通に
結局チケットピアとかって
発券コードみたいのが
あってその発券コードを
渡しちゃえば
kudakurage
あーそうなんだ
やっぱピアがなんか良くない
そうなんですよ仕組みが良くないんですよ
結構他のさそういう電子チケットとか
対策されてる
Takaya Deguchi
そうそうされてるやつもあるんですよね
なんかもっと厳密にやるなら
その会場入場時に
なんかこうやるとか
なんか
でも多分チケットピアはそういうのないと思うんですよね
一応チェックすると言いつつも
多分東京ドームの規模感で
それをやるの無理だと思うんで
なんかこう
アナログチェックみたいな
だからまあ全体的に仕組みが良くないな
っていうのを思いましたね
っていうなんか
チケットサービスもっと良いやつ
出てきて欲しいなと思ってしまった
kudakurage
チケットサービスね
Takaya Deguchi
まあ良いのあるんだろうけどね
使ってない
そうそう
kudakurage
使ってない
使ってない方が問題なのかもしれないですけど
どっちかっていうと
Takaya Deguchi
なんで
使ってない方が問題なのかもしれないですけど
チケットピアなんですかね
よく分かんない
kudakurage
まあまあ
なんか繋がりがある
Takaya Deguchi
まあコンビニとかでね
決済できるとかそういうことなんだろうけど
事業者的にはまあ色々メリットあるんだろうけど
ユーザー的には何も嬉しくないですよね
それで
kudakurage
だからピアは結構久しぶりだった気がする
使ったの
なんか大体最近ローソンチケットとか
Takaya Deguchi
そうね
kudakurage
あとEプラスとか
あの辺多いじゃないですか
うん
で割とその辺は
なんか転売対策ちゃんとしてる部分があったり
まあちょっとまだまだなところもあるけどもちろん
まあなんかピアよりは全然いいかなと思って使ってましたけどね
Takaya Deguchi
まだマシかなとは思いますけど
いやチケットピアそれでチケット発券料とか言って
ライブビューイングの注目度
Takaya Deguchi
謎の数百円取られるのが本当意味わかんないんだよな
kudakurage
なんか選択肢がないやつに同意させられる
Takaya Deguchi
そうそうそうそう
kudakurage
なんかもう選択肢があるように見せかけてもうそれしかないみたいななんかさ
Takaya Deguchi
発券料って何って思うんですよ
紙の印刷料ってことかって思うと
じゃあ印刷しなくていいんじゃないですかって思っちゃいますしね
kudakurage
なんかさいくつかないあれなんか
発券料となんかシステム利用料
Takaya Deguchi
あるあるあるある
kudakurage
なんかそれ
Takaya Deguchi
意味わかんないよね
kudakurage
よくわかんないなって
っていうねなんかいろいろ思ってしまいました
kudakurage
いや僕もだからもう
一応さ
まあ僕もだからチケット取れなかったから行けないんだけど
うん
なんかあの
ライブビューイング
映画館とかでなんかやるっていうやつも
なんか見て一応やるんだみたいなちょっと見たりしたんだけど
平塚ないから
Takaya Deguchi
ないんだ
音声UIの変化とスマートスピーカー時代
kudakurage
ちょっとまあ
うん平塚はなかった
から
うんもう
なんかどうしようかなみたいな
気持ちになった
Takaya Deguchi
いやあれもさ
kudakurage
グッズだけが来るみたいな感じになって
Takaya Deguchi
一般販売の後に発表されたからさ
kudakurage
なんか
Takaya Deguchi
発表される前に知りたかったんだけど
なーとかね思っちゃいますけどね
kudakurage
グッズのタイミング
どうなんだろうなーとか思ったけど
Takaya Deguchi
いやー思いますよ
なんか
めちゃめちゃラジオ聞いてるけど
まあやっぱ
抽選4回も落ちた
落ちた上だとなんか
グッズのこととかあんま聞きたくないなーとか思ってしまいますからね
っていうなんかこう
仕組みが悪いのと
期待値コントロールって難しいなと
めっちゃ思いました
kudakurage
いやー
難しいね
Takaya Deguchi
うん
まあ一応席見えない
ステージ見えない席は買ったんで
まあちょっと現地ライブビューイングとして
kudakurage
行こうかなと思ってますけどね
まあ多分一応なんか
ディスプレイというか
そういうモニターで見るみたいな感じになるんでしょうね
だから
Takaya Deguchi
音だけ
生を楽しみ
あとはライブビューイング
kudakurage
なんかなんだろう
VR空間ライブビューイングもやってくんないかな
せっかくだから
まあ別に
YouTubeとか
まあそういうのでもいいのかもしれないけど
僕はもうコメ欄と一緒に見るのとかも慣れてるんで
そういうのでもいいけど
Takaya Deguchi
まあそういう
kudakurage
せめてねなんか
そういうチケットもあってもいいんじゃないかな
Takaya Deguchi
うん
そういう楽しみ方ができればね
なんか別に
現地の劣化版じゃなくて
ちゃんとコメント欄と一緒に楽しむみたいな
こととかできるかもしれないしね
kudakurage
最近さ
なんかちょっと
違うけど
あの
あーなんていうの
アニサーの
アニソン歌手の大石正義さんって知ってる?
Takaya Deguchi
うん名前は
kudakurage
大石正義さん
まあ結構いろんなアニメに
なんかそのアニソン
あの
曲とかを書いて提供してるんですけど
大石さんも最近なんか確かに
東京ドームだったっけ
武道館だったっけな
どっちだっけな
なんかどっちか
東京ドームだったかな
をやるんですよ
どっちだっけな
2020
それもなんかね来年だった気がしたんだけど
武道館かな
Takaya Deguchi
うん
kudakurage
それも武道館チケット売るんだけど
あのー
ライブ配信チケットみたいなやつ
Takaya Deguchi
うん
kudakurage
もう売って
うん
それしかもなんかもうね
1000円で売りますみたいな
Takaya Deguchi
うん
kudakurage
まあめちゃくちゃ安いじゃないですか
Takaya Deguchi
うん
kudakurage
売ってもうみんな見に来てみたいな感じで
もう1000円なんて正直もう回収できないらしいんだけど
Takaya Deguchi
うん
kudakurage
ていうかもうねそもそもやっぱり
こう会場大きくなればなるほど
こういうライブ
Takaya Deguchi
うん
うん
うん
うん
うん
kudakurage
うん
特にその音楽系のイベントって
まあペイしないっていうかさ
っていう風になりがちだけど
もうこれを
自分にとって大切なやつだから
っていう感じでみんな見に来てほしいみたいな感じで
なんか1000円で
そういうオンライン配信みたいなやつ
みんなでコメ欄で楽しんでほしい
みたいな
やってましたけどね確か
オードリーもなんかそういう感じのやつ
やってほしいな
Takaya Deguchi
楽しみ方ありそうですよね
kudakurage
僕はだからユニフォームに
袖を通すことはないのかもしれないですね
Takaya Deguchi
買ったんだよ
kudakurage
ユニフォーム買ったよって
行くつもりだったもんだって僕は普通に
Takaya Deguchi
僕も完全に心折れてたから
いやちょっといいやと思ってた
kudakurage
普通に
ユニフォームと
Tシャツ
あとリストバンド
あるじゃん
ラスタカラーの
Takaya Deguchi
めちゃめちゃ買ってるじゃないですか
kudakurage
フル装備で
おーし行くぞって気持ちでいたから
だから
当たんなかったけど
当たんなかったけど
Takaya Deguchi
そういうの還元してほしいよね
単なる運じゃなくて
kudakurage
だからもう多分
袖を通すことはなく
引退って感じ
Takaya Deguchi
まあそれもやりすぎると
買わないとじゃあ当たんないのかってなるから
あれなんだろうけど
でもやっぱ多少は考慮してほしいよなって
うーん
kudakurage
悲しい
Takaya Deguchi
っていうね
最高のそういうチケットを
販売体験を作りたいなと思ってしまいました
kudakurage
作りましょう
最高
作る
いやでもなんか
Takaya Deguchi
うん
kudakurage
まあみんなそう思ってるんだと思う
Takaya Deguchi
いやそうそうだから単純に
kudakurage
そう思ってる人
Takaya Deguchi
ビジネスビズデブ力というか
そういうので
まあチケットペアが使われてんだろうなと
思いますけどね
kudakurage
やっぱりなんかあれなんじゃない
その
何さんだったかもう忘れちゃったけど
Takaya Deguchi
ん?
kudakurage
ノボリさん
ノボリさんでしたっけ?
Takaya Deguchi
どこの?
kudakurage
ノボリさんだっけ?
Takaya Deguchi
NTTの?
kudakurage
NTTの
Takaya Deguchi
うんうんうん
kudakurage
けしからん方式でやっぱり
そのけしからんところにあえて入っていって改革する
Takaya Deguchi
いやそうだよね
kudakurage
のが大事なんじゃない?
Takaya Deguchi
うーんそうね
kudakurage
けしからんって言ってピアーはけしからん
ピアーに入っていってけしからんところを
内部から変えていくべきなんじゃない?
Takaya Deguchi
いやマジけしからんですよあれは
kudakurage
ぜひピアーに入社してください
いやピアーよりもむしろなんかその
Takaya Deguchi
放送事業者というかそっち側のほうがおもしろそうだっただけどね
kudakurage
自 Shawn、自前で作るっていう
自前で作る
うーんまあね
それもなくはないですよね
まあでもそれだとね
その放送事業者しか救われないですからね
やっぱプラットフォーム志向で行ったら
覆いんじゃないですかそこは
Takaya Deguchi
いやでもやっぱ
そういうのセットにして考えたほうが
音声AIの進化とボイスユーザーインターフェース
Takaya Deguchi
なんかこう
いいボード出来そうじゃないですか
コンテンツもセットにして
販売体験も作った方がいいですね
たほうが まあ で そっから まあ 横転するとかね
うーん まあ ノーミーツとか すぐでやってるしね
kudakurage
うーん まあ まあ まあ そうね
まあ 期待値調整ね 期待値調整の話も ちょっと入ってくるんで 今回は
今回はね うん
ちょっと 音声UXについて 話そうかなと思って
うん まあ 音声UXっていう あの なんだっけ 安藤さん
うん
スペクトラム東京とか そういうところでも 活躍されている 活躍されてるというかね
まああの いろいろとやっている 安藤さんが書いた 音声UXっていう本があって
まあ これ 結構前 まあ 結構って言っても そんな前でもないか
2021年の1月とかに出てるんで まあ そんなめちゃくちゃ前ってわけじゃないけど
まあ ちょっと前の本で まあ 僕 結構 その発売された頃には もう買ってたんですけど
まあ
なんか ずっとそのままになってたやつを
ちょっと最近 また読んでみようかなと思って 読んだんですけど
なんで読んだかっていうと
まあ この本自体は
多分 シリとかアレクサとか ああいうスマートスピーカーが こう ワーッと普及していって
そういう音声アシスタントみたいなものが
まあ 結構 みんなに普及して それに対するまあ サービスとか
まあ そういうものの話が 結構 流れてきて
メインだと思うんだけど
結構 そっから2021年だから その1年 2年ぐらいでさ
結構 まあ 大きくガラッと変わったじゃないですか やっぱり
そのチャットGPとかの LLM AIとかの進化によって
で 多分 それによって そういう音声 UI UXの考え方
だいぶ変わってくると思っていて
Takaya Deguchi
いやー 思うよね
なんか 最近 アレクサと話してると ほんと イライラしてきますもん
kudakurage
そうそうそうそうそう
で まあ 僕自身も最近 その LLM AIとかの
使ったサービスのデザインとか
まあ そういう開発の手伝いとかもしてるし
まあ もしかしたら その音声も使ってとかっていうのも
あるかもしれないなっていうのも含めて
まあ 結構 改めて この本が役に立つ時が来るんじゃないかみたいな気がして
それもあって なんか ずっと 積読されていたかも
本棚にしまった あったのを
あ そういえば これ読んでなかったのかとか
あったなと思って
ちょっと 今の時代 改めて読んだほうがいいんじゃないかなって
ちょっと 読んだっていうような感じですね
で まあ だから 本書内 その音声 UXのこの本の中では
まあ やっぱり スマートスピーカー時代の話がメインなんで
まあある程度 なんだろう
本当は こういうふうにできたらいいけど
今はできないから こういうふうにしたほうがいいよねみたいな
その 今の もしかしたらチャットGPとかの LLMをベースにした
まあ そのね そのスマートスピーカーとか
スマートスピーカーというか AIみたいなのがあれば
もっとこうしたほうがいいよねっていう部分に
いけてないけど その場合はこうしたほうがいいっていうところで
止まってる部分って結構いっぱいあるんですけど
本の中で紹介されてるものっていうのは
まあ でも なんか ある程度のベースみたいなところは
結構 参考になる部分というか あるかなと思っていて
で これ だから 音声UI ボイスUIっていうテーマにしてないんですよね
この安藤さんも
うん
なんか そのテーマだと一生書けないんですよね
いいんじゃないかみたいなこと書いてあったんだけど
だから その もうちょっと俯瞰的な視点の音声UX
まあ 体験としてどういうふうなものにしたほうがいいのかっていう
もうちょっと俯瞰的な部分にしてあるので
まあ そういう意味でも
その ね あの LLMというか AIが進化して
スマートスピーカーの進化と音声UX
kudakurage
ボイスユーザーインターフェースみたいなものが
もうちょっと変わったとしても
ある程度 汎用的に 活用できる知見というか
知識みたいなものはあるのかなっていうふうに思って
ちょっと読んでましたね
まあ なんか特にね
その 今までのスマートスピーカーだったら
その どういう質問が来るのかっていうのを想定した上で
それに対するいくつかの想定パターンの回答を用意するみたいな感じ
まあ 昔のチャットボットみたいな感じじゃないですか
まあ でもそれが LLM AIで
ある程度 なんか想定しきれてなかったけれども
まあ なんとなく
与えられた命令とか質問に対して
うまく会話を通しながら
なんかこう 解決するような
まあ 今まで想定しなかった道筋を生み出すことっていうのも
多分 そういうAIによって可能になっていくだろうし
今も割とその LLM自体のメモリを増やして
長期記憶の部分に当てていくみたいなことを
多分 ちょっとずつやっていってると思うけど
多分 それの進化によって
多分 もうちょっと会話の中でのパーソナライズみたいな部分も
とか より多くの文脈
理解を含めた回答とか
そういうものも
どんどんできるようになってくんだろうなっていうふうに考えると
結構 スマートスピーカーの進化の仕方とか
音声UI UXの変化とAI技術
kudakurage
それに対する音声UI UXみたいなものの考え方って
かなりガラガラ変わってくんじゃないかなっていう
気はしますよね
ま あと 多分 今後 LLMじゃなくて
MMMっていうマルチモーダルモデルのAI
まあ 複数の情報を使った
その言葉だけじゃなくて
画像認識だとか
なんか いくつかのそういう情報を使ったAIっていうものも
どんどんこう 一般的になってくる可能性っていうのが
まあ 言われてると思うから
まあ それも考えていくと
もっとこう 文脈理解みたいなものがどんどん進んでいって
また そのもう一段階
音声UI UXの考え方みたいなものが
変化が多分出てくるだろうし
で まあ なんか 普通に
この今 ポッドキャストで話してるみたいに
マイクで話してるだけだとしても
なんか 怖い色みたいなところとかね
なんか 話し方とか
なんか 声の大きさとか
スピードとかっていう情報も
もしかしたら 同時に処理することによって
その うまく文脈を汲み取るみたいなことが
まあ あり得るかもしれないっていう意味で
そのMMM的な考え方みたいなものっていうのもが
結構 影響する可能性あるかなみたいな
音声による文脈理解と情報処理
Takaya Deguchi
うん
kudakurage
で まあ なんか 普通に言葉だったら
その 怒るぞって言っても
それを なんか こう 本当に怒ってる感じで
激怒してる感じで言ってるのか
それとも 笑いながら怒るぞって言ってるかって
結構 大きく違うじゃないですか やっぱり
Takaya Deguchi
まあ あと 怖い色聞き分けてほしいですよね
2人で話す こうやって2人で話してるところに
1人 ボットが入ってるとか
ミーティングにボットが参加してるとか
kudakurage
そうですね まあ 複数人の声をうまく聞き分けて
なんか うまくそれに対してこう
混じっていくというかね 会話の中に
Takaya Deguchi
パシフィケーションしてくれるとかね ボットが
kudakurage
で 怖い色のそれぞれの人が言った意見も
ちゃんとこう 記憶して聞き分けて
あなた こういうふうに言ったけど こう こう こうでみたいなとか
うまくね こう 複数人に対して対応していくとかっていうのも
まあ 全然あり得てくだろうしね
まあ なんか もしかしたら
音声以外の情報の組み合わせとAI技術の進展
kudakurage
その 声だけじゃなくて カメラとかも使って
その 表情とかも読み取る可能性もあるかもしれないしね
まあ あんまり日本人は多くないけど
その 身振り 手振りとか
もまあ あるかもしれないしね
まあ なんか 一応 なんとなく補足として
そういう そういうことを示す
なんか まあ その言葉の重要性みたいなところを示す
なんか メラビアンの法則みたいなやつがあったんで
紹介しとくと そういう まあ なんか コミュニケーション
会話とかのコミュニケーションにて
影響を与える その割合みたいなもので
まあ そういう言語とか言葉っていうのは
まあ 全体の大体7%ぐらいでしかなくて
他はもう 視覚だとか 聴覚 まあ さっきの その表情だとかの
身振り 手振りだとか あとはもう 抑揚とか
感情的な部分 聴覚の聞き取り方というか
が ほとんどだよねっていう話だから
今はそれを ほぼほぼ言語だけでやってるわけじゃないですか
やっぱり チャットGPTにしても
まあ でも その辺がもうちょっと
新しい情報 その表情だとか
声 声色だとか そういうものも含めていくと
まあ 多分 また大きく変わってくんだろうなっていう風に
思っているところですね
脱線しちゃうんですけど
なんかね 結構 最初の方に
まあ もう 最初の方って前書きぐらいのところに
その人がどう話しているのかっていう話が
ちょっとだけ書いてあったんだけど
その中に あの 人工知能第一人者の
マーヴィン・ミンスキーっていう人の
心の社会っていう本の話が出てくるんですけど
なんか 割と 僕は知らなかったんですけど
人工知能界では
なんか 割と有名な本なんですかね
まあ その中で まあ なんとなくこう
人は話す前にあんまり
全部を決めてるわけではなくて
複数の会話の可能性があったりとか
複数の会話の枝枯れがあったりとか
まあ 言葉がいくつか可能性がある中で
まあ それを話しながら
瞬時に選び 選びて 選んで話してるっていうような
ことが書いてあって
それ あんまりよく考えてなかったけど
確かにそうなのかもなって 僕も
まあ このポッドキャストでよく話してる
こう 普通にね 何か 何かについて話してるっていうときにね
のことを考えたら
あ 確かにそうなのかもっていうふうに思って
まあ 要は 今からこういう言葉を話しますっていうのを
全部を 何かこう 決めた上で話してるわけじゃないじゃないですか
やっぱり
何か これについて
何となく漠然と話そうと思いながら
そこにたどり着くための言葉を
一つ一つ並べてるっていうような感じで話してる
イメージがやっぱ強いじゃないですか
だから 僕 何かその
最初 LLMみたいなものが
出てきたときに
何でこれがうまくいってるのかっていうのについて
よく分かってなかったんだけど
結局 それって
まあ それをそもそも人間の話し方を
模倣して考えたっていう
のことなのか
僕 ちょっと詳しくないんで分かんないんですけど
まあ でも そう考えると
あんまり
こう 変わらないから
うまくいってるんだなと思って
まあ 人間の話し方を
模倣してるんだなっていうふうに
のを改めて気づいたというか それで
Takaya Deguchi
うん
kudakurage
ね なんか
この言葉の月に何が来るのかっていうのが
自然なのかっていうのを
まあ 基本 つなげているっていうような
まあ すごい簡単に言うと
そういう考え方のものなわけじゃないですか
まあ ある程度 目的というか
漠然としたゴールみたいなものを持ちつつ
まあ 言葉をつなげていくっていう
やり方でやってるわけだけど
Takaya Deguchi
うん
kudakurage
まあ でも なんか それは
が うまくいってる理由っていうのは
なんか それでよく なんか
ああ そういうことかみたいな
ちょっと気づいた部分が
Takaya Deguchi
なんか あったような気がしましたね
うん
kudakurage
だから 意外と
自分自身も
何を話そうっていうのは
もう 本当に話す直前まで
特に決めていなくて
まあ ある程度ね カンペがあって
カンペを読んでるとかっていうのもあるけど
Takaya Deguchi
うん
kudakurage
なんか まあ なんとなく
これについて話したいっていう
直近のイメージ ゴールのイメージも持ちながら
多分 それに向かうように
うまく 掘り当てるように
こう 言葉をつなげて
文章を作りながら 会話してるんだなっていうのを
Takaya Deguchi
うん
こう ハッとこう 気づかされたような気がしました
そうですね
まあ そうしないと なんか
結構 不自然になっちゃいますもんね
うん
作文みたいな
作文読み上げるみたいに
kudakurage
そうそうそう とかね
その 考えるマットが絶対必要になるもんね
その 1個文章作ってから
それを話すみたいなことにならなきゃいけないから
Takaya Deguchi
そうですね
kudakurage
自然な会話の流れっていうかね
この やりとりにならないよね
多分 きっと
Takaya Deguchi
うん
kudakurage
まあ でも だからこそ その
手におはがおかしくなっちゃう可能性あるんだけどね
その 普通に そういうふうにさ
リアルタイムにこう やろうとしてるとさ
何々にって言ったけど
あ 何々ににつながる言葉
じゃない
みたいな感じで
途中から変えたりするわけじゃないですか
やっぱり
Takaya Deguchi
うん
kudakurage
でも それは そういう理由だよね
完璧な文章を作って話してるわけじゃないから
そうなっちゃってるってことでね
きっと まあ 大体の人は
Takaya Deguchi
うん
まああとは なんか その
あ とか あの とか
そういうのは まあ 考えながら話してるから
kudakurage
うん
Takaya Deguchi
まあ 考える時間稼ぐために
っていうことですよね
kudakurage
そうそうそうそう
なんかね オウム返ししたりするとかも
まあ その1つでもあるよね
だから 相手が
あ そう
こう こう こうだよね
あ そう こう こう こうだよね
みたいなことを言うっていうのも
Takaya Deguchi
うん
kudakurage
その ちょっと それを言いながら
ちょっと考えてる時間があるみたいなね
Takaya Deguchi
そうですね
kudakurage
まあ でも 結構 なんかこういう
この本の中では
割と その会話で人間がどういうことをやってるのかとか
それをやったときにどう感じてるのかみたいなところも
ちょっと なんとなくそういう話も書いてあるんで
そういう意味で割とこう
汎用性を持って考えられる部分なのかなっていう風にも
思ったりしたけどね
Takaya Deguchi
うーん
なるほど
kudakurage
あと もう1個ちょっと脱線すると
これは勝手に僕が想像してただけなんだけど
本を読みながら
Takaya Deguchi
うん
kudakurage
最近 僕はそのAI系もいろいろ面白いなと思って
見たりしてるけど
ビジョンOSも同じように面白いなと思って
いろいろ見たりとかしてるんですよ
Takaya Deguchi
うん
kudakurage
で ビジョンOSも
意外とこの音声UI UXみたいな部分って
関わってくる部分が多くなるんじゃないかなっていう風にも思っていて
Takaya Deguchi
うん
kudakurage
まあ なんか
スペーシャルデザインとかっていう風に
まあ ビジョンOSとかだったら言ってるけど
まあ 割とその
タッチパネルよりもさらにこう直感的なインターフェースみたいなもの
というか
より自然な人間の動作みたいな
もののインターフェースっていうか
操作方法っていうのが求められることになっていくんじゃないかな
という風に思ってて
ビジョンOSとかになってくると
正直 ビジョンOS上でキーボードを打つって
難しいんじゃないかなとも思ってるんですよ
なんとなく
Takaya Deguchi
うん
まあ 一応サポートされてるんですけどね
出るけど
まあ 赤時みたいな感じですよね
kudakurage
うん そうそうそうそう
で 考えると
言葉で
まあ 声で指示したりとか
会話によって操作するっていう方が
まあ 自然な可能性というか
自然なケースもありそうな気がしていて
Takaya Deguchi
うん
kudakurage
まあ なんかね
それやりすぎると多分逆に不自然になっちゃうと思うんですけど
なんか 何でもかんでも声で操作するみたいになっちゃうと
Takaya Deguchi
そうね
kudakurage
でも なんか 場合によってはそういう可能性もあるかなみたいな
例えばさ
こう
まあ
,VisionWiseの場合 視線とかっていうのも使えるから
その視線とか まあ 指で
まあ カスタムジェスチャーみたいなのも使えるから
こう 視線とか指で何かの絵を指しながら
いや ここもうちょっと丸くしてよみたいな感じで
こう 指示して
なんか 操作するみたいなこととか
Takaya Deguchi
うん
kudakurage
で 考えると割と自然になってくるじゃないですか
Takaya Deguchi
うん
kudakurage
なんか そういう意味でも
それを じゃあ ここ指しながら丸く
もっと丸くみたいなテキスト打つよりは
まあ 多分自然な気がするんですよね
っていう意味でも
なんか VisionWiseを考える上でも
結構 音声の
音声インターフェースの可能性
kudakurage
ボイスユーザーインターフェースとか
ボースUXみたいなものっていうのは
結構 自由になってくる部分があるような気がしてるっていうね
Takaya Deguchi
うん 確かに
なんか ちょうどテレビ買ったんですけど 最近
テレビにAndroidOSなんで
まあ Google Homeが載ってるわけですよ
で そうすると
まあ Googleの音声入力とか
できたりするんですよね
kudakurage
はいはいはい
Takaya Deguchi
なんか 例えばYouTubeで検索したいときとかって
kudakurage
うん
Takaya Deguchi
だけど あんま使わないんですよね
なんか
kudakurage
うん
Takaya Deguchi
っていうのは
期待に応えてくれなかったとき
すげえイラッとするから
kudakurage
はいはいはい
Takaya Deguchi
うん なかなかあんま使う習慣僕なくて
結局 なんかリモコンでポチポチで入力したりとか
まあ それでも
まあ YouTubeがうまく保管してくれるから
そんなにこう 負担じゃないというか
kudakurage
うん
Takaya Deguchi
だけど なんかそれがもうちょいなんかこう
まあ ちゃんとGPTみたいな
ラフな会話でもうまくニュアンス組み取ってやってくれたら
もう 本当はまあ音声のほうが楽なんだろうなって
kudakurage
そうだね
Takaya Deguchi
ですよ
うん
うん
だから まあ その辺もやっぱLLMとそういう音声
ま あるいはもっとスペシャルな空間の中での
インターフェースの操作みたいなところ
kudakurage
うん
Takaya Deguchi
は まあ 絡んできそうですよね
うん
kudakurage
なんか わからん
まだね そのチャットGPTが出てきて
まあ ここ1,2年みたいな感じだから
うん
まあ これからっていう感じで
Takaya Deguchi
うん
kudakurage
とは思うけど
でもね たぶんもう10年とかっていうスパンじゃないじゃないですか
たぶんそういうのがもっと入り込んでくるから
発展していくのって
Takaya Deguchi
なんか別に この間
あのGoogleのジェミニの動画
kudakurage
あったけど
ああ はいはいはい
Takaya Deguchi
なんか まああれはなんかこう
フェイクだみたいな話もニュースで出てたけど
まあ でもなんかああいうの見てるとね
来年ぐらいにもできてもおかしくないぐらいの
kudakurage
レベルだろうなっていうのは思いますよね
ここ 今度 じゃあ来年 再来年ぐらいには
うん
もうそれが当たり前になってるっていう可能性は
すごくありそうですよね
Takaya Deguchi
だからこそ 今 アレクサとしゃべると
なんかすごいイライラしちゃうんですよね
kudakurage
うーん
いや だから 本当 だから この1,2年で起きた
この音声 スマートスピーカー界で起きたことっていうのは
かなり大きいんじゃないかなって思うんだよね
Takaya Deguchi
そうですね
VUIとGUIの違い
Takaya Deguchi
1年前はそんなこと思わなかったもんな
まあ こんなもんかって思ってたけど
今 やっぱ なんか話して
なんか アレクサに聞き返されたりとか
いや それは分かりませんとか言われると
すごいイラッとしますよね
kudakurage
そうなんだよね
うん
で まあ
うん
まあ 本の中では
なんでボイスユーザーインターフェースが重要なのかっていうことも書いてあるんだけど
うん
まあ そのコンピューターのインターフェースで言うと
歴史的に言うと
CUIっていうコマンドラインのインターフェースと
うん
まあ その先にGUIっていうのがあって
で 他に まあ それでまた今 VUIだよねみたいな話も
あるよねって話なんだけど
Takaya Deguchi
うん
kudakurage
まあ 明らかにVUIっていうのは
CUIとかGUIっていうものとは違うっていうのは
まあ 流れがあるんじゃないかっていう話はしていて
まあ CUIっていうのはもともと人間がコンピューターに合わせるための
まあ 命令文を決められた命令文を人間が打つことによって
それに対してコンピューターが
まあ こう 動作するっていうようなインターフェースだったんだけど
GUIはそれをもうちょっとグラフィックのメタファーによって
まあ 分かりやすくしたインターフェース
まあ CUIの進化版っていうような感じの位置づけなんだよね
やっぱりどうしても
うん
でも それに対してVUIっていうのは
やっぱりその延長線上にはないんじゃないかっていう話を
まあ していて
Takaya Deguchi
うん
kudakurage
まあ これは今だからそうなのかもしれないんですけど
っていうのは
ある程度コンピューターの能力が上がってきたからっていう部分も
文脈としては多分あるんじゃないかなと思うんですけど
うん
まあ でも そもそもその会話のコミュニケーションっていうのは
まあ 人間がそもそも持っているものだから
それを変えるのが難しいとかっていう部分もあるだろうし
まあ もちろんさっき言ったように
コンピューターが能力が上がってきたから
コンピューター自身が人間に合わせることができるようになってきた
から
可能になってるっていう部分もあるかもしれないですけど
まあ でも やっぱり
いかに 実にしよう
なんか 今あるそのボイスユーザーインターフェースっていうのは
まあ 人間側に
そのコンピューターが合わせるようなインターフェースであるべき
っていう前提で結構考えられることが多いから
そのCUIとかGUIっていうのとは
全く別軸のインターフェースとして
まあ 知見とかっていうのを持って考えないといけないよね
ボイスユーザーインターフェースの難しさ
kudakurage
っていうような話をしていましたね
Takaya Deguchi
うん
なるほど
kudakurage
まあ だから
結構ね 僕もソフトウェア
まあ そのウェブとかも含めて
そのGUIみたいなもののデザインの知見とか
まあ グラフィックのデザインの知見みたいなものはあったりするけど
全然それとは関係ないっていうか
違うなんかこう 知識というか
知見というかテクニックみたいなものを
ちょっとずつ覚えていかないと
もしかしたら乗り遅れちゃうかもしれないなっていう
なんか 危機感みたいなものはあるような気がするっていうね
なんか そこには
Takaya Deguchi
うん
kudakurage
まあ なんか すごい漠然としたというか
まあ すごい大きい単位での基礎となる
UX的な考え方っていうのは
あんまり変わらないかもしれないですけど
うん
なんかね やっぱりそういう
インターフェースが与える体験のあり方っていうのは
なんか GUIとか全く違う
こう 知見みたいなものが必要になるのかなみたいな
Takaya Deguchi
まあ そうですね
インターフェース
まあ 何だろう
インタラクションがこう より深みがあるっていうか
なんて言ったらいいの
返答があるわけじゃないですか
その まあ ボタンGUIだったら
まあ インタラクションって
まあ ねえ
オーバーがあるとか
なんか こう キカキカするとか
なんか まあ その程度だと思うし
まあ やりすぎてもあんまいけないみたいなのあると思うんだけど
音声とかの場合
まあ 返事の仕方とかによってね
いろいろ感じ方も変わってきそうだし
kudakurage
うーん そうね
Takaya Deguchi
なんか 最近
最近 またアレクサがイライラするって話なんだけど
なんか すごいなんか
なんか なんていうの
聞いてもないことすげえダラダラ喋れるようになったなって感じちゃうんですよ
ちなみにみたいな
これからこうこうこうでこうでこうでこうでみたいな
まあ なんか
なんか 広告っぽいなって感じるんだけど
kudakurage
はいはいはいはい
Takaya Deguchi
なんか マネタリズムしちゃうのかなとかちょっと思っちゃったんだけど
ちなみに こんなこともできますとか教えてくれるんだけど
いや 別にそれ聞いてないけどなみたいな
kudakurage
ねえ あのね その
そういう話はこの音声EXの本の中にも書いてあるんだけど
あんまい難しいなと思うね やっぱり
Takaya Deguchi
そう
kudakurage
その なんか 基本 音声
まあ UI っていうのは
目に見えないから何ができるかって
分からないことの方が多いわけじゃないですか 人は
その 使う人が 初めての使う人が
だから それをうまく示唆してあげることも重要だよみたいな話も書いてある
まあ だから たぶんそれやりたかったと思うんだよね
ちなみに こういうふうにやってくれたらこうできるよみたいなことを
言いたかったと思うんだよね
でも それのあんばいって結構難しいなって思うよね やっぱり
Takaya Deguchi
結局 空気を読まなきゃいけないってことですよね 人間と一緒なんで
kudakurage
そうそうそうそう
うんね なんか 世界 なんか すごい急いで
これについて知りたいって思ってる時なのに なんか 他のことをだらだら言われても
みたいなね そういうのあるだろうし
Takaya Deguchi
あと なんていうの
kudakurage
文脈が読めないと結構難しいよね
Takaya Deguchi
こっちがこうしたいって言ったことに答えられなくて
で ちなみにとか言われるわけですよ アレクサに
そもそも答えてないのに ちなみにじゃねえよって思ってしまうし
この 正直 なんていうの
そんなにこう アレクサに対して時間をかけたいと思ってるわけじゃないじゃないですか
こう 何かタスクをこなしたくてやってるわけだから
いや そんなだらだら喋られてもみたいな
kudakurage
うん
Takaya Deguchi
で なんか最近 ギルドのアルミ缶さん 奥田さんが
なんかチャットGPTのGPTSってプラグインというか あるじゃないですか
プラグインじゃないか まあGPTSってあって
なんかその一つに なんかあの
チャットGPTのレスポンスをシンプルにするっていうやつを作ってて
kudakurage
あったね あったあった
Takaya Deguchi
いや なんかわかるわと思って
なんか そんなにいろいろ なんかだらだら
答えてほしくないんだよなっていう
kudakurage
まあ 特にね 文章にされちゃうとね
テキストの文章にされちゃうとさ
なんか バーって書かれてもさ
うーん うーん なんか全部読む気になれないなみたいになっちゃうもんね
Takaya Deguchi
丁寧さとかいらないんだよなっていうね
でも これがなんかラボットみたいな
なんか可愛げがあったりしたら
なんかね そのキャラクターに沿った返答って欲しいなと思うんですけど
kudakurage
多分 その音声になるとまた変わってくると思うんで そこって
だから この本でも書いてあったんですけど
その書き言葉と話し言葉って
やっぱ全然違うから
話し言葉の方がより簡潔で短くした方がいいかもしれないけど
でも ちょっとそういう なんていうの
関係ない 冗長と思えるようなことも入っていても
いい可能性もあるわけ その場合によってはね
その話し言葉の場合は
だから 音声で聞く場合とテキストを読む場合とで
多分 感じ方が全然違うから
そういう意味でも なんか
ボイスユーザーインターフェースのどう考えるべきかっていうのは
結構 難しいかな
難しい まだ分かんない部分いっぱいあるな みたいな気がするよ
Takaya Deguchi
そうですね
まあ いろいろと期待値上がったなっていう感じですね
チャットGPTというか LLMによって
kudakurage
なんかでも さっき言ったみたいに
これできないんだけど ちなみに みたいな話の中で
まあ 似たような話もこの本に書いてあって
可能な限りポジティブな返しをする みたいな話が書いてあったんだけど
要は 天気聞いても 天気分かりません だけ返すんじゃなくて
いや ちょっと 私 ちょっと 今 リアルタイムな情報を扱えないので
音声会話機能の期待値調整
kudakurage
答えることができないんですけど
例えば こういうふうにやったら 解決できるかも みたいな提案をしてくれるみたいな
できるだけ ネガティブで終わらせない
可能な限りポジティブな返しをするっていうのも
一つ テクニックとしてあるんじゃないかなっていう話は書いてあったけどね
Takaya Deguchi
なるほど
kudakurage
要は なんかね できませんって終わるんじゃなくて
もう できるだけ なんかうまく解決するための道筋を
ちょっとでもいいから なんか示してあげると
多分 印象って変わるんじゃないかな みたいな
それも なんかね 言い方とかによるのかもしれないけどね
なんか 分かりません 検索してください みたいに言われたら
ちょっとイラッとするわけじゃないですか
Takaya Deguchi
そうね
kudakurage
自分でやれ みたいに言われたら
Googleエカース みたいに言われたらね
ちょっとイラッとするわけじゃないですか
Takaya Deguchi
確かにな 程度によりますね
なんかチャットGPTとかも 分かんないとは言わないじゃないですか
嘘でもいいから答えるわけじゃないですか
で まあ その真偽はなんか まあ
その 受け取り手しか分かんない
本人は分かんない
チャットGPT本人は分かってないわけだけど
でも なんかやっぱ 一応答えてくれるっていうのは
なんか やっぱ ポジティブな気持ちにはなりますよね
kudakurage
うん そうそうそうそうそう
まあ その だから さっきからちょっと出てる
期待値調整というかね
期待値の話もあるかなって 僕も思っていて
Takaya Deguchi
うん
kudakurage
印象として まあ その ボットに
ボット的な その 答えてくれる機械
Takaya Deguchi
うん
kudakurage
の印象が
その 機械的か 人間的かによって
多分 そういう 例えば 冗長な文章だとか
うん
なんか ちょっと関係ないことも含んだような
メッセージに対する感じ方って
変わるんじゃないかなとか
うん
こう どういう返答していくことが来たのかっていうのに
対しても変わるんじゃないかなみたいな
Takaya Deguchi
うん
kudakurage
っていうふうにもちょっと思っていて
Takaya Deguchi
うん
kudakurage
で 余計なことを言うと
そういうのって
人間に対しては不快感感じないかもしれないんですけど
機械に対しては
なんかこう 不快感を感じるというか
もっと さっきみたいにシンプルに言ってくれよみたいな
率直で的確なことだけ言えよみたいな
Takaya Deguchi
うん
kudakurage
ことを求めるんじゃないかなっていうふうにも思っていて
うん
何が言いたいかっていうと
日本語での音声会話
kudakurage
その音声を 例えば機械的にしたら
多分 印象としても
あ こいつは機械なんだっていう
印象の上で そういうふうに接しようっていうような
ことが
うん
人間にも働くんじゃないかっていう部分が
うん
あって その人間側が
まあちょっと機械側に寄せようっていうふうに
まあする傾向があるみたいな
その機械に対しては
Takaya Deguchi
うん
kudakurage
でもそれがめちゃくちゃ流暢な
こう 言葉で
いや こうですよ こうですよみたいなふうに
言ってくれるような
あ こいつ人間かもって思わせるような
相手に対し
相手がなんかちょっと
そういう機械的な動作をしたときに
なんか変なこう
不快感というかね
なんかそういうもの不自然さみたいなのを
感じるんじゃないかなみたいなふうにも
思っていて
Takaya Deguchi
うん
kudakurage
で なんか
これ噂レベルの話でしかないんだけど
Siri 初期のSiriは
なんか期待値調整していったんじゃないかっていう
なんか噂があるらしくて
Takaya Deguchi
へえ
kudakurage
その
意図的にちょっとたどたわしい
こう機械的な発話をさせていたっていう噂があるんだ
Takaya Deguchi
うん
kudakurage
これ何でかっていうと
その
別に
なんか
能力っていうか
あの
技術的には
すごい流暢に喋ること
喋らせることもできたんだけど
そうすることによって
なんかめちゃくちゃ
期待値が上がりすぎちゃって
Takaya Deguchi
なるほどね
kudakurage
よりなんか
人間的な会話を求めたりとか
なんかすごい難しい言い方とか
質問をするようになっちゃうんじゃないか
みたいなところがあるから
あえてその機械的にちょっと寄せることで
なんか機械に対して
なんかちゃんと説明して質問しなきゃとか
ちゃんとした言い回ししなきゃみたいな
気持ちにさせるみたいな
ことがあったんじゃないかっていう
まあ噂があるらしいんですけど
なんか割とそういう
なんか期待値調整みたいなところが
あるんじゃないかなと思って
Takaya Deguchi
確かにSiriに対しては
もう期待値が低すぎて使ってないですね
そういう意味で
kudakurage
だからねそれもね普通に
なんかめちゃくちゃ流暢に
喋ってくれるようなボットだとしたら
やっぱりなんか
ちょっとフランクに話しかけてみたりとか
する可能性もあるわけじゃないですか
だけど分かりませんみたいな
流暢に喋られると
なんかこいつ嫌だなみたいな
気持ちになっちゃうっていうかさ
Takaya Deguchi
Siriに至ってはやっぱ
初期の頃のイメージ
が悪すぎて
未だにこう
一番ねMacとかiPhoneとか身近にある割には
全く使ってないなと
今思ってしまった
kudakurage
なんかちなみにさ
最近あのチャットGPTアプリが
音声会話機能っていうのをつけたのって
試したことあります?
Takaya Deguchi
いや試してないですね
kudakurage
あのまあiOSとかでも
チャットGPTのアプリ
あると思うんですけど
それに音声会話機能っていうのがついて
なんかねヘッドホンみたいなマークを押すと
できるようになるんですけど
まあ普通に日本語で
もう確か対応してて
日本語でまあ明日の天気どうすかね
みたいに聞くと答えてくれるんですよ
まあ日本語で
まあそれがね
まあ意図してるのかどうか分かんないんだけど
まあなんかこう
海外の人が日本語で
話してるような感じの
声で返してくれるんですよ
まあでも別にそんな
変じゃないんですよそんな
まあでもなんかちょっと
日本語喋れる海外の人みたいな
いい感じのなんかクリスペプラーみたいな
なんか海外の人みたいな
そんな感じの人が
こう話してるような感じで
これなんか実は期待値調整してるのかな
ってちょっと僕も思ったりして
まあ要はなんか
なんていうの本当の本場の日本人
まあ大阪のおばちゃんみたいなのでもいいんですけど
が話してる感じだったら
結構フランクに話しちゃう可能性あるけど
やっぱちょっとなんか
なんていうのそのクリスペプラー
かどうか分かんないけど
その日本語喋れるぐらいの
海外の人が話してるぐらいの感じだったら
ちょっと自分もさ
聞き取ってもらいやすいように話そうとかさ
まあ分かりやすい日本語話そうみたいなさ
まあそういう
なんか変な
合わせにいってるみたいなとこが多分あると思うんだよ
会話を自然に
成り立たせるために
もしかしたらそういう期待値調整入ってるのかな
とかちょっと思ったりもしたんだけど
Takaya Deguchi
確かにね
あと日本語的な
ちょっと不自然さみたいなのも
まあ許せたりしますもんね
kudakurage
そうそうそう全然ね
なんかやっぱりちょっとなんか
まあ普通の日本人が話してたら
なんかまあそんな変とは思わないけど
まあね
自然ではないなって思う部分も
まあ全然許せるかなっていうか
頑張ってすごい
なんかイケてる
海外のおじさんがむしろちょっとかっこいいな
みたいな感じるぐらい
Takaya Deguchi
それでも英語だったら
感情の伝え方
Takaya Deguchi
流暢ってことなんですかね
kudakurage
まあちょっとねそれは
まあ
海外の英語ネイティブの方にしか
分かんなさそうですけど
ちょっと分かんないけどね
僕には
いやでもねこれ面白いからね
試してみてほしいですね
チャットGPTアプリの音声会話機能
僕もね最近と
知り合いに言われて
知って使ってみたりとかした
面白い
非常に
僕もなんかさっき
さっきの話で言うとさ
ネガティブな分かりませんみたいな回答
なんかあったりしたんですよそれでも
具体的に言うと
天気教えてみたいなのを言ったんだけど
ごめんなさいちょっと
私は天気は答えられないんです
って言われて
さっき言ったように
Googleかなんかで
ウェブでその天気
どこどこの天気はみたいな風に検索してみたら
分かると思いますよみたいな風に
答えられたんだけど
ウェブで検索してよって言ったら
ちゃんとなんで検索できないのか
っていうのを答えてくれて
Takaya Deguchi
はいはいはい
kudakurage
私はプライバシーのなんとかの関係で
そういうのはできないようになってるんですよ
ごめんなさいみたいな
そうなってくるとできないんだけど
ちょっと
親しみというか
信頼感が上がるというか
Takaya Deguchi
じゃあ仕方ないねってなります
kudakurage
そうそうそうそう
ただ分かりませんできませんって言われるよりは
ちゃんとその辺までも含めて
答えてくれるとまた変わってくるよね
印象が
Takaya Deguchi
あとやっぱなんか
JPTと会話するとき
ってなんかいいねとか
ありがとうとか言うんだけど
kudakurage
あーはいはいはい
Takaya Deguchi
でもアレクサには絶対言わないですよそんなこと
それってやっぱなんかそういうの
ちょっと汲み取ってくれるからだなって
思いましたね
なんかアンダーシーして
kudakurage
そうだねなんかその本の中で結構
どう親しみを持って
人間的に感じてもらうかっていう
テクニックみたいなのもいくつか
なんか書いてあったんだけど
やっぱり表情とかも見えないし
今だったら欲をちょっとつけれるのかもしれないけど
なかなかそういうのも難しいと思うんで
できるだけやっぱりその
嬉しいとか楽しいとかそういう感情
みたいな部分を言葉にしてちゃんと
使えることも重要だよみたいな
ことも書いてありましたね
でもそれって結構普通に人間同士の
コミュニケーションでも普通にやってるな
と思って例えばなんか
スラックだとかイシューみたいな
テキストベースのコミュニケーションだとどうしても
感情がこの人怒ってんのかな
みたいなのを気にして
ちゃんと絵文字でさニコニコ
みたいな感じもしつつ話しするみたいなのって
テクニックとしてあるわけじゃないですか
そういうのと結構一緒だなと思いましたけど
なんかそういう
ちゃんと今それはいいなと思っていますよ
みたいなのをちゃんと伝える
音声会話機能の進化
kudakurage
そううまく自然な流れで言わなきゃいけないと思うんだけど
でもなんか
アレックスさんも頑張ってそういうこと
言ってる時もあるような気はするけど
よりなんかチャットGPTの方が
なんかイケてる感じで
それを言ってるような気がしますね
Takaya Deguchi
そうですね
あとそれをそういうなんか
ポジティブフィードバックをうまく
ネガティブフィードバックもそうだけど
うまいこと次の会話に加味してくれるという
期待があるから
そうしようと思います
kudakurage
そうだね
Takaya Deguchi
アレックスは多分そういうのないしなと思っちゃうんだよな
kudakurage
そこの辺は
過去の期待値の
今までどうだったのか
みたいな経験みたいなので
そうですね
Takaya Deguchi
そういう意味でも
kudakurage
影響があるのかもしれない
Takaya Deguchi
LLM以前と以後では
全然違う気がしますね
UX
kudakurage
もしかしたらね
名前変えた方がいいかもしれないよね
だから
もうSiriはやめて
違う名前の人が出てきましたみたいな感じで
出した方が
新しくさ
期待値をまた決めれるからさ
Takaya Deguchi
Googleホームっていうより
ジェミニっていう名前で出てきた方がいいかもしれない
kudakurage
そうだよね
そうそう
その可能性あるよな
あとなんかテクニック的なものとしては
専門用語避けるのかもあるけど
さっきのね
オウム返しじゃないけど
確認のために復唱するみたいなのも
割と会話をうまく成り立つっていくっていう意味では
重要なのかもしれないなっていうのは
これは普通にね
Bot側っていうよりも
実際に話した
オウム返しされた側
もう反数する時間を与えてると思うんだよね
自分が何話したのかっていうのを
改めて確認させてもらってるというかね
だから意外と
質問しようとしてるけど
何質問しようとしてるか
分かんない時ってあるのがあるじゃないですか
自分がこれなんか聞きたいんだけど
何を聞こうと思ってるのか
まだよく分かんないけど聞いてるみたいな時ってあると思うんですよね
それって多分会話の中から
うまく探りつつ
これが聞きたかったんだっていうのが最終的にあって
それに対する答えが出てくるっていう流れになると思うんだけど
そういうのをうまく
作っていくというか
会話の中で組み立てていくような
相手にならなきゃいけないっていうかね
Takaya Deguchi
確かに
それ言われてみると
日々で音声入力使わないのそれもありそうですね
なんか補完
補完が聞くと
一定組み立てながら考えられるわけじゃないですか
なんかキーワード最初に入れて
こういう補完が出てくるんじゃ
じゃあこっちのキーワードみたいな
キーワードの追加ができるわけだけど
音声だと最初から
自分で全部頭の中に描ききらないと
現状はダメだから
それがだるいってのがあるんだろう
kudakurage
そうだね
現状のそういう音声チャットボットみたいなものだと
多分
文脈の記憶
短期記憶に関しても
割と浅いというかさ
一個前ぐらいしかまだ覚えてないぐらいの
ところがあるのかもしれないよね
なんか親しみを持って
より人間的に感じてもらうっていう意味では
なんか
言い方の揺れで変化をつけるみたいな話もあって
ちょっと確かにそうかもって思ったんだけど
要は何が言いたいかっていうと
毎回こんにちはから始めるんじゃなくて
毎回変えるみたいな
調子どうみたいな感じとか
どうもどうも
みたいなとか
言い方が
でも人間だったら
毎回こんにちはから絶対始まるみたいなことは
ないわけじゃないですか
でもやっぱりその毎回こんにちはで始まると
ちょっと機械感が出てきちゃうんで
そこを
まあそのこんにちはだけじゃないんだけど
言い方自体の変化をつけるみたいなのも
結構人間的に感じてもらうとか
より親しみを持ってもらうっていう意味では
大事だっていうのは
確かにそうかもなと思った
Takaya Deguchi
でもなんかその辺はやっぱ
複合的なものなんだろうな
なんかその賢さって
っていう要素もそうだし
コア色とか
音声インターフェースって
ミーモデルもそうだし
視覚的なインターフェース
ラボットとかだったら
見た目的にはかわいいっていうのあるだろうし
別にデジタルでも
画面上のUIがちょっとなんか
より情緒性感じるUIになってるとか
そういうのもセットで
なんだろうなと思いました
kudakurage
そうですね
声の設定指示
kudakurage
それこそね
そのコア色とか
抑揚とか
なんか話すスピードが
普通の人間って
一定のスピードで話さないわけじゃないですか
早いところもあれば遅いところもあるみたいな
話し方をしてるのが自然だと思うから
そういう話し方とかによっても
多分変わってくるだろうし
この中でもちょっとあったけど
そのボイスユーザーインターフェースの
デザインシステムみたいなことも多分あって
どういう声
コア色なのかとか
じゃあその人はどういうパーソナリティなのか
みたいな設定をするとかさ
どんな風に接する人なのかなとか
っていうのも含めて
考えていく必要性はあるのかな
っていう気がするけどね
なんかでも
チャットGPTアプリのやつ
一応なんかね
どういう声なので答えるのか
Siriとかにもあると思うけど
設定できるんですけど
どういう人みたいな
日本語の場合はなんか
あんまり設定できなかったかもしれないですけど
デフォルトで設定されてるっぽいのが
やっぱりクリス・ペプラーみたいな
ちょっとイケオジの外国人みたいな
外国人の
ハーフみたいな
なんかそういう人だから
なんか結構ね
イケてる雰囲気を感じるというか
なんかそれだけで
コア色
まあ話し方もあるんだけど
Takaya Deguchi
なるほど
kudakurage
そういうのも結構影響してる方が
やっぱ大きいと思うんだよね
その期待値に対して
しかもちゃんとそれある程度
その期待値に合った感じで答えてくれるから
それでだいぶ印象変わりそうだなと思ったけどね
Takaya Deguchi
確かにね
確かに
なんかSiriに対して期待値低いのは
なんか頼りなさも感じちゃうんだよな
なんか
なんか僕の中でなぜか
Googleホームが一番賢いという
なぜか印象があるんだけど
わかんないんだけどよく
でもGoogleホームって言いづらいから
結局アレクサ
間取ってアレクサ使うことが多いなっていう
kudakurage
だから今だとね
OK Googleとか言ってるけど
Geminiとか
そういう感じになるとまた変わるのかもしれないね
Takaya Deguchi
確かにね
kudakurage
他にもいろいろテクニック紹介されてたけど
なんかその
ChatGPTアプリの
音声会話機能のやつは
割とねそれをちゃんと全部組んでるような気がしていて
例えば
回答の後に
質問をつなげることで会話続けさせるみたいな
のって
一つのテクニックだと思うんだけど
単純にさっき言ったらさ
天気知りたいんだけどみたいな
こうやって答えてくれたとして
明日の天気はこうなんだけど
明日なんか予定あるみたいな風に聞いてくれるとかさ
なんかまあ別にそれいらないかもしれないけど
その会話を続けさせるみたいなところによって
結構また感じる印象みたいなのがどんどん変わっていくみたいなね
とか
場合によってはそれによって
さっき言ったように
これについて知りたかったんだっていうのを
気づける可能性があるというかさ
なんか最近
さっきねちょっと試しに
ドラゴンクエストモンスターズ3ってどうなの
みたいなのを聞いてみたんだけど
ChatGPT音声会話機能で
そしたら
なんか人気
最近そういうゲーム人気ありますよね
なんかドラクエのモンスターズ3ってどうなのみたいなのを聞いてみたんだけど
なんかドラクエのモンスターズ3ってどうなのみたいなのを聞いてみたんだけど
kudakurage
なんかドラクエのモンスターズ3ってどうなのみたいなのを聞いてみたんだけど
何が好きですかみたいな感じで
Takaya Deguchi
聞いてくれて
kudakurage
僕も別にその
最初に質問したことは
何か本当の目的があって聞こうと思ったわけじゃなくて
なんとなくちょっとした雑談的な会話
っぽいところもあったんだけど
それでなんか自分が
何の答えを知ろうとしてたのか
みたいなのを会話続けることによって
なんか導けることができる可能性があるんじゃないかな
っていうのをちょっと思ったりしたよね
インターフェースのパーソナライズ
kudakurage
なるほど
Takaya Deguchi
チャットGPTアプリの方は全然違いますよね
チャットGPTアプリの方は全然使ってなかったから
そういう感じなんですね
kudakurage
僕もそうなんで
ウェブのブラウザーとかで使ってた
とかがほとんどだったから
結構ね面白いから
ちょっとね試してみてほしいですね
Takaya Deguchi
そういえば
ウェブの方ではなんか最近
これGPT4
GPTプラスに課金してるかは分かんないけど
カスタム指示ってのができるようになって
kudakurage
はいはい
Takaya Deguchi
まあ2つあって
1つがその自分がどういう
何者なのかっていう
どういう質問をするのかっていうのを
最初にコンテキストとして渡す
プリセットみたいなのが設定できるんですよ
もう1個がなんか
チャットGPTにどのように応答してほしいですか
っていう設定欄があって
そこでシンプルに答えてほしいとか
なんか
意見を持ってほしいとか
中立を保ってほしいとか
なんかそういう指示ができるみたいですね
こういうのもいいよね
kudakurage
そうですね
これもでも多分前々から
ほぼほぼできたんじゃないかと思ってるけど
Takaya Deguchi
インターフェースとして用意したんだと思うんで
インターフェースができたっていうことだと思う
kudakurage
だよね
Takaya Deguchi
だからここでなるべく雑談を広げてほしいとか
なるべく端的に答えてほしいとかね
kudakurage
そうそうそうそう
Takaya Deguchi
でこれが音声だったらなんか
その音声UIが置いてある場所によって
違うとかね
仕事に置いてあるときは
なるべくシンプルにしてみたいな
うん
kudakurage
で多分ねもうちょっと長期局がさ
溜まっていくときに
溜まっていけるようになっていったら
どんどんパーソナライズして
ちょっとこの時間帯は仕事してるから
できるだけ簡潔に答えたほうがいいな
空気を読んでくれるみたいな
Takaya Deguchi
ちょっと今機嫌良さそうだから
雑談振ろうかなみたいな
kudakurage
そうそうそうそう
音声UXの可能性
kudakurage
ちょっと深夜で子供を大きくしちゃうと
よくないからこっそり声で話そうかな
Takaya Deguchi
みたいな
kudakurage
そういうなんかいろいろな文脈を
汲み取って糸を組んでいくっていうのが
多分どんどん可能になっていくんだろうな
Takaya Deguchi
っていう風に思ったけどね
まあ来年にでも真の
ボイスUIは出てきそうですね
特にGoogleは
そうですね
kudakurage
そうだね
だからね改めて結構この辺を
読んでて
なんか今だから
思うことというか感じたこととか
っていうのもいっぱいあって面白かったですね
多分これが2年前に読んでたら
全然
また見え方変わってたと思うんで
普通にアレクサを対象にしたら読んでたと思うから
Takaya Deguchi
そうですね
kudakurage
そういう意味でもね面白かったですね
このフォーマルタって読んで
なので最近だとねやっぱり
そのAIチャットGPTも含めた
AI系のサービスを
携わってるとか
そういうのに興味あってやってる
っていう人も多いと思うから
多分普通に音声だけじゃなくて
そういうまあ書き言葉
チャットボットみたいな
そういうものにも
活かせる部分は結構多いような気はした
というかね見ていて
Takaya Deguchi
うん
kudakurage
もちろんだからそっからさらに音声に消化するときに
気をつけないといけないことっていうのも
いっぱいあるんだけどもちろん
でもその手前の部分も
ある程度カバーして考えることもできるかな
と思ったのでこの本の中の文章
Takaya Deguchi
うん確かにね
なんか
LLM以前のボイスUIってちょっとなんか
小手先っぽい印象も
あったんだけど
本質はやっぱCUIとあんま変わってない
っていう状況だったりとか
kudakurage
そうそうそうそう
なんかねある程度コマンドがあって
人間側が言わなきゃいけないみたいなね
Takaya Deguchi
なのになんか
その人間っぽい話し方にしましょうとか
感情を出しましょうとか
なんかちょっと小手先だなって思っちゃってたんだけど
まあでもそれがようやくなんか
伴ってきたというか
技術の進化によって
本当にそれが必要になってきたのかもしれないですよね
kudakurage
だから結構ね
今読む
逆に今読んだ方が面白いくらいまで
あったような気がした
Takaya Deguchi
確かにねそうかも
kudakurage
なんかツイートも
ちょっと調べてみたんですよ
音声UXのこの本について
どういう人がツイートしてるかな
今のツイートじゃなくてポストなのか
UXのポスト
そしたら結構ねその音声系のAI
例えば電話の対応とかね
とかのAI作ってる考えてる人
最近今年だったら
結構多いと思うんだけど
そういう人が音声UXの本読んでる
みたいな話結構ポストしてたりしたんで
音声によるコミュニケーションの活用
kudakurage
そうだよなって思ったけど
Takaya Deguchi
ありましたよね
Googleだっけ
なんかどっかのスタートアップで
なんか飲食予約代行系AIサービスみたいなのあって
突然飲食店に機械的な
音声の電話がかかってくるみたいな
そういうのもね
そういうテクニックを使うと
なんか多少は飲食店側の反感みたいなのも
抑えられたりするのかもしれないです
kudakurage
そうだね
まあ普通にあとね
電話対応のカスタマーサポートとかもね
普通に考えたらあるだろうしね
まあでもそういう意味でも結構
今読むといい本だなって思って読みましたね
結構面白かったです
なので
LLMチャットGPT系のサービス考えてる人は
ぜひ読んでみるといいんじゃないかなと思いましたね
Takaya Deguchi
はい
kudakurage
じゃあそんなところかな
Takaya Deguchi
はい
kudakurage
リサイズ平面のご質問やご感想リクエストなど
アイクスにポストしていただくか
ショーノートにあるお便りのリンクから送っていただければ
配信内で取り上げたりしますので
どしどしいただければと思います
リサイズ編は毎週金曜日に配信しています
Spotify、Apple Podcast、YouTubeなどで配信していますので
よかったらチェックしてみてください
ということで今回はここで
次回お会いしましょう
さよなら
さよなら
01:05:35

コメント

スクロール