会話の科学と重要性
nocall CTOの森本と、COの林です。
今日はですね、前回私が話した会話について、最近本を読んでてですね、いろいろ面白いことがあったので、それを話していこうかなと思います。
会話についてね、うちも会話のアプリケーション、AIの電話やってますからね。
いや、そうなんですよ。自分たちは会話っていう部分が、プロダクトにとって一番大事だと自分は思っているので、そこら辺をやっぱり自分は深掘っていきたいんですよね。
で、最近読んだ本がですね、会話の科学、あなたはなぜ「えー」と言ってしまうのかっていう本なんですよね。
えーね。
えーって言ってしまう。
確かに、普段会話をしていると、あいづちとかえーとか言うかもしれないですけど、
今私たちが提供しているnocallでは、AIが一方的に話して、人間がそれに応答して、単性っていうのが如実に出るようなものになってはいますよね。
そうですね。うちとして提供している価値としては、人間らしいコミュニケーションといえば従来に比べたら自然のコミュニケーションだけど、
ビジネスの上でちゃんとこの情報を正確に伝えて柔軟にやりとりするっていうところで、LMMのボイスボットを提供してますからね。
そうですね。会話なんですけど、会話っていつぐらいからあると思います?人間の会話、いつ発明されたと思います?
え、でもなんかホモサピエンスって最初から会話してたんじゃないんですか?
いやでも、なんか泣き声みたいな時もあるじゃないですか。遺説によると20万年から15万年前が会話を用いてコミュニケーションをするようになった時代って言われてます。
20万年?
そうです。
あー、だいぶ思ったよりもだいぶ長かったな。
で、逆に文字が登場したのはいつだと思います?
えー、まあでもキリストが生まれた頃にはありそうな感じだから、まあ2000年とか。
あー、近いですね。5400年前です。
あー、そっか。文字って言っても体型文字みたいなのも文字か。
一番古い文字っていうのはメソポトアミアのシュメール人によって5400年前に発明されたくさび型の文字。
まあいわゆる歴史の授業とかで習った年度版に書くような絵のような文字のような文字。
あー、ですよね。アンノウンみたいな感じね。
あー、そうアンノウンみたいな。ポケモンで言うアンノウンみたいな文字です。
そういう理由から文字よりもやっぱり会話とか音みたいな方が人間はより親しみがあるっていうことで、
まあ人間ってだいたい会話を通じて知識を受け継いでいくようなものになってますよね。
自分がこの本を読んで驚いてたのはですね、会話をしてるときに相手が答えるまでの平均秒数ってのはですね、だいたい200ミリ秒ぐらいなんですよ。
0.2秒?
0.2秒です。なんで今もこういうふうにポッドキャストを撮ってますけど、まあだいたい0.2秒以内で相手の受け答えっていうのを返していく。
キャッチボールができるっていうところなんですね。
まあそうですよね。そこで言わないとなんか流れちゃいますね。たぶん会話が。こいつ反応しないんだみたいな感じになっちゃいます。
あ、そうそうそうそう。今ですね、まあノーコールで言うと、まあだいたい1秒から2秒ぐらいかなみたいなところなので、ここはまだ達成できてないんですよね。
でですね、なんと日本語がですね、一番短いらしいんですよ。その受け答えまでの秒数。
言語と反応の速度
英語面白い。
なんと7ミリ秒。ほぼかぶってるみたいな。日本語にはそういった特徴があってですね、まあいわゆる言語的にはおそらく珍しいし、難しい言語なのかなって思います。
まあそれにその、自分も海外アプリケーションとか同じようなものを試してて思うけど、やっぱ英語ってちゃんと単声でこっちが喋って、向こうが喋って、こっちが喋ってて区切りがしっかりしてるけど、日本語って常にジャブ打ってる感じ。
相手が喋ったらうんうんとか、はいはいとか、合図打ち打ちながら、なんかあわよくばそのまま続けて喋るみたいな。
なんかずっとジャブ打ちながら喋ってんだなっていう、そんな感じはあるね。
いやそうなんですよ。まあ実際に今こう喋ってる流れも、あそうだよねみたいな、聞いていますよみたいな態度をするわけじゃないですか。
まあそこら辺が結構英語とか他の言語とまあ違う点なのかなとは思いますね、日本語の。
で一番長い言語だとまあだいたい1秒ぐらい、オランダ語だったかな、1秒ぐらいは待つらしいです。
でも逆にまあ普通こう1秒以上待ったらこうなんか違和感抱かないですか。
例えばこういうパターンあると思って、私が料理作って振る舞ったとするじゃないですか、料理美味しい聞いた時に1秒以上返事なかったどう思います。
まあ確かに、その間になんか考えるかもね。
そう考えてる。
てかこいつ速答できないからなんか考えてんだなって思うかも。
そうそうそう、そうなんですよ。
で実ははいよりもイエーの方が秒数がかなりかかるらしくて、平均的に逆にそのイエスの方が平均まあ100ミリ秒ぐらい、ノーの方が500ミリ秒ぐらいかかるらしくて。
沈黙が逆にそのノーっていうことを暗示しているというか、そういうパターンというかまあルールマナーみたいなものがその会話の中にはあるっていうことですね。
逆に待つことによってそれを察知させてるみたいな面もあったりして、先ほどの例だと沈黙することによって違うんだなみたいなことを相手に察知させるみたいな、いわゆるシグナリングみたいなことをやってたりします。
であと会話って実はその義務があるんですよ。
義務。
何気なくこう普段会話してるじゃないですか。
でも基本的に会話を投げかけたら相手って答える義務あるじゃないですか。
まあそうですね。
2社間に対して義務を発生させて、だから質問したら強制的に相手は答えなきゃいけないっていう立場になるわけですよね。
まあそれが結構その会話っていう部分には特殊というか特徴であって、義務があるんで、じゃあ相手は何か反応しなきゃいけないわけですよ。
でまあよくあるのはそういったあいづちとか聞いてるアピールだったり、会話を促したりとかっていうことですね、ことがありますと。
会話っていうのはその人間同士の連帯感を強める役割があってですね、実際にまあやっぱり会話してると仲間だなとか、逆にこの人会わないなみたいなあるじゃないですか。
で実際に他の動物にもそういった例があってですね、声ではないんですけど、オマキザルっていう猿は無害なこの動物の卵とか泥に向かって攻撃するんですよ。
声ではないんですけどまあコミュニケーションみたいなことですよね。
無害な動物の卵に向かって。
一緒に攻撃をすることによって、俺たち一緒の仲間だよな、みたいなことをやるわけです。
でも人間ってそれあるくないですか、会話で。
例えば芸能人の不倫とか、噂話とか、そういった他者への攻撃だったり、そういったものを使って人間同士の連帯感っていうところを会話によって醸成してたりします。
まあそうですよね。さっきの攻撃みたいなところで言っても、人間同士でも一人の人をいじめるためのコミュニケーションみたいなのはそのいじめっ子側では仲良くなりますからね。
そうなんですよ。そういったところで会話っていうところが一種の連帯ツールっていうところでは使われてたりしますね。
あとこれちょっと面白いなって思ったのは、人間って会話の終わりを察知してるんですよ。
察知っていうのは予測しながら喋ってるみたいなことですか。
予測しながら相手がこのタイミングでこの会話が終わるなっていうふうに思ってる。結構不思議じゃないですか。
自分はそのエンジニアでノーコールを作ってるので、だいたい相手が話終わったら0点何秒経ってそれで区切るみたいな形の処理をしてるんですけど、
会話の義務と連帯感
人間はおそらく違ってその相手のイントネーションだったり、そういうものを使って会話が終わるっていうことを察知してるらしいんですよね。
面白かったのは、なんか実験があって、
みたいなところで実験したんですよ。
終わるポイントってその文の中では2つあるわけじゃないですか。
例えばその、
で、終わる場合と、
っていうふうに続くパターンあるじゃないですか。
で、だいたいその2つは普通の人だったら見分けられるというか、ここで終わりだなと、長いな、まだ続くなっていうのは判断できるんですよ。
なんで、そういうふうにイントネーションとか会話の間とか、文章の長さみたいなところで、人間は会話の終わりっていうのを察知してるんですよっていう。
どの言語でもそうって話なんですか。
なんか英語の方が主語、述語でも一旦終わるじゃないですか。
で、一旦終わるじゃないですか。
みたいな感じで、後からいくらでも継ぎ足せるなっていうのが英語の漢字があって、日本語だともう最後の方に結論みたいな、
私は明治大学の学生です。
学生ですっていうことを伝えたいのが最後に持ってくるから、あんま継ぎ足せないわけですよ。
結構構造的にはなんか違うかなと思ってるんだけど。
確かにそれはありますね。
英語はなんか後からいくらでも継ぎ足せるから、とりあえず喋りやすいんですよ。
日本語だとそこまで割と考え切ってから喋らないとあんま継ぎ足しにくいなって。
でもなんかちょっと今思ったことでは、英語はやっぱりその終わりがちょっとわかりにくいというか、継ぎ足せる可能性があるから200ミリ秒待つんじゃないかっていう。
逆に日本語は終わりっていうところが明確だから、7ミリ秒しか経たないみたいな可能性あるんじゃないですか。
ありそうです。
伝法の違いっていうところで会話の素早さの違いっていうのはあるかなと思います。
なるほど。
でも日本語で流暢なボイスボットを作ろうとするハードルはまだまだ道のりが険しいですね。
そうですね。そこは今後の課題というか、一番自分は達成したいなと思ってるところではありますね。
今回もお聞きくださりありがとうございました。また次回の配信でお会いしましょう。