1. XCrossing
  2. ep70 「表情」と「声」が食い..
2024-03-06 34:29

ep70 「表情」と「声」が食い違ったときに覚える違和感の正体は?

コミュニケーションする上で「表情」や「声」が果たす役割は多い。また文化の差により、同じ表現でも、受け止め方がまったく異なってしまうことも

ゲーム中のキャラクターの顔のキャプチャと声のあて方のパターン
実在の俳優をキャプチャし本人が声をあてているのに、声が浮いていると思うことがあるのはなぜか、を考察してみる
CGで作られた顔の動きの制限をカバーしてストーリーに引き込む声の演技
話す言葉に乗ってくる感情と情景
ビデオ会議で気になるノイズは背景の環境音か人の声か
NTTの大規模言語モデル「tsuzumi」では、AIが人の声色や声に乗っている感情を理解するらしい
声に乗るものを理解するには、言語や地域で異なる文化的なコンテキストを高度に理解する必要がある
満足度調査やNPSで、日本人は低い値が出がち
アメリカ人上司は注意したのに、面談したフランス人の部下は褒められたと喜んだのはなぜか
「笑い」は共通の文化的コンテキストがないとなかなか難しい
同じ英語圏でもイギリスの笑いのポイントはアメリカ人には伝わらない
HoloLensの開発者の指摘:3D空間での設計では音を大事にするべき
片耳が聞こえない時、行方不明のガジェットを音で探す時に位置が分からなかった

エピソード内で取り上げた情報へのリンク:

Summary

最近プレイしたゲームの新作では、リアルな3Dモデルと声優の演技のズレを感じています。人間の脳は背景音や声の乗っかり方などを通じて微妙な表情の違いを感じ取る能力を持っています。この違和感や感じ取りの能力は、人間の情報処理とAIの聴覚や視覚の能力の差異に関連しています。Tsuzumiという、感情と聴覚を理解するAIの場合、声のトーンに対応して返答することができます。聴覚があるAIは、感情や声に載っている情報を理解して適切な返答をすることができます。日本人とアメリカ人のコミュニケーションにおける違和感や笑いの取り方について考察されています。テクノロジーの進化により、音のフィードバックが人間の感覚に与える影響について話されています。立体音響や奥行き感がもたらすリアルな体験が、デジタル体験とは異なる魅力を持つことが強調されています。

00:01
Mika Ueno
XCrossing、英語でスクランブル交差点を意味します。
趣味も世代も、住んできた町も違う3人がスクランブル交差点で出会うように、
様々な話題を聞かせるおしゃべりの交差点です。
今日のXCrossingであなたが出会うのは、どんな話題でしょう?
Mika Ueno
こんにちは、上野美香です。
マーケティングとプロダクトマネジメントをやっているフリーランスです。
Nobuhiro Seki
ニューヨークから関信浩がお届けします。
現在はスタートアップの投資を中心にやっていますが、色々やっている何でも屋さんです。
Mika Ueno
今回も及川さんお休みの回です。
ちょっとしばらくお休みだったり、出られるときがあったりありますが、
今日は2人でやっていきましょう。
Nobuhiro Seki
なかなか第1四半期、1〜3月が忙しい方が多いので、
聞く方もそうですけど、参加するのも結構難しいですよね。
ゲームでのリアルな3Dモデルと俳優の演技のズレ
Mika Ueno
あのですね、ちょいと話の方向変わりますけど、
私最近、ゲームの新作が出てて、ずっと実況というか、
メインストーリーをつなぎ合わせたビデオを見るっていうのが趣味なんですけど、
それを見てるんですよ。
何回か言ってますけど、龍が如くっていうゲームが大好きで、
それを見てるんですけど、
1本あたり、1作品あたり18時間くらいあって、すごい長さなんですけどね。
そこが素晴らしいストーリーなので、引き込まれてずっと見ちゃう。
ゲームは、人をキャプチャーしてキャラクターにするっていうのもそうですけど、
オリジナルのキャラをCGで作って、そこに声優さんが声を当てるっていう、
そういう作り方なんですね。
だから完全に架空のオリジナルキャラっていうのに声優さんが声を当ててるパターンと、
声優さんじゃなくて俳優さんが声を当ててる場合もあります。
実在する本物の俳優さんをキャプチャーして、それを取り込んで、
そこにご本人が声を当てるっていうパターンといくつかあるんですけど。
龍が如くだと、何割くらいかな、架空のキャラなんですけど、
3割くらいは実在の俳優さんが出てくるんですよ。
俳優さん本人で、もちろん一流の役者さんとかね、
そういう人が出てきているのにも関わらず、
ストーリーを見ていると声での演技がついてこないというか、
声と本人の3Dの見た目、ビジュアルが合ってなくて、
すごい違和感を覚えるっていうか、
すごい声だけ浮いている感を感じるっていうのがちょっとあって、
今回の最新作もそうなんですけど、過去作にもそれ何回もあって、
見ててやっぱり自覚的になっちゃったんですよね。
それがどんな名優であっても、
若くてもキャリアがある人でも関係なくて、
顔の表情がすごい細かく動くようになったんですよね、今の。
たぶんUNREAL ENGINE 5だと思うんですけど、
リアルな3Dモデルだから、ものすごい没入しやすくはなっている。
なっているんだけど、声が乗ってこないと、
そこにフッて現実に戻されるっていうか、
あれ何だ、全然合ってないみたいな感じになっちゃって、
っていうのがすごい感じることがあって、
今回もそれはあったんですね。
でも一番ひどかったっていうか、
一番違和感感じたのは、
実在の俳優さんがやってるやつだったんですよ、過去作でね。
ものすごい名優さん。
Nobuhiro Seki
それって架空のキャラクターに声優さんが当てるんでも、
本人の取り込みに、本人のアバターに本人が当てるんでも、
関係なくですか?
それともリアルに顔の表情ができるようになったから、
逆に違和感ができたっていう話、関係なく。
Mika Ueno
これはリアルになってればなっているほどってのは、
あんまり関係ない感じがしてて、
もう10年以上前の過去作からずっとそれは感じてたので、
あんまりリアルだからっていうのは、
私の場合ですけどね、
あんまりそこは大きな要因ではなくて、
大きな要因ではないかもしれない。
この最新作はものすごいリアルだからなんですけど、
本人のキャプチャーに本人が声を当ててるのに、
すごい浮いてる感っていうか、
そこがあるのは変わらないですね、やっぱり。
Nobuhiro Seki
それって本人の表情とか逆に想像ができて、
要するにもう細かく見えるわけじゃないですか。
だからこんな時にこんな動きをするって想像できちゃって、
それとのズレがどうしても出るじゃないですか、ほんのちょっとでも。
それが違和感があって、架空の場合はそれがないから、
割と違和感なく感じるってそんなことなんですかね。
Mika Ueno
どうなんだろうな。
人間の脳の表情の感じ取り能力
Mika Ueno
表情が豊かにテレビドラマとか映画とか、
実写の映画みたいにこの目の動き、表情筋の動き、
髪の動きってすごい微妙なものが動くじゃないですか、
ドラマとかって。
あとは体も動くし、それから出てくるオーラっていうんですか、
そういうのもあると思うんですけど、
ゲームのキャラになった場合はものすごく細かく目とか、
あと口周りが動くようになったんですよ。
それが今作のすごいところなんですけど、
それがあっても、なんかやっぱり完璧に実在ではないから、
そこをカバーするために声の演技でものすごく、
ちょっと大げさにするところってあるじゃないですか、
声優さんの演技とかって。
ものすごくはっきり抑揚も言うし、
そこの部分で架空のキャラにドーンって没入できるのは、
やっぱり一流の声優さんの演技だなと思ったんですよね。
過去作の時はもっと荒いわけですよ。
3Dのキャプチャーとか。
ものすごくリアルでなんですけど、
本当にバッチって止まってるキャプチャーなので、
そっちの方が断然、
うわーなんかすごいリアルなキャプチャーできてるけど、
動きになった時にはやっぱり表情まだついてこないなと思うとか
たくさんあるんですけど、
でもそれでもそんなところじゃなくて、
ストーリーに吸い込まれちゃうとか、
すごいたくさんあったんで、
声の演技とかね、あるんだろうなと思いますよ。
Nobuhiro Seki
やっぱりね、アニメとかって全然追従しないですか。
顔の表情とかって。
それでも逆に声の演技でストーリーに引き込むっていうことができている。
対してやっぱり表情とかがあまりにリアルだと、
それに合ったような声とかっていうのが、
逆にその微妙なズレがすごい違和感になっちゃうみたいな。
そんな感じなのかもしれない。
Mika Ueno
ズレは、例えばリップシンクできてないとか、
口の動きに言葉が合ってないとか、
そのリップシンクとか動きっていう点のズレ、
ディレイっていうのは多分ほぼなくて、
言葉に乗ってくる感情っていうんですかね、
その部分な気がするんですよね。
ディレイとか動きの一致ではなくて、
アニメとか3Dキャプチャーで、推察するにこんな、
今、情景だからこんな感情ってあるわけじゃないですか。
それの乗せ方な気がすごいするんですよね。
演技の言いたいわけじゃ全然ないんだけど、
すごい名優さんがシリアスなところやってても、
何でこんな棒読みなの?みたいに思うところがあるんですよ。
全然抑揚がないっていうか、
多分その名優さんは実写の映画になった時は、
多分動きとか顔の表情とか、
いろんなもので表現してると思うんですね。
その方が実写になった時のその場面と、
アニメとか3Dキャラとかにそれに声を当てた時っていうのは、
こんなにも違うんだっていう。
Nobuhiro Seki
それってよくロボットで不気味の谷とか言うじゃないですか。
あまりに人間近くなってくると逆に気持ち悪くなっちゃうみたいな。
それとちょっと似てるような人間のリアクションというか。
そうですね。
AIの聴覚と視覚の表現と人間の情報処理の差異
Mika Ueno
人間の脳が反応するところはここなんだなっていう感じがします。
特に私は声が好きだっていうのもあるんですけど、
全ての声優さんが素晴らしいってそういうわけじゃなくて、
本当に一流の人たちの演技が本当にすごいから、
びっくりしたんですよね。
その俳優さんとかとの違いっていうのはめちゃくちゃびっくりしたのは、
今作で特に思いました。過去から思って。
聞きたい音が入ってくる、注意が向く音が入ってくるっていうのは、
この作品もそうなんですよね。
この収録とか他のビデオ会議やってた時も、
背景の騒音で、例えば工事の音ですとか、
空港のザーッという音ですとか、
街の雑踏ですっていうところはまだいいんですよね。
でもそこから後ろに人の声が聞こえますとか、
オフィスの中でよくあると思うんですよ。
PCとかバーンと広げて全部音拾っちゃうみたいな。
あんな時に人の声が入ってくるっていうと、
その声に全部耳が入ってくるっていうのは、
普通の雑音とだと全然比べ物にならないぐらい
自分が集中できなくなっちゃうっていう経験で、
隙間もあるかもしれないですけど、
人の声が聞こえるように、
脳はできてるんじゃないかなって思う時はありますよね。
Nobuhiro Seki
なんとなくそのコア色でその人の表情とかも想像してますよね。
怒ってるんじゃないかとか、笑ってるんじゃないかとかって、
電話とかでも想像できるじゃないですか、多少は。
だからその想像してるものと実際に出てきてる表情が
ちょっとずれてるっていうのがすごい気持ち悪いじゃないかなって
ちょっとなんとなく思ったんですよね。
要するにアバターとかでも目しかありませんとかね、
こういうキャラクターですみたいになると、
それってあまりに外れてるから全然構わないんだけど、
妙に近くなってきたときに、
なんかすごいちょっとだけずれてるというか、
妙に近くなってきたときに、
なんかすごいちょっとだけずれてるってすごい違和感あるじゃないですか。
いつもと違う、だから逆に言うと、
この人いつもとちょっとだけなんか表情のズレが違うなとか、
だから嘘ついてるんじゃないかとか思ったりするわけじゃないですか。
だからなんかそういうことが逆に人間って
よくわかるようになってたりするのかなと思うんですよね。
ほんのちょっといつもと違うみたいな。
背景音もそうだと思うし、
Mika Ueno
声に乗っかってくるものとか人間の声の、
人間の脳の識別とかって結構大きいなっていうのを感じてるのと、
ついこの間人に教えてもらったんですけど、
日本のNTTが開発している日本語の大規模言語モデルのがあって、
それのシリーズ、tsuzumiっていうらしいんですよ。
Nobuhiro Seki
これ?
Mika Ueno
ローマ字でパンパンと叩く、
つずみのT-S-U-Z-U-M-I、つずみって書くんですけど、
それが一連のシステムになってて、
その中で聴覚、聴覚があるAIみたいな表現してたんですね、
ウェブサイトかな。
聴覚とか視覚があるAI。
何のことかなと思ってわからなくて、
説明のビデオを見たんですけど、動画を見たんですけど、
そこには、
例えば私がAIに話しかけるときに、
いやまだプレゼンテーション明日のできてないんだよね、
って言うとAIが答えると。
その答えのパターンが2つあって、
AIの聴覚と感情の理解
Mika Ueno
tsuzumiの感情、聴覚を理解するAIの場合は、
大丈夫ですよ、まだ時間もあるし、
うまくやればきっとできます、
っていうのを先に返してくると。
パターン2の場合は、
プレゼンテーションの場合は、
シンプルなタイトルをつけてアウトラインを何とかでみたいな、
至って真っ当なことを返してくると。
聞いてくれたらこれじゃないよみたいなね、
そういう答えだったらしいんですけど、
発話者の声のトーンに何が載っているのか、
っていうのまで理解した上で、
それを返してくるっていうことらしいんですね。
それがなんか聴覚があるAIって表現してたんですけど、
声に載ってるものが何かっていうのを理解するっていうのを
理解したときに、
ああなるほどと思ったんですけどね。
それで感情のトーンを音で聞き分けて、
Nobuhiro Seki
それに合ったようなのを返す、
そういうことなんですね。
そうそうそうそう。
ちょっと不安に思っている声とか、
Mika Ueno
抑揚がないですとか、抑揚がありますとか、
Nobuhiro Seki
そういうことでこの人、
やる気なんだとか、やる気ないんだとか、
そういうのを全部、
声色から察知するっていうのは、
それはtsuzumiのポイントなんですかね。
そうですね。聴覚があるっていうところが、
ちょっと聞かれたんで、
そこしかまだ見てないんですけど、
Mika Ueno
確かに今見ていると、
視覚と、
tsuzumiは視覚や聴覚といったモードであるんですけど、
Nobuhiro Seki
そういうふうに、
聴覚と、
tsuzumiは視覚や聴覚といったモーダルに対応し、
って書いてあるから。
Mika Ueno
そう、マルチモーダルっていうのをね、
標榜してますよね。
その声に乗っかってくるってやつは、
聴覚というか、
声に乗ってるものを理解するっていうのは、
ものすごい大事だと思うんだよね。
さっき言った、
音声によるコミュニケーションの重要性
Mika Ueno
特にボイスでやり取りする場合になった時は、
その人が何を言ってるのかって、
多分声のトーンで全く変わったりするじゃないですか。
こんにちはって言う時と、
こんにちはって言う時って、
全然違うと思うし、
プレゼンまだなんだよねって言うと、
プレゼンまだなんだよね、でもねって言う時と、
多分違うと思うので、
そこはすごく大事だし、
ポイントだなと思う一方で、
これってものすごい文化的なというか、
その言語が持ってるコンテキストを、
すごい入っているコンテキストのものを、
理解した上でのことになるから、
すごい情報量だろうし、
全世界で共通っていうのは、
そんなに多くないんだろうな、
っていうのは思いました。
各言語で、各地域で、
言語を使われている感情というか、
表現というか、
そういうのがあった上でのことだと思うんで。
Nobuhiro Seki
そういう感情とか、
文化の差みたいなやつって、
言語の文化的な差異による評価の難しさ
Nobuhiro Seki
統計とかにも出るじゃないですか。
よく調査してて、
日本人は、例えば、
満足度が最低ですとか、
よく出たりするんだけど、
それって、
ネットプロモータースコアとか、
日本ってすごく低く出るんですよね。
ネットプロモータースコアだと、
10か9じゃないと、
日本人って普通に出ると8付けるから、
そもそもプラスにならないとか、
っていうのがあったりとか、
だから、そういう評価って、
実はキャリブレーションしないといけないんじゃないの?
キャリブレーションしない状況で、
やっぱり比較しちゃうと、
極端なものを付けないっていう、
カルチャーの場合は、
極端なものを付けるところに比べて、
数字が出にくいよとか、
でも、やっぱり国際的にバーンと、
比較すると、
国ごとによって違うのは、
そういうのはだいたい考慮されずに、
それって本当に、
意味がなくはないと思うんだけど、
実際に比較するときに、
どう比較したらいいのか、
みたいなところはまだ、
やらないといけないところがあると思うんですけど、
このまさに音声、感情とか、
そういったもののマルチモーダルごとの、
評価の仕方とかっていうのも、
同じ英語だと多分、
アメリカとイギリス全然違ったりする、
みたいなところもあるんで、
これって、
多くすればするほど、
丸まっちゃうじゃないですか、
でも、すごい特化したときに、
それとそれじゃない、
その対象とその対象じゃないところを、
どうやって比較するのか、
Mika Ueno
そういうところがね。
そこはありますね。
ちょっと前にマーケットの友達と、
NPSの話をしてて、
NPSのネットプロモータースコアで、
よく皆さんアンケートとかやると思うんですよ。
これをU字に進めたいですか、
1から10みたいなね。
10が最高、1が最低。
基本的には、
9と10をつけないと、
マーケットを知ってる人とか、
マーケットの人たちは大体全部、
悪くないんじゃないって言ったら、
全部9から10つけるんですけど、
日本人は必ず真ん中から、
ちょっと上ぐらいしかつけないと。
それは本当にそうで、
これのチューニングは必要だよね、
っていう話はしたりしてましたね。
多分やってるところもあると思います。
さらに前だと、
アップストアとかの評価もそうで、
自分が働いていた前の会社とかだと、
日本はとにかく、
星1個低く、
1個か1.5個とか低く出る可能性はあって、
文句がある時しかコメント書かないとかね。
だから評価を低く出る傾向があるっていうのは、
よくあった話で、
そこは、
北米の本社とかでも、
他の地域とかでも、
ほぼ常識になりかけてたんですよ。
ジャパンはちょっと低く出るみたいな感じで。
そこはちゃんと、
通常のエネルギーの何倍もの強さで
説明していかなきゃいけないので、
ものすごく骨折れるんですけど、
ユーザーの傾向っていうのはありますね、
すごくね。
あとこれは評価じゃなくて、
普通のコミュニケーションもそうで、
アメリカとか北米の人とか、
他の地域のヨーロッパとか、
ああいう人たちと話す時も、
普段の自分の自信とか、
あと元気っていう、
これが例えば自分が100%ですごい元気って
思っているところの倍以上の
エネルギーで話さないと、
今日何か調子悪いのとか、
彼女はどうしたっていう風に言われてしまうので、
自分の倍の元気で、
っていうのはすっごい疲れるんですけど、
そういう普段のコミュニケーションが違う
というのはありますね。
それも声とかボディランゲージとか、
そういうものにいろんなものが乗ってるからだと
Nobuhiro Seki
思うんですけどね。
前、結構前にこの話、
ちょっとここのポーズキャストにも
したかもしれないんですけど、
ザ・カルチャーマップっていう本があって、
国によって、
この本だと10個ぐらいパターンがあって、
要はトップダウンか、
ボトムラップかとか、
直接的に批判するか、
なんかそういういろんな、
国によってパターンが違いますよね。
ハイコンテキストですか、
ローコンテキストですか、
っていうんですけど、
その本の結構冒頭に出てくる、
こんなことが複数の国をまたがってありますよ、
っていう例として出てくるのが、
フランス人のインターンか、
なんか若い人が
アメリカ人の上司について
なんか仕事をしていて、
で、仕事があれでいくと、
まあ、
フィードバックするじゃないですか。
で、フィードバックしたときに、
この上司の人は確かね、
インシアルのプロフェッサーか何かなんですけど、
もともとアメリカ人って今、
フランスか何か住んでるんですけど、
そういう国際、
マルチナショナルな国の
エグゼクティブとか、
そういう人たちのコンサルをしてる、
って感じで、
で、実際にあった評価っていうのは、
さっき言った、
インシアルのプロフェッサーとか、
で、実際にあった評価っていうのは、
さっき言った、
アメリカ人の男性の上司と
フランス人の女性の
ジュニアの人があったかな。
で、どういう評価かっていうと、
両方に、
そのコンサルの人にインタビューしたら、
上司は、
直してほしいことがいっぱいあると、
部下の人にね、
って思って、そういうふうに伝えました。
でも、部下の人に聞き取り調査をしたら、
すごい、
上司が私のことを買ってくれて、
っていう、そういう評価で、
もう評価が全く逆になった。
Mika Ueno
全く違うんだよね。
Nobuhiro Seki
で、どういうことかっていうと、
アメリカ人って、
本当に言いたいことを最後に言うじゃないですか。
最初すごい褒めて、
あなたこういうこといいですね、
いいとこすごい言って、
で、最後にレトリック上、
バッとしないんだけど、
最後に言いたいことが出てきて、
特にシリアスで
ヘンガティブなことって後に思ってくるんですけど、
フランス人って逆らしいんですよ。
ダメなこと、あなたこれはダメだ、
っていうようなことを言うらしくて、
フランス人からすると最初にすごい褒められたから、
もう後の方聞き出ません。
もうこの上司は私の最高に買ってるって思いました。
で、上司はあれだけ伝えたんだから、
100%伝わってるはずだって言ってるわけですね。
要するにこういうの直してほしいっていうのを、
すごいもう、
ちゃんと伝えた、
あれだけ言って分からなかったら、
俺どうすればいいんだみたいなことを思ってました。
でも実はそれって、
説明の仕方のレトリックじゃないですか。
文化の差だから、
みたいなことが頻繁に起きますよね、
みたいな話をしてて、
昨日とかも、
タクシーとかウーバーみたいなやつで、
最近ここ数年ニューヨーク、
テスラYしか走ってない、
全部電気自動車っていう、
ニューヨークローカルの
ウーバーみたいなやつがあるんですけど、
それに乗ったら、
終わった後の評価で5段階あるんですけど、
5段階で一番上は
インクレでも書いてますね。
グレート。
グイッとグレートみたいな会だって、
言葉と表情の違い
Nobuhiro Seki
星が何もなく1から5個だと、
よっぽど文句無い限り
5でするわけですよね、こちらもね。
4とか3くらいの、
4とかになると既に
ドコをインプローヴしたいですかって聞かれちゃうわけですよね、すでに。
そうですね。
だから基本的に文句無かったら5じゃないですか。
でも
インクレでもって書かれちゃうと、
インクレでもグレートグッドとかになっちゃうと、
ちょっとこの人
Mika Ueno
インクレでもbeatないよねみたいな、
Nobuhiro Seki
要はかも無く不可も無くだから、
要は可もなく不可もなくだから普通のウーバー基準だと5なんだけど
ちょっとこの人そこまでじゃないよね普通のナイスドライバーだよねって思った時に
これって4か3をつけろって言ってんだよねみたいな形容詞で言うのを感じたりしまして
これで5をつけるって結構難しいよねとか思ったんだけど
でもこれアメリカ人関係ないのでビッと押したりするのかなとか言うのあって
すっごい悩んで5、4ずっと行ったり来たり行ったりして
Mika Ueno
とりあえず5にしたんですけど
Nobuhiro Seki
でもなんかねすごいそういう感じましたね
Mika Ueno
ちょっとだけここの部分はあんまり言わないから少しだけぼかしておこうなんていう感じで
1on1の面談例えば人事の人とかとの面談で
とりあえずポジティブに見せた方がいいし特に問題ないよみたいな感じで伝えた方がいいんだけど
ここの部分だけちょっと控えておこうかななんていう感じで日本人が望んだら
それがだいたい伝わるんですよね
そうするとシーワーズのリザーブだとか言われちゃうわけですよ
全然私はそんなこと言ってないのに
ああそう伝わったんだみたいな感じはいろんな失敗度がありますね
Nobuhiro Seki
ここだって部会でも言われますからねリザーブって
Mika Ueno
本当?
やっぱりあるんですよね出ちゃうんですよねそこのとこね
少しだけでもカバーしておこうとかっていうように思うと
言葉とか多分表情とかいろんなものにそれが乗っかってくるんだと思うんですよね
だからここは言わないでおこうじゃなくてここを喋ろうっていう風に意識をそっちに持っていくと
多分いいんだろうなちょっと演技っていうかねそれも入ってくるんだと思うんだけど
Nobuhiro Seki
だからそれもそのフィードバックしてくれてる人はアメリカ人じゃないんですよ
だからアメリカ人だとこっちもアメリカ人と思ってやるじゃない
でも国がいろんなバックグラウンドがいるから微妙にその外国人でアメリカに暮らしてる人とか
外国人で日本に暮らしてる人とかそういうパターンが僕の部下の方が多いんで
だからストレートにその人もパターンじゃなくてこっちもこっちで
この人はどういう風に言ったら彼女彼的な感じで僕の言ってることが伝わるのかって
こう考えながらこう喋ったりするんで
それが合わない時とかっていうのはなんか全然上手く伝わらない時とかも多分あると思うんですけど
Mika Ueno
笑い取る時なんか多分めちゃくちゃ苦労するでしょうね
それこそコンテキストが分かってないと笑いにならないっていうのがいっぱいあると思うんですよ
映画とかなんか特に翻訳者さんのインタビューかなんかで読んだことがあります
ジョークとか笑いの時がすごい大変
しかも文字数とかね伝えるタイミングが間が決まってるから
Nobuhiro Seki
だから笑いがずれる時ありますよね
笑ってるタイミングが先に日本人が笑ってその後英語
外国人が笑うとか逆のパターンありますよね
ここまででもコントロールできないですよね
Mika Ueno
それが違いが言語の違いと文化の違いであって
グローバルにはならないっていうかそこでなる必要ないと思うんですけど
Nobuhiro Seki
それはやっぱりその言葉の言葉で理解しないとやっぱりそこは埋められないですよね
Mika Ueno
そうですね本当そう思います
Nobuhiro Seki
言葉だけじゃないですからね文化もね
ロンドンに留学してた時にプログラムマネージャーの人はアメリカ人でした
10年ぐらいしてたんですね
でプログラムの中で1日体験でコメディースクールに1日体験するっていうのがあったんですね
それってアントリプレナーシップスクールだったんですけど
要はプレゼンテーションの資格とかそういうのを学ぶために1日コメディースクールに入るってなって
それはなんかエグゼクティブクラスでもいくらしいんですよ
で結構すごい高いのやつが行けるんだから絶対行った方がいいって言われて
普通にやると1日50万とか取られるらしいよみたいなこと言われて
それラッキーと思って行ったんですけど
アメリカ人のプログラムマネージャーと話したら
いやもう私も10年いるんだけど
なんでここでみんな笑うのかわからないんだよねって言ってて
Mika Ueno
笑いのコンテキストね
Nobuhiro Seki
だからその笑いのコンテキストがわからないから
もちろん言葉で笑いにしないようにするのもあって
言葉を発せずにこれを表現してくださいとか
ジェスチャーと何とかだけでこれで笑いを取ってくださいみたいなやつもあるんですね
やっぱり言葉だけでは伝わらないっていう中で
どうやってエグゼクティブとして演技をしましょうみたいな
そういうところもあって
そういうのがあってそれはそれで
イギリスもねいろんなカルチャーの人がいっぱい来てる場所でもあるんで
多様性とコミュニケーション
Nobuhiro Seki
そういうことを意識してやってるんだ
イギリスとアメリカで既に伝わらないんだから
それは普通に言葉で言ったら伝わらないし
笑いも伝わらない
でもやっぱりそれをどうやってなるべく伝えるようにするのかって
大英帝国は考えているんでしょうねとか思いながら
授業を受けてました
楽しいですよね
最近ペーパルの本が出たんです
1年ぐらい前だと思うんですけど
ペーパルってどんな2年3年だったかって
そんなディテールに書いてある本はなかったんですけど
その本がすごいディテールが書いてあって
その中で結構外国人の人もいるわけじゃないですか
イーロン・マスクもそうだし
デイビッド・ザック南アフリカ人だったりとかしてて
なんで外国人がアントレプレナーとして強いのかっていうと
今みたいに何もコンテクションが通じないところで
すごい苦労をどうやって解決していくのかっていうのを
いつもやってるじゃないですか
いつもやることになるじゃないですか
まさにさっきの通じないとか
通じないけど誰も助けてくれないみたいな局面がすごく多くて
解決していくっていうのは
新しいチャレンジに対して
一瞬に対して自分なりにいろんなパターンを
なんとかして解決していこうっていうのとすごい似てるから
それは外国人がやっぱり外国に暮らして
そこで新しいことをしましょうっていうのは
既に日頃の生活の中でそういうことをやってて
蓄積がある人とそうじゃない人にやっぱり差があるのは
当然なんじゃないみたいなことを書いてあって
コミュニケーションの中でやっぱり
ちょっと無理やり自分のスタートアップの話になっちゃうんだけど
企業ってやっぱりそういうもんだよなってちょっと
今までコンフォートゾーンじゃないところに入ってくるわけですよ
基本的に
それは今言ってたいろんなパターン
なんかすれ違い
不気味さ
気持ち悪さ
みたいなものをどうやって
折り合いつけて
それなりに対処していって
そこそこの結論を出すのか
そういうのに近いんだろうなっていうのをちょっと
なんかやっぱりハイコンテキスト日本だと
なかなかそこっていうのを
そこに入っていくのを良しとしないっていうのは
それはね
入っていかなくていいんだったら
入っていかないほうがいいわけですよ
楽だもんと思ってて
Mika Ueno
共通にできる土台が多いですからね
文化とかそういうところがね
でもこれからまたいろいろ
多様性とか言われてるんだって
いろんな人たちも
国の人たちも
文化の人たちもいるから
緩やかに変わってくるんじゃないですか
アメリカほどガーンっていう
かわいかったとかじゃなくて
緩やかに変わっていくんじゃないかな
とも思いますけどね
Nobuhiro Seki
多様性ないと楽ちんだし
すごい良いと思うんだけど
これはよく
疫病の発生とかのパターンじゃないんだけど
大多数が持っているものが
本当に価値が崩れるときに
全員総崩れになっちゃうんじゃないですか
ダイバーシティあると
普段はすごい効率悪いんですけど
ニューヨークとかもすごい効率悪いんだけど
何か起きたときに
99%それに負けるみたいな人はいない
そういうオーディエンスないんですよね
みんなバラバラなことやってから
その人たち全員に
悪影響を与えられるようなものって
そんな多くなくて
このパーティーには
すごいネガティブに働くけど
このパーティーは
あんまり影響を受けませんよ
みたいなやつが結構多いから
多分生き残りやすい
新しいものが来たときに
生き残った人たちが
ガーッと伸びていくっていうことができる
日本だとやっぱり
全員がうまくいってるときは
ずっとうまくいってるけど
全員の人たちに対して
ネガティブなやつが来ると
全員倒れちゃうみたいなのがあるじゃないですか
なんかそれがバブル
すごいもう俺がやったこと
全部当たったみたいな感じで
ワーッと来てて
すごい急に伸びてて
でも世の中が変わったときに
そっち側のパターンは全く誰一人
想像してませんでした
で急にダメになるみたいな
いうのがやっぱりモノカルチャーのところでは
起きやすいんだろうなと思います
Mika Ueno
もう一個ね今ね
音の重要性
Mika Ueno
途中で思い出して
入れる場所ないなと思ったんですけど
とりあえず言うだけ言っといていい?
音のね人間の脳が
聞きたいものを聞くっていう
話に関連なんですけど
別に声だけを聞きたいわけではなくて
音で判断してることって
すごい人いっぱいあって
もうなくなっちゃいましたけど
ホロレンズってあったじゃないですか
マイクロソフトの
ホロレンズのチームが
カンファレンスで一番最初に
そのUIとか発表してるときに
開発者の人たちが
すごい強調してたのが
音をめちゃくちゃ大事にしろ
って言ってたんですよ
ビジュアルの表現も
きれいな表現も
もちろんそれも大事なんだけど
これを動かすときに
例えばカチッとする音とか
何かを触ったときの音とか
音で表現するものが
この3D空間の中では
すごくポイントになるから
そこにめちゃくちゃ気遣え
みたいなことを
プレゼンティベロッパーカンファレンスかな
音のフィードバックと感覚
Mika Ueno
で言ってるのがあって
へーとか思ったんですけど
で実際自分が3D空間とかで
体験してみると
確かそうなんですよね
ボタンを押すっていうときに
何の空間をただ
手をパカパカしてるだけだから
何のフィードバックもないわけですよね
触覚の
そこに音がカチッと入るとか
なんかビジュアルでは
平面を押したときに
指がそこに吸い付くような感じが
するだけでも全然違うじゃないですか
そこで音が
人間の脳が規定してる
音のフィードバックっていうのが
必ずあるなっていうのを感じたので
後になってようやくさ
アフロレンズの人たちに
言ってたのはこういうことなんだ
っていうのを思いましたね
あとゲームとか映画とかの
効果音でも
実際にはほぼ聞こえないんだけど
すごい大げさに出る
効果音ってのがあるらしいんですよ
ワイヤードの前
プロだけど
なんか聞く音あるみたいな
動画で言ってたんですけど
例えば手を握るときに
手を握るときって
音ほとんどしないじゃないですか
そのだけだけど
ギューッと音するのあったら
すると思うんだよね
ゲームとか
あと銃を取り上げるときの音とか
あれもほとんどしないんだけど
結構大きめに入れてるとか
っていうのを裏側やってて
あーなるほど確かに
って思ったんだよね
面白かったって話ね
Nobuhiro Seki
音はねすごい
僕今ちょっとね
左耳があんま聞こえてないんですよ
大丈夫?
ちょっと難聴なんですけど
昨日
子供の持ってるGPSのトラッカーが
見つからなくて
家の中にあるってことが分かって
もう大体どの辺にあるか
分かったんですけど
だからもう音を鳴らして
ピーって鳴らしてたんですけど
初めて今片耳しか聞こえないから
この一角で鳴ってるって分かるんだけど
どこか分かんない
あーそう
Mika Ueno
だからこうやってやって
Nobuhiro Seki
こう動かすときも
五次元の方向しか分かんないですね
だからこっちの方にやって
こうやってやると
聞こえなくなるんだけど
それって物が一個
裸で出てるんだったらいいんだけど
服の中に入ってますみたいな感じだと
当然音が反響するじゃん
だからその反響で
3Dでどこにあるのかっていうのが
片耳だと分かんないんですよ
Mika Ueno
あー本当に立体音響のやつですね
そうそうそう
Nobuhiro Seki
ステレオの左右だと
Mika Ueno
奥行きとかあるんでしょうね
Nobuhiro Seki
そうだから目の時も片目だと
奥行きが分かんないって言うじゃないですか
でもだから完全に耳もそういう風になってて
だから結局分かんなくて
片方だけで探すんですか
できる限り見つからなかったんですよ
でそれを閉まった
そのベビースタイルの人が
閉まってたはずっていうか
知ってるだろうと思って
電話して
ないんだけどこの辺りなんだけど
どっか覚えてないって話をしたら
あのジャケットの胸ポケットです
って言われて
でこうやって出したら出てきたんですけど
それ鳴らしても見つからない
Mika Ueno
あーそう面白いですね
リアルな体験とデジタル体験
Nobuhiro Seki
そっから音がこう
いろんなところに反響しちゃってて
複数から取れないじゃん
複数じゃないから
一方向だと反射の方が大きく来たら
そっち聞こえちゃうじゃないですか
でも複数反射があったら
多分立体の位置が分かるんですよねきっとね
Mika Ueno
立体音響とかねそれで
最近収録してくれるポッドキャスターさんも
いたりとかするじゃないですか
その時に鳥が
左奥から聞こえてくるっていうのとか
そういうの本当に
あれね歩きながら聞いてると本当危険なんですよ
現実世界とあれ?と思ったりとか
車が通り過ぎる音とかもすごい
奥行きとか距離感が分かると
すごいなと思う
でも話してる人の声は
自分の脳の真ん中から聞こえますよね
あそこだけがね
なんか前方から聞こえてきたりとか
っていうのはあったりするけど
でも収録する時はマイクの中心に声があるから
その通りだな
その通り再現されてるんですけど
Nobuhiro Seki
音はね
昔からねそのまさに
ここに聞こえるんじゃなくて
ここに聞こえるようにするっていう
テクノロジーとしてはあるけどやっぱり
そんなにずっと疲れてなかった
音はね本当にその
サラウンドのスピーカーとかでね聞いてると
シアターモードにすると
いろんなところが聞こえるじゃないですか
でもなんか気がつくとやっぱりそういう場所に
自分を置いて聞くことがすごい減っちゃってて
一時期はねその
テレビ置いて
7.1だとかやってやったんだけど
結局気がつくと
普通のヘッドホンとかでやってると
ある程度の効果はあっても
そこまでの効果は得られないし
対応してないよね
そうするとやっぱりだからこそ
ホントのライブに行くとか映画館に行くとか
っていう体験と
それ以外の体験っていうのはすごい大きく
デジタルだからその
多分元のソースは一緒でも
そのアウトプットの仕方でやっぱり全然
体験が変わる
だからそこにやっぱり
お金を払うんですっていうのがやっぱり
この10年20年の流れなんですよねきっとね
Mika Ueno
感情が乗る声音からの
コミュニケーションの話ですね
Nobuhiro Seki
人と人のコミュニケーションから
文化と文化のコミュニケーション
34:29

Comments

龍が如くの話は、昔からある問題だ思います。例えば、ジブリ作品は声優さんではなく俳優さんを使うことが多いですが、明らかに声と画が分離しているのを感じますよねぇ。下手くそって言ったら語彙が貧弱ですが。龍が如くは見た目も実際の俳優さんに似ているので割と近い感じがしますが、声優さんには敵わないですよねぇ。単に練度の問題かとは思います。 ただ宮崎監督が俳優さんや素人さんを起用したのは声優さんだとアニメアニメしちゃうのでリアリティがないんだと思いますね。どっちがいいとかはなく、表現の問題のような気がします。

ジブリの声優使わない方針は一貫してて潔よさすら漂ってますが、ストーリーやキャラに没入できない(キャラが活きていない)という副次効果がかなりあるなと個人的には感じます。でもジブリ作品は大好きです。 持って生まれた声が良いだけでなく、人の心を揺さぶる表現ができる演者さんは本当にすごいなと思います。

Scroll