Joi Ito's Podcast、今週のお相手は?
よろしくお願いします。
いつ最初会ったかっていう、たぶん、具体的な日は分からないけど、時代は
30年以上前。
30年以上前。第一VRブームの時に、たぶん同じ仲間たちと一緒にいたので、
91年とか2年に、僕はMITの、今の僕の妹の旦那になってるんですが、スコットフィッシャーと一緒に
テレプレゼンスリサーチという会社を助けてて、それで日本に来て、日本のVR、AR業界と出会ったんだけど、
たぶんその時、べきもとさん、そこにもう入ってるわけだよね。
っていう、そこからいろんな接続点があって、今日に至るんですけども、
でも時間軸の逆で言って、今から始めて、ちょっと過去に戻っていくっていうパターンでいいかな。
東京大学大学院情報学館教授で、ソニーコンピューターサイエンス研究所のCSOを務める
べきもとじゅんいちさん。
先日、大歓山のクリプトバーで行われた茶の湯とテクノロジーのイベント。
作動と先端技術が開く新たな可能性の中から、その一部をお届けします。
うちの千葉高大の見学のメンバーの一人が西田喜太郎がいて、
西田さんがちょうど100年前ぐらいずっと日本の哲学を西洋に出そうとしてて、
特に彼の人生前半の方、結構前に入っていて、
彼の最初の本で純粋経験っていうコンセプトを出して、
これ英語でちゃんと説明してるんだよね。
これはフランスのフェノモロジスとかハイリガーとかって支わるんだけども、
多分AIに重要なコンセプトで、
シンボリーになる。
木を見て木だって思う前の木の体験っていうのがあるよねと。
この経験は一人一人が違う経験を常に生きていて、
毎回木を見るたび違うんだけども、
木を見たって言葉にしちゃうと全部同じになっちゃうので、
だからシンボリーになる前の純粋経験っていうのが、
これ瞑想だったり、
サブジェクトとオブジェクトを融合するノンデュアリティだとか、
それが人間としての一つの役割だよねっていうのを彼言うんだけども、
今のAIっていうのは、
シンボリーになった情報をモデルにしてるだけであって、
AIは経験してないんだよね。
だからAIからすると、
リアリティとバーチャリアリティの違いが分かんなくて、
人間が経験して、
その経験をコンピューターが分かる情報に変換するんだよね。
だけどその人間が経験してなければ、
コンピューターにとってリアリティってないんだよね。
だから人間がその純粋経験と、
情報のインターフェースが人間で、
シリコンバディで言うと、
例えばイーロン・マスクとか、
サム・オルトマンとか、
結構我々ってシミュレーションの中に住んでるかもしれないよと。
これもしかすると、
これ全部デジタルで、
僕らはただのプログラムかもしれないと。
で、その違いは分からない。
人間は。
信じてる人結構シリコンバディにいて、
でも絶対お坊さんはコンピューターの中にいるとは信じないよね。
AIの時代になったら人間いれなくなっちゃうじゃんって、
結構西洋の人たちが言っていて。
でも毎日がちょっと違っていて、
我々が経験したことによって何か感じて、
その感じたことが我々の理念だったり、
バリュースだったりして、
それがアートとか文化として吐き出されて、
それがコンピューターの中に入っていくと思うんだけども、
人間がその経験してなければ、
そのシステムのインプットないよねと。
っていうのが、
もしかすると人間の役割で、
そうするとその普通のコンピューターとか機械が、
見て分かんないところを、
人間が経験して、
情報にしなきゃいけないんじゃないかなっていう気がしたんだよね。
だから例えばAIがすごいきれいな絵を出してるんですけど、
AIはあれきれいとは思ってないんですね。
人間がきれいと思うという統計的には分かってるんですけども、
うわーきれいみたいな感動はしてないですね、
AIそのものは。
もしかするとAIが、
例えば料理作れるかもしれないですけど、
AIは味わえないわけです、最終的に。
だからそのパーセプションは、
人間の生き物としての臓器としてのパーセプションがあるので、
そのパーセプションの中で我々は生きてるわけですよね。
だからそれを完全にフェイクしたら、
そのシミュレーションの世界に入るかもしれないんですけど、
現実的にはデジタルできるものっていうのは非常に、
その中でも限られていて、
例えばなんとなく空気感とか雰囲気とかっていうのは、
まだまだ感覚として捉えられないので、
AIが作れる世界はツールとして使うのは素晴らしいと同時に、
それを見て自分が面白いと思うとか感動するとかって、
そっちの受け止める自分というのはやっぱり大事ですよね。
やっぱりその経験が文化になるんだよね。
去年の5月にアメリカとヨーロッパからVIP連れて伊勢神宮に行って、
中の方も入れてもらって舞いをやって、
そこで画角がかかって、わーって。
僕は日本のお正月とかいろんなとこで聞いてるから、
すごい感動しちゃって、もう涙が出そうになったんだけども、
外国人たち何人かにどうだったって、いやすごかったよね。
そう、なんかホラー映画みたいだったと言って、
音楽がなんかホラー映画みたいで、
悪意きたバージンたちがサクリファイスされてるような感じで、
すごいねみたいな感じで全く理解できてなくて、
やっぱりこの匂いもそうだし音楽もそうだけども、
育ってきた時の文脈でつながっていて、
全く文脈がない人からすると全く解析できてないんだなとか思ったんだよね。
だからさっきのレキモトさんの話じゃないけども、
その感覚的なコンテキストがないとわからないよね、たぶん。
たまたまちょっと今年プライベートで伊勢神宮行ったんですけど、
中心に何にもないのがすごい面白いですよ。
普通はこうなんかこう日本の真と中心だったらものすごいモニュメントがあると思ったら、
中心ある意味何もない。
で、そこに行くアプローチのみしかなくて、
要するに本質は自分の心なんですよ。
そこに行くアプローチという。
こないだ原けんやさんと対談して、原さんがすごいこと言ってて、
エンプティネス、ムってこれミニマリズムと違うんだと。
だからよく無人とか俺ミニマリストだと言われるんだけど、
ムっていうのは違うんだと。
で、ムはクイーンだとか言って、
そしてそのやっぱり静かにしゃべるとみんな聞きたくなるっていうこう引く力、
そして何にもないと何かが入ってくるっていうのが、
これとても日本の美学で重要で、
で、何でもかんでもこう言っちゃうのじゃなくて、
ムとエンプティの力でこう引き込む。
で、そこにやっぱり神社もこうエンプティ作ると、
もしかするとスピリットが入ってくるかもしれないっていう、
この感覚ってとても独特だよねっていう話があったんです。
でもそれも分かんないと思う。
マもそうだよね。
だから踊りとか音楽でも、
日本だとそのマのところが結構重要で、
そして結構西洋ってこの音符のヒットのところが、
音出てるところがキーだったりするけども、
日本って踊りだとかしゃみ線とかないところが重要だよね。
っていうこうそもそものなんだろう、
このパラダイムが日本って違うので、
でも今回のAIとかっていうパラダイムもだんだん解析できるようになってくるので、
面白いっちゃ面白いけど、
その元々のインプットが人間が新しいもの出していかないと進化しないよね。
そういう意味で現状は大量のデータ集めてるので、
割とやっぱりマというよりかマじゃない方のビットをすごく集めてるんですけど、
可能性としてはすごい将来日本的なAIが現れて、
じっと黙ってるとかですね。
ずーっと30秒間黙りこくるチャットGBTとかなんか偉そうな感じ。
そういうマを理解するとか、
何にもないことをずっと考え続けるAIって出てくる。
それは面白いかもしれないですよね。
言われてみると、どのAIもすごく自然で人間っぽいのに、
国民性やローカリティというものは、
ほぼ排除されたクリーンな状態で存在していますよね。
それもそのはず。
AIの国別開発ランキングを見てみると、
アメリカがダントツの1位を確保。
その後には中国、シンガポール、イギリス、フランスと続きますが、
細かく見てみると、1位アメリカと2位中国は
投資やイノベーション、実装などで
大きく引き離されていることがわかります。
現状、私たちはアメリカの企業が開発したAIを
日本語にして使っているということ。
もう少しローカリティが反映されるようになると、
テクノロジーにも幅が出てくるのかもしれませんよね。
AIセーフティのカンファレンスが横浜であって、
やっぱり西洋と東洋の人たち、ほぼ真逆で、
西洋はやっぱりAIは道具で、
道具が無限に頭良くなっちゃうと、僕ら滅びる。
ある国のお金を出す機関のトップの人とその後ご飯を食べたんだけど、
10年でスーパーインテリジェンスが出る確率は50%。
出たら人間が完全に滅びるのは50%。
したがって10年以内に人間がAIで滅びる確率は25%で、
自分は今一生懸命お金を使って、それで人生設計しちゃってる人。
我々の仲間ではこれがコンセンサスだと彼は言っていて、
西洋って神様がいて人間がいて、自然とか道具があって、
自然の中に奴隷も入ってるんだけども、
やっぱり奴隷に乗っ取られちゃうっていう経験とかも、
結構西洋ってそもそもキリスト教もそういう世界なので、
だからやっぱり奴隷になってるAIはとにかくコントロールしようっていうので、
自立させちゃいけないっていうのが結構西洋のAIセーフティーの核にある。
中国とか日本で栗原先生って慶応の先生がすごい面白いこと言ってて、
ロボットがおもてなしをしてほしいと。
滅びそうになったらロボットに救ってほしいし、
おもてなしっていうのは自分が分かんないことを先に分かってくれてやってくれるのがおもてなしで、
命令に従ってるのはおもてなしじゃないと。
したがっておもてなしのロボットっていうのは自立しないといけない。
自立して我々のことを愛して、我々と一緒に生活する後みたいなのが大事だと。
だからその西洋はコントロールして人間の下にいるっていうのと、
東洋の人たちはとにかくその日本のホスピタリティの美学をちゃんと教えて、
人間社会の中で一緒に暮らしましょうっていうちょっとサイエンスフィクションっぽい話で、
全然違うんだよね。
この間アメリカのシリコンバリーの回でも同じような話があって、
とにかくコントロール失わないって言ってて、
お前らのこと信じてないからお前らがコントロールしてても嫌だよねみたいな話になって、
結構今コントロールしてる人たちもちょっと怖い人たちが多いので、
なんかねここもすごく哲学的に違うような気がするんだよね。
アレクサってアレクサプレイミュージックとか必ず自分が命令するじゃないですか。
おもてなしだとあれですよね。ちょっと曲でもかけましょうかみたいな。
もうちょっとこうバックグラウンドにいて。
静かな感じだけどもなんかやってくれるとかって感じですよね。
でも日本人そういう人の方が多いよね。
こうなんか仕切って命令するよりも。
うちの奥さんアレクサ嫌いらしいんですよ。
なんでアレクサと言えばいいんだったら知り合いじゃないからとかって言ってて、
よく謎のこと言ってるんですけども。
だから物に対して命令するって行為が暮らしの中にあるのがあんまり美しくないみたいな、
よく言うとそういう感じかもしれないです。
おもんばかっているとか、日本的に言わなくてもわかるとか、
あるいは言いすぎるから逆に言うと物質圏になるとか、
そういう感じありますよね。
非常に高度な環境の認識をしていることで、
要するにエクスプリシスなコミュニケーションがなくても、
心地よいことが続いていくというのが多分理想なわけじゃないですか。
だからそこは今のAIの設計方式が割とデータから取るって方針なので、
その日本的なロボティックスの人とかが、
ラージランゲージモデルの巨大なコンピューターを持つと、
そういうのは割とできるかもしれないですね。
ちゃんと間が分かっているチャットGPTとかが。
空気が読めるっていうことだよね。
結局だから西洋っていうのは全てじゃないけど、
どっちかっていうとトップダウンで命令系で、
ストラクチャーされた最適化が多いよね。
とにかくお金と物だけ増やすために最適化するっていう感じで、
ワノビってもっとふわっとしてるよね。
非真面目。
西洋って意外にクソ真面目だよね。
とにかく最適化のためにできる限りムダを切って、
バンバン強くなるっていうのがあるけども、
非真面目な話、説明してくれる?
有名なのは、不気味の谷っていうのを提唱したのが森先生ですね。
ロボットが中途半端に人間に握ると気持ち悪いっていう。
その先生が非真面目に進めって書いていて、
それが真面目でもない不真面目でもない境界領域みたいなところで、
でもサイエンスって多分非真面目じゃないとできないですよね。
真面目な人は多分あんまり新しいものを見つけないし、
不真面目な人はあんまり元々そういうサイエンティティをできないから、
真面目におかしいことをやるとかっていうところかなと思いますね。
いくつかの面白いのがあって、
やっぱり役に立つ発明っていうのは半分は探してて出てきたものじゃない。
メディアラボの時もかなり自由な研究で、
やっぱりこれを探してるんだけど、
途中で何かあったらピボットできるっていうリサーチをやろうとしていて、
で、結構国のお金ってマイルストーンが決まってて、
もう行き先が決まっててそこじゃないところにたどり着きそうになったら、
お金が切られちゃうっていう感じで、
非真面目ってちょっとそこはあると思うんだよね。
セレンディピティとか、
結構車運転して目的のことしか考えてないと道端の花が見えないっていうのと、
地面に100ドル札が落ちてて、
それを見て拾うためにはやっぱりちょっと視野が広くなきゃいけないのにもつながると思うんだけども、
その偶然性がなくなるよね。
全く真面目になっちゃうと。
だからプランするとラッキーになれないとかね。
実はクランツバーグって人が言ってるんですけど、
発明は必要の母っていう言い方なんですよ。
普通は必要は発明の母じゃないですか。
必要がネセスティとかあって、
その解決策考えるんだけど、
なんか分かんないけどできちゃったっていう時に、
それの使い道が出てくるみたいな。
実はコンピューターってほぼそうで、
スマートフォンでTikTokやるなんていうことはですね、
多分ITの最初の通信の研究誰一人持ってないわけです。
だけどスマートフォンが出てくると、
必要というものが逆に作られて、
文化が出てくるので、
実はその役に立つっていうのは、
一つの方向にしか過ぎないです。
最近言ってるのは、
役に立つは全然バリューじゃないですけど、
欲しいかどうかは割と学生に言ってるのが重要かなと思うんですよ。
これ欲しいとかこれ欲しくないってありますよね。
役に立たないけど欲しいって世の中にめちゃめちゃあるんですよ。
アート作品って当然そうだし、
ゲームとかでもゲームって役に立つとは言えないけど、
欲しい人多いので、
世界の産業の中で役に立つっていうことだけで測れるものじゃなくて、
欲しいか欲しくないかっていうことで測れるものが非常に大きいんで、
欲しいって人間の割と原始的な感覚なので、
よく言うようなお金を払っても欲しい、
ただなら欲しい、ただなら使う、
ただでも使いたくない、
お金を払っても使いたくないみたいになります。
最後のお金を払っても使いたくないって研究が結構世の中に多いので、
私お金払うからそれ使わないで進みたいっていうのが多いので、
できたらお金払っても使いたいだけど、
でもただでも使いたいくらい結構実は重要です。
人間にとっては。
自分の時間をそれに使えるので、
オープンソースとかでもそうですけども、
ただだったら使いたいまでテクノロジーがいくと、
それは結構人間にとって大事なところかもしれないです。
商品やテクノロジーの開発について、
れきもとさんは次のように語っています。
まだ役に立たないけどみんな一生懸命やってると思うんで、
だから役に立つのが見えてからベンチャー作ったり、
お金を投資して形にするのがあるんだけども、
役に立たないけれどもやる資金だとか余裕っていうのは必要だと思うんだよね。
だからソニーはいろんなところで稼いで、
CSFで役に立たないこといっぱいさせてくれるっていう、
大企業ありだと思うんだけども、
やっぱり大学も応用も大事だけれども、
役に立たないところも大事なので、
そこら辺の社会の設計とか研究の設計も大事なような気がするけども。
なんかその研究者の最初のモチベーションがありますね。
好奇心とか。
なので役に立つとかお金になりそうだっていうのもあるんですけども、
なんかとてつもなく取り憑かれてる人もいますよね。
ジョージア工科大学のサット・スターナー先生って、
元メディアラブ出身の、
ウェアラブルコンピューターのすごい世界的経験者の人がいて、
ずっとメガネつけてるんですよ。
昔はこのでかかったの、今は結構ちっちゃいのつけてて、
でもそれは40年間ぐらいずっとつけっぱなしらしいんですよ。
私にとってもウェアラブルコンピューター全然もう来てると。
完全に来てると。
ちっちゃいのこういうのでカチカチカチカチってやると。
OKみたいな。
ビジョンプロみたいな、あれはでかいからダメとか言ってましたけども、
ちっちゃいウェアラブルコンピューターは好きで、
本人は本当にそれが好きなんですよ。
そういうことが当然役に立つ研究にもできるし、
コミュニケーションになるんですけども、
基本的には学生時代からそういうデバイスを作ってるのが、
流れ流れて今大学教授になってるみたいな人がいて、
そういう原始的な興味のどのぐらい追求するかってありますよね。
最近何やってるんですか聞いたら、
なんとイルカの研究してるって言って、
え、なんですかって言ったら、
イルカの声をAIで分析して、
イルカが喋るかどうかみたいなのやってるんですよって言って、
なんでそんなことやってるんですかって言ったら、
それも基本的には面白いからなんですけども、
役に立つ説明はいくらでも作りあえる。
サイエンティフィックにも価値があるし、
例えばイルカとかそういうのにコミュニケーションすれば、
ちゃんとこっちの方にちゃんと行きなさいって命令ができるようになれば、
海洋生物なんかのコントロールができるっていうのもあるんですけども、
基本は好きだっていうか面白いからやってると言って、
その役に立つ役に立たない次元の前に、
やっぱ面白い面白くないとかっていうレイヤーで物事が進められるところが、
やっぱ全然ないと面白くないです。
で、れきもちさんは何が面白くて今やってるんですか。
なんかそのジャックインみたいな人間の感覚が没入するのも面白いし、
あとサイレントスピーチと言って、
全然喋んない、声出さないんだけどもコミュニケーションできるっていう技術もやっていて、
それもAIと直結できれば面白いかなと思ってますね。
なのでそういうインターフェースの変なやつは常に興味はあります。
ARとVRはだから30年ぐらいずっとやってるわけだよね。
今どんな感じ?
Apple Vision Proはちょっと高いけどだいぶこう…
ヘッドマウンディスプレーっていわゆるこういう、
ジャロン・ラニアとか始めた人たちはApple Vision Proが最終回答のような気がして、
それでも売れないってことは人類はあれはあんまり好きじゃないんだなっていうのが
なんとなく分かってきてしまったみたいな。
もっとすごいちっちゃなメガネみたいなとかありますよね。
全然違うタイプが来るかもしれないんですけども、
こうやってがっつり被るのはお仕事としてやる人しか使わないんじゃないかなみたいなのはちょっと思ってますね。
昔は、いやこれはまだこれから先があってまだ画質が悪いけども
こういう先にVR世界あるんだよって言って、
まあずっと30年くらいやったんですけど、
今もう全部8Kだし綺麗だしディレイないして、
まだまだっていうことがほぼ答えは出てるんだけど、
でもやっぱり欲しくないんだなっていうのが、
ちょっとその辺が難しいですね。
でも買った?
個人で買いました。
研究費じゃなくて。
Macプラスが出たときに個人で買ったんですよ。
平社員の頃なんすか。
もう貯金はたいて。
自分で買わないと絶対ダメだと思って、
自分のコンピューター、サイエンティスト、
会社の研究費で買うんじゃなくて、
僕も自分で買って、
どのくらい買って愛するのかなっていう。
そうそうますね。
でもあの恐竜のデモあるじゃない。
あれ結構よくできてるよね。
ああいうデモの種類にして。
だからVRやったことない人に見せるのにはいいおもちゃとして、
見るべき人には見せるっていうツールに使ってるけど、
日常的にまで使わないよね。
だいたいみんなやると、
あ、すごいすごいって言うんだけど、
30分間で、
あ、もういいですって、
取っちゃうから。
だからそこが、
スマートフォンとかだったら何だかんだで毎日触ってるじゃないですか。
毎日触りたいものと、
そうじゃなくて30分くらいちょっとさっき言った、
お金払っても取りたいみたいな感覚になってくっていうのは差があって、
それは多分でも人間の構造上、
最近言ってるのはスマホって石器なんですよ。
石器時代ってみんな手に石器持って、
こうなんかこうやったり削ったりできたわけじゃないですか。
人間っていうか、
ホモサベスもっと直立源氏みたいな。
そのくらい300万年くらい前から我々ってずっと手に何か持ってやってるんですよ。
手に持って何かやって、
道具でやって世界切り開くっていうのを300万年くらいやってるので、
これ好きなんですよ、スマホは。
だから石器なので手に道具持ちたいんですよ。
だけど頭に被りたいっていうのは、
宗教的な特殊要因じゃないから被んないじゃないですか。
だから全然ホモサピエンスとしての接触点が違うんですよ。
だから頭に何か被させようとするのは、
よほどのすごいドライブフォースがない限り被んなくて、
それは例えばヘルメットとかですね。
ちなみにオートバイのヘルメット市場とHMDの市場は、
まだオートバイの方が多いんですかね。
だからあれは被んないと死んじゃうから当然被るわけじゃない。
だからあの市場なんですけど、
それを越すのは結構壁かもしれないですね、ヘッドマンディスプレイが。