生成AIの真のパワーとは何か
CS Harmony Radio の番外編をやっていきたいと思います。よろしくお願いします。
お願いします。
はい。今回番外編ですけど、どれくらい前ですかね?
生成AIの話を半年以上前…
しましたね。
しましたね。ちょっと待ってくださいね。
約半年前ですね。
半年前くらい、ちょっと触れましたけど。
チャットGPTに筋の良い回答をしてもらうための問いとは?っていう話でやりましたね。
そうですね。今回も生成AIの話を取り上げたいなと思いまして。
なるほど。
何かっていうと、ちょっと流行ってるじゃないですか。あの頃も流行ってるんですけど。
今だと、チャットGPT以外にもGoogleのBirdが出たりとか、なんかいろんな画像生成系の生成AIとかも含めて、
最近だと音楽生成とかもありますけど、なんかいろんなところで使われてるなと。
そうですね。いろんなところでありますよね。
そういうこともあって、生成AIってどういうものなんだろうかというのを、少し私なりに整理したことがありまして。
そういう点について、少し2回ぐらいに分けてお話したいなと。
それはあれですか、やいさんなりのモデリングしたっていう話?
ある意味そうですね。
なるほど。
という感じかな。
なんかちょっと最近モデリング編かぶりになってるようするけど。
近いかな。仕事柄というのもあるんですけど。
そうですね。まあ確かに普段よく使うんで、そういう話題になりがちですよね。
分かりました。
今回どういう観点で物を見たかなんですけど。
はい。
ちょっと書籍でですね、Change the Ruleっていう本がありまして。
これは2002年かな。20年前の本なんですけど。
当時、この本が出た当時でもちょっと古いんですけど。
もともとERPとかの機関システムを導入するって言った時に、
単純に今もあるかもしれないですけど、
そういうシステムとかパッケージを買ってきたところで、
実はあんまり効果が出ないよねみたいな願いがあって。
コンピューターシステムの限界と変化
タイトルもChange the Ruleっていう名前なんですけど。
業務のルールを変えないといけないよねと。
そう変わんないと、要は従来と同じ業務の仕方とか仕事の仕方をしたままで、
単にシステムだけドンって入れても、
行動が変わらないと結果が変わらないので変わんないでしょっていうのが本の趣旨です。
なので、それに対して新しいテクノロジーが出てきたときに、
どういうふうに変わっていくのかみたいなところが描かれてるというものなんですけど。
この中に新しい技術に対する6つの質問っていうのがあって、読み上げてみますけど。
お願いします。
ERPなんですけど、どちらかというとコンピューターを業務に導入するっていう趣旨になってるんで。
ERPって直接書いてないんですけど、コンピューターシステムって書いてて。
1個目の質問はコンピューターシステムの真のパワーとは何か。
ここから絶対目的で分かる。
パワー。
なるほど。
真のパワーって何ですかっていうところからまず入りますと。
まず最初に全部質問だけ言いますね。
はい、お願いします。
1個目は真のパワーとは何か。
2つ目がコンピューターシステムを用いるとどんな限界が取り除かれるのか。
3つ目がこれまでの限界に対応していたフルルールとは何か。
4つ目、どんな新しいルールを用いればいいか。
5つ目、ルールの変更に合わせてコンピューターシステムにどんな変化が求められるか。
6つ目、いかに変化を起こすのか。
最後はどう変えるかっていう話になってますけど。
こんな感じの質問に答えていくと、
例えばERPとかっていうのも、
要は古いルールからどういう新しいルールに変えなきゃいけないのかっていう視点に切り替わっていくっていうための質問です。
ちょっと具体的にしてやったほうが話しやすいと思います。
パワー以外はなんとなく分かったんですけど、パワーは何ぞやと思いましたね。
ここの本で出てくる、まずコンピューターシステムのパワーって何かっていうところで一応言うと、
情報とかデータを処理する能力。
コンピューティングリソースみたいな話なんですか?
そんな話ですね。保存とか転送とか検索できると。
しかも早くできる。
今までの古いテクノロジーとかだと、紙ベースの話とかだと思うね。
例えばファイリングされてるやつ検索するのは難しい。物理の紙だと難しいですけど、
コンピューターシステムだと調べれば一発で出てくるみたいなところがコンピューターシステムのパワー。
これが質問2になると、どんな限界が取り除かれるかといったときに、
紙ベースで、ERPって例で出てくるので、会計システムと見たときに、
決算とかを計算するのって紙だと大変じゃないですか。
ERPとかそういう会計システムが入っていると、一発ですよね。
ボタンを押したらすぐ出ますみたいな。
ちゃんと入っていれば。
そこに行くまでが大変だよねみたいなツッコミは大きい。
ちゃんと入っていれば一発で出てきます。
基本決済とかやろうとすると年に1回とか、多くても半期に1回みたいな感じだったのが、
やろうと思えば毎月毎週できますっていうことが限界であると。
そういう速度的な限界が取り除かれますと。
それまで3つ目が、その限界に対応していた古いルールっていうのが今言ったとおりで、
例えば年に1回やりますとか、6ヶ月に1回やりますとかっていうのが元々のルール。
これを引きずったままERPを入れると何が起こるかというと、
ERPで瞬間に出るにも関わらず年に1回しか計算しないとか、
例えば在庫の棚卸しを年に1回しかしないとかっていうことになります。
ただ、実際は棚卸しとかのほうがより実務っぽいので棚卸しの話にすると、
新しいルールで言うと、例えば毎月でも在庫の状況とか確認できるよねってことができるわけですよ。
紙じゃないのですぐできるよねと。
そういうルールに用いると、例えば在庫の管理とかがすごく簡単にあったりとか、
テストっていうのがERPみたいなのを導入するとできます。
なので、4つ目の新しいルールをどう用いればいいかっていうのは、
ルールの変化と生成AIの活用
もっと高頻度にそういう管理情報をアップデートするっていうのが可能になると。
5つ目に関して言うと、ルールに合わせてどういうふうにするかというと、
例えば毎月できるっていう機能を毎月できるようにサポートするような、
やれますよみたいなのをレコメンドしてもいいですけど、
そういったものが反映されるとルールの変化に合わせやすいという感じですね。
最後は単純にトランジションの変化の話なんで、
それに合わせてルールもコンピュータシステムも変えるよねっていうふうに考えています。
前のルールじゃなくて、新しいルールでかつ新しいシステムを使うよねっていう変化をさせるっていうのが、
このChange the Ruleという本にざっくり言うと書いてあります。
このフレームで、生成AIという新しい技術、さっき言うとコンピュータシステムですけど、
そこに生成AIの真のパワーは何かっていうのからちょっと入って、
変化をさせるというふうに考えています。
生成AIの真のパワーは何かっていうのからちょっと入って考えてみましたという長い話。
よかった。ERPの話するかと思ってドキドキした。
大丈夫です。生成AIの真のパワーっていうと、
ちょっと最後の方に、最初に話しますかね。
まず、そもそも皆さん使ったことあるとは思うんですよ。
どれくらい詳しいかちょっと分かりませんけど、
とりあえず入れてみるぐらいはいますよね。
偏ってるのかなーみたいなことをちょっと感じたのは、
ちょっと前ですけど、ソフトバンクワールドがあって、
孫さんの貴重講演で、AGIわかる人手挙げてっていうので、
会場に問いかけしたら、10%も手挙がんなかったっていうのが出てて、
孫さんがマジですか、やばいですねって言ってたのが印象に残ってるんで。
でも、ただAGIっていう言葉は知らないだけで、
チャットGPTならわかるよって方もいると思うので、
もうちょっと触ってると思うんですけど、
もう1個の質問で、毎日使ってますかっていうのも10%ぐらいしかいかなかったんで、
毎日って言われると毎日じゃないけど。
毎日、私も使ってないかも。
僕も使ってないですね。毎日は使ってないので。
毎週って言われたら使ってるかなって。
使ってながら今日は使ったけど、
本当にそれが基本みたいな感じの使い方とか、
AGIっていう概念的な整理の話とかできてるっていう話で言うと、
まだ少数なのかもしれないですけど、
触れたことあるっていう人は一定数いるっていう、
たぶんそんな感じなんだなと思いますね。
そうですね。で、たぶん思うに真のパワーって何かっていうと、
技術的な話というかちょっと概念的な話にはなるんですけど、
結構自然言語的対話ができることじゃないかなと思っていて、
例えば比較対象として正しいかどうかわからないですけど、
従来の技術で言うと、
例えばデータベースの検索であったりとか、
Googleの検索であったりとか、
たぶん検索エンジンとかがちょっと近いと思うんですよ。
引き合いには出されますよね。
そうしたときに、
より自然言語的な対話ができるっていうところが、
たぶんパワーになるんじゃないかなと思います。
そうですね。
これはたぶん人によっていろいろ意見がありそうなところかなって思うんで、
一旦AGIさんの観点からいったときにはそこに注目したっていう感じですよね。
なるほど。はい。
で、そこから取り除かれる、
今までの限界って何かっていうと、
今までちょっとGoogleの検索を引き合いに出しますけど、
Googleの検索って、
今も使ってるんですけど、
生成AIの真のパワー
なんかこういう答えがありそうだ、だから検索するってキーワードを入れますよね。
だいたい。
例えば、
生成AIを調べたら生成AIっていうキーワードを入れて検索するじゃないですか。
アルゴリズムは置いておいて、
たぶん一番関連が高そうなものが上位に出るようなアルゴリズムが含まれてて、
それで上位に出てくるっていうようなスクリーンになってると思うんですよ。
お金払ったやつが上に来る場合もあるんでちょっと。
まあそうですね。
それは置いておいて、
キーワードを入れてそれに対するレスポンスとして関連するものというので出てくると。
なるほど。
そうすると、実は頑張ってはいるかもしれないけど、結構いらないものもいっぱい出てきたりするわけですね。
欲しい情報をドンピシャ一発で当たって、それで満足っていうことは少ないかもしれないですね。
で、我々何してるかっていうと、欲しい情報にアクセスできるようにキーワードを選んで検索するってやるじゃないですか。
例えば、生成AIで検索するときに、
キーワードを入れてそれに対するレスポンスとして関連するものというので出てくると。
例えば、生成AIで使い方を知りたいんだったら使い方って空白入れて入れたりとか、
ニュースが知りたいんだったらニュースって入れたりとか、
こういうのが欲しいっていうのを想定してキーワードをチョイスして入れるっていうのが多分元々あった限界。
あんまり文章入れないですよね。
入れないですね。
長くなるといまいちなものが出てくる可能性が結構高くなる。
言語圏によって違うみたいな話聞いたこともあるんで、
日本語で言うとキーワードで入れることが多いんじゃないかなっていうのは、
自分の経験とか周囲見ててもそう思いますね。
そうか、英語の場合は単語が分かれるからある意味それなりになるかもしれない。
とか、本当に文章を入れて検索するっていう行為自体はあったりするんですよね。
入れて検索する時も自分もあるんで、それはそうだなとか。
多分そこ、人が変換してるんですね。
聞くとき、機械に聞くとき。
変換してるっていうのが多分元々の限界。
それによって、質問3ですけど、古いルールは何かっていうと、
キーワードで聞いていく。
例えばChatGPTでも、成績AIに聞くときにキーワードで聞いていくっていうやり方をすると、
多分Googleとかとあまり変わらないような使い方ですよね。
そこが多分古いんで。
本来は、最初にパワーで言いましたけど、自然言語的に聞けるっていうのがあるんで、
4つ目の新しいルールを用いるのは、より会話的に話をすることが多分新しい。
人がやるべきルール。ルールっていうほどじゃないかもしれないですけど、
そういうことができるようになったと思っていて。
それってキーワードを考えなくてもよいっていうことを言ってます?
そうです。
ある種聞くべきキーワードを聞いて検索するっていうのから、
成績AI自体はそれがなくても欲しい情報にアクセスするときに、
キーワード想起しなくても良くなってるっていうのがルールの変化だっていうことですかね。
その通りです。
なるほど。
5つ目の質問で、ルールに合わせて成績をどう変えなきゃいけないかなんですけど、
この自然言語的にやりとりするっていうことができると、
チャットGPTもバードもそうですけど、1個前の質問とかも
加味して返してくれる部分がちょっと近いんですけど。
そうですね。
自然言語的にやりとりできてるっていうのは、キーワードよりも情報量が増えてるんですよ。
対話の未来と議論
その人特有の考えてる内容とか、こういうこと気にしてるみたいな情報が付与されてるじゃないですか。
例えば思ってることみたいなものがそのまま出てくる可能性があって、
情報が増えてるはずなんで、学習しやすくなってるはずですよ。
昔あったいろんな情報から学習するよりも、
キーワードをいっぱい拾ってきてそこから学習するよりも、
明らかにその業間の情報、文脈情報みたいなものが付与されるので、
学習効率が上がるはず。
今もう多分チャットGPTとかもそうされてるとなってます。
多分そうですよね。とんでもない量のインプットが入ってるんで、
とんでもなく進化しているはずですよね。
今の話で言ったときに、テキストでやることすらもうちょっと変わるんじゃないかなって気がしてて、
業間とか文脈って話になるとまさにこういうふうに喋って会話じゃないですか。
そうするともう音声とかですよねきっと。
もうマルチモーダル化しつつあるんで、
そうなったら目よりも実はポッドキャストのような音の方とか聴覚系の方が優位になる未来もあるかもねみたいな。
そうですね。それはそうかなと。
そういう妄想もできる。
そういう意味で言うとそこも質問の5に近いかもしれないですね。
技術側の変化としてそういうインターフェースをより人間のやりやすいインターフェースに近づけるっていうのが一つの変化だと思っているか、そういうことかと思いますね。
6はどう変化させるかなんでちょっと置いておきますけど、5まででそういう話かなと思って。
なのでその対話ができるということ、自然言語で対話ができるということがある意味その生成AIのパワーであって、
生成AIもそれで得られる文脈情報をさらに学習できるので、よりパワーアップできるじゃないですか。
よりパワーアップすると人もより話しやすくなるので、また対話的な話でより新しくコンテキスト情報が手に入るし、
例えばさっき小倉さんが言ってくれた通りでマルチモーダル化された音声入力になると間を読むとか、
フォーンっていう情報も取れるようになるので、より多分対話がうまくできるようになってくるはずかなと。
そうですね、確かに。
なのでなんかこう流行ってるんで流行ってるねって思うんですけど、割と一家性じゃなくて、これっておそらくあんまり戻らないんじゃないかなと。
完全に不可逆なトレンドは感じますよね、スマホみたいな。
やっぱ使わないとあり得ないでしょみたいな話にもうちょっとしたらなってくるんじゃないかなと思いますよね。
それはそれで楽しい世界なのかなとは思ってて、一旦ちょっとこの辺に行かないといけないかなと思ってますね。
だから不可逆な流れですよというところと、タワーを対話できることにあるというところで、
しかもそれがどんどんパワーアップしていくだろうと多分予測できそうだなっていう話と、
もう一回別の回としてもう一回やりたいなと思うのは、それによってよく言われる仕事が奪われる可能性みたいな話があると思うので、その辺ちょっと一緒に議論できたらなと。
分かりました。ありがとうございます。
今回は以上にしたいと思います。