166. 2023/07/23 AIの進化と情報収集のむずかしさほか

クラサーアップデートとVR空間のマーケット動向

kokorokagami

クラサーのアップデート、いい感じですね、これ。

touden

そうですね。使ってみて結構変わったなというところはありますね。

kokorokagami

先週からではありますけど、なんか待機中にフワフワ動いたりとかしてて。

touden

はい。あと、このラジオだと歩いてないんであれですけど、歩きモーションとかもね、結構、何とですかね、自然になった?

というか、人間が歩いてる風になったという感じがあって。やっぱここら辺、何て言うんですかね、ジャンプしてみた?

kokorokagami

はい。歩いてみた。

touden

歩いてみた。ここら辺、何て言うんですかね。

やっぱりVR空間内で、より自然に自分がVR空間内に入っているという没入感を得るためには結構重要だったりする気もするので、そこら辺が頑張ってくれてるっていうのは良いことだなというところはありますね。

kokorokagami

それで気づいて、クラスターさんのリリースノートのほう見に行くと、結構かな大型なアップデートをいろいろかけてるみたいで。

クラスターさん曰く、分かりやすいクラスターAってことで、手触り、繋がり、始まりを改善するというところがコンセプトに掲げられてます。

この辺のモーション関係については手触りの話で、他にも手触りのところだと、メニューの改善だったりとか、アバターメーカー。

今私のやつとかは自作で上げてるんですけれども、こういったものをクラスター上で作れるようなアバターメーカーがあって、それの改善。

あとはサウンドも、実はモノラルな距離感だったんですけど、ステレオ音源に対応ということで、その辺も没入感が上がるアップデートが来そうですね。

touden

そうですね。

kokorokagami

繋がりっていうところだと、最後まで喋っちゃいます。繋がりっていうところだと、ユーザーが撮ったスマートフォン上の写真をフィードできる機能とか、

あとはスペースって言って、一つのワールドなんだけど、その中でもさらに分割して利用できるような感じの機能も追加されるみたいです。

今私たちってオープンに公開されてるワールドをそのまま使ってるので、たまに誰かが入ってきたりということがあったんですけど、

そういったのもスペース機能を使って分離すれば改善できる可能性があると。

あとはホームクラフトっていう機能が追加されていて、クラスターにログインした後の一番最初の初期画面ですね。

VRChatとかいろんなものであると思うんですが、そこがクラスターが提供するワールドクラフト機能で作れるようになりますっていうアップデートが入ってます。

あと始まりっていうところでは、チュートリアルとベテランユーザーによるガイドっていうのができるようになってます。

チュートリアルではクラスターが出かけるチュートリアルマップを対象にこんなことできますよっていうのを紹介するもので、

ベテランの人がガイドする系だと既存にいるユーザーが新しく入るユーザーに対していろいろ支援できるようなそういった機能が追加されますと。

個人的に一番面白いのが最後のチュートリアル系の話で、VRに馴染みがあるとか関心ある人っていうのはすでにVRChatにクラスターに入ってきているので、

これ以上の新しいユーザーを捕まえようとした時に何がハードルなのかということを考えて、おそらくそういったアプローチを取られたんだと思うんですけど、

それがチュートリアルとか新しいプラットフォームすぎて勝手がわからないっていうところが課題なんだろうと置いたのがちょっと関心どころかなというところですかね。

touden

チュートリアルに関してはそうですね。VRでいうとOculusのVRのチュートリアルとかもかなりきれいにできていて、

下手なゲームよりゲーム性が高いというか、それだけで関心できる作りだったので、チュートリアルってやっぱ大事ですよねという気がするので、

そこに力を入れるのは正しいのかなというところはありますね。

あと個人的にはやっぱりステレオ音源対応とかですね。

結構クラスター、昔から声の届く範囲が、キャラクターが遠くに行くと声が聞こえなくなるとか、

そういう空間オーディオも意識して作られてたと思うんですけど、そこステレオ対応っていうところ。

やっぱり使ってて没入感にも影響してくると思うので、ここら辺は頑張っていってくれてるのはありがたいなというところです。

kokorokagami

そうですね。私たちとしてはタタノリって言ったらあれですけど、クラスターさんにほぼほぼお金払わずにこうやって活動させてもらっているので、

こういうアップデートが全体にかかるのは大変ありがたいなと思いつつというところですかね。

touden

そうですね。棒立ちなんで、機能使ってないのは申し訳ない感じはちょっとありますけどね。

kokorokagami

そうですね。こういうメタバス空間の話も、やっぱりコロナが終わってちょっと盛り下がっているところはあるので、

どこまでその企業がイベントやったりとかでマネタリズしていると思うんですけど、そこが維持されるかどうかというところで、クラスターさん頑張ってほしいなというところですね。

touden

確かにそうですね。今はAIの方が投資の過熱感が出ちゃってますけど、現状私が見る範囲内では、言うてその前のVRブームみたいな感じにしぼんじゃってるというほどでもないと思うので、

そういう意味では根付いてくれているので、今後より大きい間口に広げていくタームになっていると考えると、今ぐらいがちょうどいいのかなという希望的観測ですけど、思ってますね。

kokorokagami

そうですね。着々と盛り上がっているんですけど、多分世界的に見てすぐ金になる技術がどっちかと言われればAIの方だったというだけの話で、

Metaverseで元々目指してた、MetaverseでというかVRで目指してた市場というのは着々と伸びているのかなとは思いますね。

touden

そうですね。

kokorokagami

Vket2023が今やってるのかなくらいなんですけど、入ってみると分かりますが企業ブースがすごく進化しててですね、

Vketって前からずっとやってるイベントですけれども、最初の頃はほぼ企業勢もハリボテを出してきて社名をドーンと出すだけで、

よく作ったねって言われる時代でしたが、今各企業のブースを見に行くと本当にVRでしかできない仕掛けっていうのを本当に作り込んでいて、

特に個人的に日清さんのカップヌードルアバターになって世界を救うみたいな意味のわからないイベントを実施されてるのが本当に良かったので、

そういったところに投資してVR空間に来るユーザーを市場として見てる企業が多いという現状自体がVRの進化を感じるなというところはあって、

そういった市場に向き合う企業が増えれば増えるほどクラスターさんも企業からの案件を受けれるんだろうと思うので、

その辺は心配はしてないんですけど、そこの市場価値があるよねって判断してた広報部とかが、みんなまた外に出るようになったから一旦いいかってなったらちょっと悲しいなって感じ。

touden

そうですね。そこに関しては大衆がどう判断するかっていうところもありますけど、

またコロナみたいな状況になるっていう可能性を考えると、そこで投資してないのは何て言うんですかね、

それはそれでなんで考え取らなかったんやということになりそうではあるので、

現状力入れてる企業さんとしては一通りやっておくっていうのは無駄にはならないと思いますし、

touden

そういう意味で結構頑張ってくれてる企業さんが多いっていうのはいいことなんじゃないのかなというか、

会社さん側としても市場価値があると判断しているということだと思いますので。

kokorokagami

私たちはそんなクラスターを応援していますって勝手に言うのも悪いけど、利用させていただいている以上はこのようなアップデートを非常に楽しみにしておりますので、

今後ともよろしくお願いしますって感じですね。

touden

今後ともよろしくお願いしますっていう感じですね。

kokorokagami

じゃあ枕はそんなところにして本編いきたいと思います。

ChatGPTのカスタムインストラクションズ

kokorokagami

1点目、ChatGPTの新しい機能、カスタムインストラクションズを最速で試してみたということで、

Kiitaで挙げている株式会社Lelic所属の熊田さんの記事です。

7月20日にオープンエイはChatGPTの新しい機能としてカスタムインストラクションを発表しました。

カスタムインストラクションズはChatGPTの応答機能をより詳細に制御できるようにするための機能で、

有効にするとその後のチャットの会話のすべてを設定に沿って回答してくれるようになります。

ということで、この話の通りではあるんですけど、非常に待望される機能がアップデートされたので共有したいと思います。

この機能を待望していた人はごく一部だとは思うんですけど、私としては非常に待望していました。

どういう機能かというとですね、よくChatGPTに投げるときにあなたはこういう回答をしてください、

こういう立場でこういう回答をしてくださいといったようなロール付けというプロンプトと、

自分が今から投げる質問に対しての事前背景情報を追加する話。

例えば私は今こういう仕事に従事していて、こういう経歴の持ち主です。

こういう問題にぶち当たりました。

なのでこの経歴の人に分かるような専門用語を使っていいので回答してくださいみたいな形で、

自分のプロファイルを伝えるというプロンプトの入力もありました。

それらの入力というのは質問が変わっても毎回同じになることが多々あるので、

そういったものを事前に設定しておけるというのがカスタムインストラクションズです。

多くの人が使う機能ではなくて一部と言っているのが、

そのロール付けということで解決できることと、

ロール付けなんかなくても解決できることというのを見比べたときに、

現状多くのUSKはそういったロール付けがなくても回答できるというものが多いので、

あんまり使われないだろうなと思いつつ、

私がウカガガとかでキャラクター付けを検討してたりとか、

そういうJAT GPTにこういうふうな応対を期待するというくらい深い付き合い方をしているような人たちにとっては、

非常に魅力的なサービスアップデートかなと思っての紹介です。

touden

これ実際の動作としては毎回このインデックスというか、

カスタムインストラクションのデータを付与してJAT GPT投げ込んでいるという状況なんですかね?

kokorokagami

内部実装がどうなっているかまで正直分かってはないですけれども、

事実上JAT GPTにはこういった情報を付与するためのシステムといわれるロールでのリクエストがあるんですよ、

もともとのインターフェースとして。

JAT GPTのWeb UIにはそのシステムに向かって直接投げるという入力フォーマットがなかった、

というところに対してできるようになったという見方が正しいかなと思います。

touden

それであれば、ユーザーとしてはより使いやすくなったという見方でいいんですかね?

kokorokagami

今の私の説明だと特に大きな内部的なアップデートがなく、

UIが追加されただけというように聞こえるとは思うんですけど、

若干だけ利用体験として違うところがあって、

さっき言ったAPAを投げるときのロールの種類として、

ユーザーとかシステムという2つあって、

普通にJATを投げるときはユーザーで投げるんですけど、

もう1つのシステムで投げると、

ITの役割とかを設定できるというところで説明をしたんですが、

そのシステムのロールでどういう文字列を投げれば、

期待通りに動いてくれるのかというのはかなりノウハウが必要で、

最初にそのシステムで投げて以降全部うまくいくかというと、

全然そんなことはなくてですね。

定期的に思い出してもらわないといけないみたいになると。

それを突き詰めていくと、結局これシステムで投げるより、

自分で毎回リクエストのときに、

こういう役割で解凍してねって付けた方が、

精度高くねって言われるくらいには、

そのシステムのロールって使いにくかったんですよ。

今回JAT GPTでそこを使う専用のインターフェースを用意してくれて、

そこにこちらが期待するものを入れると、

本来そのシステムで機能してもらいたかったことが、

その通りに機能して返ってくるという状態が今作れているので、

APIを正しく機能させる上でのラッパーとして、

すごく便利かなという体験にはなってます。

touden

なるほど。確かに毎回付けるのはめんどくさいし、

文字数が多くなるんで金がかかるとか。

kokorokagami

トークン数ですね。

touden

トークン数かかっちゃうとか、そういうところもあると思うので、

そういう意味では使いやすくなっていいのかなというところですね。

あとあれですね、JAT GPTよくわからない人に対して

AI技術の進化とマーケティング

touden

使ってみてくださいよという、

弊社が提供しますみたいな、

条件付けさせて顧客に提供するというような状況に対して

非常に強力だと思うので、良いのかなと思いますけど、

でもそれを言うと昔話してたように、

設定してたけどそこからジャイロブレークみたいな感じで

抜け出せられるとか。

そこら辺あるとどうなんだろうなというところもあるんですけど。

それは全然ありますよ。

kokorokagami

今回のこの機能を使って、例えばギャル語で回答してください

みたいな設定をするとそれじゃないですか。

その相手に対してプログラミングコードこういうのを実装してください

って言った時の回答でギャル語を書いてくれるかって言ったら

まず書いてくれないので、できる限界はありますね。

なるほどね。

touden

まあそれでも、さっき言った通り毎回使うために

セッティングを読み込ませないといけないみたいな

めんどくさいことにはならないという点だけでも

十分使い勝手はいいと思うので、良いですねと思います。

kokorokagami

これが公式が出してくれるっていうのがいいですね。

そうですね。

非常にまたChatGPTのポテンシャルを感じられるような

一つの機能だと思いますね。

商用とかで考えると、さっき東電さんが言ってた通り

利用ユーザーに合わせて回答するっていうところなんですけど

そのチューニングパターンとして一つ試す余地はあるんですが

なかなか下手なチューニングができないので

難しいなと思うところはあります。

例えばユーザーに対してですね

根節丁寧なチューニングをしようと思うと

おそらくこのユーザーは

小学校1年生くらいのまだあまり

こういったことに馴染みのないユーザーですっていう

本当に無知で言ってしまえばバカな人を相手に設定する方が

より正しくユーザーフォローアップ力の高い回答が得られるはずなんですけど

そんなことをバカ正直に書いて

ユーザーに伝わった日には大事になりかねないので

適度にその辺をチューニングする必要があって

なかなか面白い問題にあたりますね

touden

そこはでも自然言語的にオブラートに包んで

GPTに渡すことで

kokorokagami

いい感じに回が平たくなる優しくなる

touden

というようなチューニング設定をするっていう

kokorokagami

プロフェッショナルな仕事ができるんじゃないですか

もしかしたらチューニングの中で

ブラックボックスにするチューニングと

ホワイトボックスにするチューニングみたいなのがあるかもしれないなと思ってて

まさにセキュリティと機能制限みたいな感じがするんですけど

アプリケーションとしての機能制限って

オープンに制限はどういうものですというのをしておいて

ユーザーの理解とシステムとしての妥当性を評価するという方針で

実装されることが多いと思うんですが

セキュリティは逆にブラックボックス化して

勝手にチェックされてる

そのチェックさえ通ってれば大丈夫みたいな位置づけにして

ブラックボックス化する方がアタックも受けないし

いいよねっていう世界になってると思うんで

そういう関係性がもしかしたら

このプロンプトからモデルの間で行われるのかもしれないですね

touden

まあそうっすね

GPT-4を使った設定と限界

touden

話聞いてて思いましたけど

そこまでちゃんとやるんだったら

このプロンプトに依存せずに

自社側で一回ラッパーしろという感じがすごいしますね

kokorokagami

わかりますね

ラッパー層がいくらあっても足りない世界になってきますね

この件はこんなことです

touden

では次にてめ私の方から

アイテムイデニュースさんの記事です

まもなくツイッターブランドへさよならだとマスクし

Xの新ロゴデザイン募集中というタイトルの記事になります

ツイッターのオーナーイーロンマスク氏は

米国時間の7月22日土曜日の夜

プラットフォームカラーを現在の青から黒に変える

投票ツイートを投稿し

その後でそしてすぐにツイッターブランドに別れを告げ

段階的にすべての鳥たちにも別れを告げるだろうとツイートしました

国の優れたXのロゴが投稿されれば

それを明日世界中で公開しようとも

このツイートを受け

多数のユーザーがXのロゴデザインを投稿している

マスク氏はその後

家電をあまりスマートにすべきじゃないようななどとツイートしており

ロゴ変更のツイートは土曜日の夜の気まぐれのひとつのようにも見える

4月にも一時的にツイッターロゴを柴犬に変更しすぐに戻している

マスク氏は

ツイッター買収完了当時

ツイッターの買収はすべてのアプリであるXの構築を促進するものだとツイートしており

ツイッターをXというブランドに変更する可能性もなくはなさそうだと

いうことで

毎回のごとく適当言ってんなという感じではありますけども

補足情報といいますか

なんといいますかという感じなんですけど

マスクさんイーロンマスクさんスペースXもXですし

新しいXAIという会社も設立してますし

なんかこうX好きな人なんやなというところなんで

そのうちスマホのアイコンがXになるんじゃないかなという感じですという話です

kokorokagami

そうですねX好きなのは日本も買わなくてプロジェクトXとかみんな大好きなんで

きっと世界共通でXは大好きなんだと思いますね

X銘とかもそうだし

touden

まあ確かに

kokorokagami

ほらDXもXだしね

touden

まあ確かにねあれは何というか無理矢理じゃんという感じもありますけど

kokorokagami

そうですねツイッターは本当にどこに着地するのか分からず

またツイッター難民が溢れて結局ツイッターに帰ってくるみたいなループを通る人が出てきそうな話ですけど

touden

そうですねまあでもだいたい手段がね出ては消え出ては消え出て消えてはいないですねごめんなさい

という感じでまあでもなんか

まあ見切りの早い人はもうツイッターに投稿しなくなってきてる感じもあるので

なんか空中分解してるなという感じですけども話はずれますけど

とは言いつつもツイッターがまだメインストリームこの工業タイプのXNSとしてはメインストリーム感がまだあるかなという気はしていて

Facebookが出してたスレッズも

一時期めちゃくちゃ登録者数が増えたけど

今アクティブ稼働数でいうとツイッターの10分の1以下まで減ってしまっている

という感じがあるらしくて

なかなか移動

民族大移動するの難しいなという感じの印象です

kokorokagami

そうですね新規登録者数も完全に頭打ちになってツイッターの5分の1と思ったのかな

touden

はいそうですね

5分の1確保してるだけですごいというかめちゃくちゃすごいんですけどね

kokorokagami

そうですね2億人くらい

1億人がアクティブユーザーだという時点で十分すごいんですけど

そうですね

ツイッターの未来とニュースサイトの難しさ

kokorokagami

アップデート予定とかはちらほらスレッズも聞こえてきて

ツール内翻訳とかが機能するようになるんで

他言語コミュニケーションを加速するためのアップデートを促していきたいみたいなそんな感じの方向性も見えて

少なくともツイッターの未来よりは比較的共感できるアップデート方針が見えますね

touden

はいそうですね翻訳機能は機能としては成熟してると言って使えないと思いますから

しツイッターも実装してて結構それで使いやすくなったなという印象もあったので

そういうものが入ってくるっていうのは非常に使用者としてはありがたいなというところですね

kokorokagami

そういう対等するものが出るまでのつなぎとして現状アンテナの張り方を見直さないといけないんですが何があるかって話ですよね

touden

そうですね難しいですねという感じで

結構このラジオのネタもツイッターで漁ってた時期があったんですけど最近やっぱり

ツイッター稼働しててもなんか上手い具合に情報源として使えてないなぁ感もありつつのかといって今更またRSSなんですかという

RSSの悪口言うとこのラジオやっていけないですけど今更RSSなんですかという感じもしてどうしたもんかなと思ってるところです

kokorokagami

そうなんですよねあのツイッターが良くてニュースサイトがダメな理由っていうのがもう明確にあって

そのニュース記事のサイトとかで取り上げられるものっていうのは当たり前ですけどお金がかかるので

なるべく多くの人に刺さるものっていう探し方をして記事化するじゃないですか

書き方もなるべく多くの人にわかるようにということであまり掘り下げずに終わるということを意識してそこに留めているのが基本的にニュースサイトだと思っていますと

私たちが知りたいのって一時期ロケットの爆発してしまった原因を調査とかで

JAXAが出してきた調査レポートのPDFやパワーポイントが知りたいみたいな世界を喋ってるわけじゃないですか

そんなニュースサイトに載せるわけないので当たり前ですけどそれを読んでわかる人が少なすぎるから

そうなった時にそういうコアなユーザーが簡単にたどり着ける導線が唯一ツイッターだったっていうことなんですよね

touden

そうですね

kokorokagami

それの代わりになるものっていうのをニュースサイトにまた戻っていいのかって言われるとやっぱり無理だし

おっしゃる通りRSSで探す先って言ってもRSSの登録できるサイト自体がそういうコアな情報を拾えるようなものでなかったりとか

当たり前ですけどさっきのパワーポイントとかになってくるとそんな報告書って直接RSSフィードに引っかかるようになってないから

結局たどり着くのに2,3万回フェーズが必要だったりとかするしなかなか難しいんですよね

touden

なかなか難しいんですよね確かに自分で見に行けっていう話はなくはないんですけど

自分で見に行ってると日が暮れてしまいますし

誰かが見つけてくれた面白そうなものというのをキャッチアップするのが難しい

そうですねTwitterぐらいしかキャッチアップできないっていう現状から移動できないなというところですね

kokorokagami

あとは頑張って人を探すっていう世界ですよね

本当にコアなことをやってる中の人だったりとかそういうコミュニティだったりに参加してるユーザーだったりっていうのを探してきて

例えばFacebookとかその人が移行したであろうプラットフォームを探し出してフォローするっていう

そういう世界になってくるのかなという気はしますけど

touden

まあそうですね

kokorokagami

その場合Twitterと違ってダメなところが一つは明確にあって空発性がないんですよね

touden

Facebookだと?

そうそうそうFacebookとかだと

kokorokagami

関心はあるカテゴリーだけどフォローしてない人がチラッと流れることがなくなっちゃうじゃないですかFacebookだと

touden

まあ確かにそうですね

kokorokagami

だからそういう意味だとスレッツの方がまだいいんですけど

まあスレッツはさっきの状態なので今時点では大体にならないしっていうところがあって難しいですね

touden

はい

kokorokagami

まあその古いものにしがみついているだけではあると思うので

touden

まあ何でしょうね

プラットフォームの軸足をずらしてもいいんですけど

結局そういう情報源が今現状でどちらに多く流れているんだっていうとTwitterなんだなという気もしているので

kokorokagami

まあそうですね

touden

て感じですね

kokorokagami

まあ海外の情報に絞ればねスレッツは結構流れてくると思うんですけど

touden

まあね

kokorokagami

日本ユーザーが少ないだけなんで

touden

まあそこを含めて確かに翻訳機能とかね付加機能が追加されることでTwitterにはない情報源として使えるようになれればアクセス頻度は上がる気がするので

そういう意味では根性を入れてサービスを続けてほしいなというところスレッツの方側が

kokorokagami

はいはいはいそうですね

あと次にやってくる移行タイミングとしては公共系ですね

公共系自治体地方自治体とかがもうTwitterを一つの社会インフラとして捉えて各自発信できるようになってるじゃないですか

そういうものも集まってるからそのTwitterに入っておくと地域のことも知れるし自分の関心度も知れるっていう一石二鳥プラットフォームになってましたと

でLINEもそうあろうとしていて人同士のつながりと地域の情報を両方足すをやってるんですけど

その強豪があるからちょっとTwitterのいいところを分解してこれはこここれはここってやっていくしかないのかもなとは

なるほどね

touden

公共系はLINEで補填してやって情報系は別のサービスで補填してやって確かにそうですね

kokorokagami

その地方自治体が明確にこのSNSに行こうみたいな次のアクションがあったらもうその時に正式に決めるみたいなストーリーですかね

touden

今FacebookとかやってるFacebookはやってそうだなちょっとFacebookアクセスしないからなんですけど

でもインスタとかは多分やってないんですよね自治体系はあんまり

kokorokagami

企業っている場所にも文書にもいると思うんですけど環境部門とかはやってるんじゃないですかね

touden

なるほど写真として投稿するものがいっぱいありそうなところはやってますって感じかな確かに

確かにね企業ブランドとかも結構インスタはやってはいるのでそういう意味では確かにインフラとしてはインスタでもいいのかもしれないですけど

kokorokagami

あとうちの自治体でいうとホームページに来てくれるユーザーっていうのが少ないっていう風にもう舵を切って

touden

ホームページでやってる機能をLINEに載せるっていうのをやってたの

まあその方が正しい気はしますけどね

kokorokagami

LINEでその地方自治体の通話のところに行くとタイル上のメニューが出てきて

そのメニューを選択すると普通に中の機能が紹介される

この手続きはこうですっていう動線があったり

普通にLINEのチャットでチャットボット的に引き継ぎができるっていうのをやってたりするので

そういうのも増えていくのかなという感じですね

touden

いやでもその方が絶対いいでしょう

なんかこう市のホームページとか行くと

なんて言うんですかそのクーレベルって言うんですか

その細かい単位のやつがざーっと並んでて

自分のとこどこだっけポチポチ探していかないといけないの

たまによくあるんですけど

あれ結構手間ですしなんか欲しい情報にたどり着かなかったりするんで

LINEで個人情報を設定しておいて

自分の住んでるところの情報を出してくれてっていうのはかなりありがたいですね

kokorokagami

結構ありがたいですよ

だから自分ちのゴミ捨てが何曜日かっていうのをちょっと聞きながら

っていう風に別のプラットフォームに行こうっていう話もあるから

自分がTwitterに何使ってどういうことを期待しているのかを

ちょっと切り分けずつ探すしかないのかもですね

touden

そうですね

kokorokagami

はいこの辺ですかね

touden

はい

kokorokagami

はいでは次行きます

3つ目

ビジュアル検索機能の実装

kokorokagami

リングチャットの新機能ビジュアル検索で優しい世界ということで

KDDIアジャイル開発センター株式会社のS3KZKさんが書かれたキーとの記事です

2023年7月19日から開発されている

マイクロソフトインスパイア2023のキーノートにて

リングチャットにビジュアル検索機能が実装されたことが発表されました

その名前がVisual Search in Ring Chatという名前になっています

何ができるかというと

入力として手書きのスケッチ画像と

画像を元にしたHTMLと

イケてる見栄えにするためのCSSを作ってくれという指示を与えることで

完璧とは言えないものの入力項目やボタンなどスケッチに基づくコードが生成できるというようなデモが流れていました

この例ではそういうコード生成のデモですけど

単純に画像を読み取らせて

この画像ってどのような画像ですか

どんな情報がありますかとかを調べることができます

私ちょっとお試しでですね

家の図面引っ張り出してきて

食わせてみて

この図面はどういう図面ですかっていう質問から

どの部屋がどんな場所にありますか

寸法はどんなんですかっていうのを片っ端から聞いてみて

一通り正解を返してきたので

なかなかイケてるなって感じです

先ほど言ってたデモが

今回新しい機能としてすごいと囁かれているのが

その画像を元にそこにあるコンテキストを組み取って

そのプログラミングコードにできるというところがすごく評価されています

今まで私たちプログラマーというのは

みんな仕事上そうかもしれないですけど

テキストで要件定義要求しようと書いていって

それを指示を出すということができていました

チャットJPGではそういう要件定義に基づいて

仕事をしたり CSS プログラムを書いたりとかはできていました

なのでそこにあんまり大きな違和感はなくて

私たちが普段からやっていることの一部が

AIに取って変われるようなことができるようになったのが

すごいなという世界で話してたんですけれども

これは誰かの頭の中にあるアイデアのスケッチを元に

実装にたどり着いているので

その間にあったこのアイデアというのは

つまりどういうことでいいといったところを

完全にすっ飛ばして実装に進められるというところがあって

非常に大きなインパクトのあるデモとなって

touden

紹介されているというところになります

プログラミングコードの生成

touden

これ何ですかね

顧客が本当にやりたかったことというか

エンジニアが本当にやりたかったことって感じがしますけど

良いんじゃないでしょうかという感じですけど

kokorokagami

何ですかね

touden

要件定義書がこういうものを作ってくださいって言って

そこからもう実装してくれているのが

自動でできるということで

本当に単なるエンジニアはいらないかなってなってしまう

とは思います

kokorokagami

何かそれでいいのかと言われるといいと思うんですけど

touden

何でしょう

でもいいのか

要件定義書が間違っていると間違っているものが出るよね

っていうことを言われているというより

この記事的には要件定義書を変な具合に解釈してしまっているという

人間でもありそうなことが

このビングチャットで起こっているというところが面白いところですけど

何でしょうね

ここら辺プログラミングツールとしては良くないんでしょうけど

何ですかね

非常に人間らしくていいなという感じですね

kokorokagami

そうですね

人間としても

似たような要件を言い換えて言い換えてこうこうこうって

いろいろインプットした結果

エンジニアのアウトプットが意味不明なものになって仕上がってくる

よくありますからね

touden

よくありますし

これはその頼んでないキャンセルボタンが追加してたからつって

いろいろ言ったら変なことになったということが言われてますけど

これ普通に人間でも起こり得る話だと思いますし

プログラミングって入力したものがすぐ返ってくるっていう

界隈だったと思いますけどここはそうではないというところなんですけど

ツールとしてはこっちの方が良いのかな

良い気がするなという

どう思われます

kokorokagami

私はこっちでいいと思います

前回か前々回かに話したと思うんですけど

結局100%の商品をこれで作れることはないですと

AIで作れることはなくて

80%の性能でPOCを高速で回す

エンジニアに頼らずに回すという世界の話をしてたと思うんですけど

その世界においていじいじ明文化っていう作業がいるんかと言われたら

まあいらんよねっていう話だと思うんで

プログラミングツールとしての活用

kokorokagami

こっちの方がいいと思いますね

touden

なるほど

要件定義書を考える手間が時間を浪費するなという話でしたもんね

確かに

そうそう

確かにそれはそれでいい

ただこのビングチャットさんが

吉野に会わせてもらって

それがちょっと予想と違ったら

kokorokagami

そこでこねてくださいというお話ですね

そうですね

見方を変えるともう一つできる姿があってですね

フォトショップとかで適当なスケッチの絵を描くと

それを成形してこういう絵でしょうかって感じで

touden

綺麗な最後のアウトプットの絵を描いてくれる機能ってあるじゃないですか

kokorokagami

あれのプログラミング言語版ではあるんですよねこれ

まあ確かに

なので企画会議とかでホワイトボードに向き合いながら

みんなでこういうのがいいかなあいうのがいいかな

こんなイメージだよねっていうのを書いていきますと

で最近はそのホワイトボードのエッジを捕まえて

余計な情報をカットしてホワイトボードの中身を

綺麗な平面の画像として取り込む機能が

マイクロソフトレンズとかそういったものに入ってたりするので

それで画像化してでこのビングにそのマークを合わせたら

コードとして動くものができるから

その打ち合わせの最後10分くらいで出来上がったコードを

みんなでポジションで触ってこんなのこんなのって言って

終われば最高って感じですよね

touden

はい確かに

そう考えると

なんかそのアドビさんは昔からすごいことしてたかなという感じですけども

まあ確かにそういうことですね

データをいい感じに情報量を削減して

近接近似かなんかで整形して

ベクターで表せられるようにするってところが

アドビさんが昔書いてたこと

ベクターで表せられるってことはコードで別に表現できるでしょっつってね

コードで表現しましたというだけの話ではあるので

kokorokagami

まあ確かにそれはそうですねという感じですけど

そうですね

あとはそうだな

まあどこまで著作権的に引っかかるかわかんないですけど

この例でもう少し効率化を考えるんだったら

どっかのベースをしたいホームページを探してきて

それを画像として出力します

Photoshopに加わして一回文字列をPhotoshopに指示出して

全部白塗りするか消してもらいますと

普通の背景画像で埋めてもらいます

手書きでタイトル入れたいところに自分たちのサービスのタイトル入れたりとか

片っ端から文字列そこに手書きで埋めていって

出来上がった画像をこいつに壊して綺麗な生成をしてもらったら

touden

はいホームページできたみたいなね

まあそれだと原型が残るってちょっとあれですけど

まあそのMockレベルではねそういうこと全然あると思うので

まあ確かに

そうですね

いちいち手打ちをしなくていいというのは確かに

kokorokagami

かなりコース削減できるんでいいですね

いいですね

またiPadとかPhotoshopとかあの辺が

あの会議室に埋め込まれるっていう時代が一時期ありましたけど

あれの再現があるかもしれない話ですね

touden

はい

まあそうですね

やった方が便利になるんでやれば嬉しいなと思いますけど

kokorokagami

うん

いやカイロ屋さん的にはアーキテクチャ図書いたら

カイロキャドウを図面に変換してくれるのが一番ですけどね

touden

まあそうですね

アーキテクチャ図レベルだとちょっと情報量不足しすぎな気がしますけど

まあ確かにそうですね

kokorokagami

チップ形式書いたりとかFET記号を手書きで書き出すとちょっとめんどくさいもんな

touden

まあでもあれか

なんかその前のカイロ図と前のアーキテクチャ図と

新商品のアーキテクチャ図があったら変わったところを

いい感じに接続を変更して

なんか通信方式変わったんでじゃあこっちに変えてくださいつったら

まあそれに合わせたICが自動的に乗ってくるみたいなやってくれるとかなり楽なんで

確かにそういう意味で言うと食わせるデータがあれば精通すると思いますし

確かにかなり嬉しいあったら嬉しい機能ですね

kokorokagami

アートワーク設計もここからやりたいね

手書きで大体の部品配置こことこことここでバスこの辺電源この辺って言ってざっくりで書いて

touden

でアートワーク上で部品配置

kokorokagami

こういうファイル出せたと思うからそれで入ってもらって

あとは自動配線機能とかあの辺をピッと活かしたらある程度寄ってくるのかな

touden

まあどうなんだろう最近ちょっと引いてないんでわかんないですけど

プロユースだとあるんじゃないかな

どうなんだろうわからん

その前の回路図をインポートして部品の配置図を置くことができれば自動配線機能自体はあるからできそうな気がしますけどね

まあそれが結局ユーザーの求める回路図なのかって言われるとどうかわかんないですけど

kokorokagami

気にしなくていいその優先度が低いところはもうそれで引いたのでもういいと思いますし

毎回バス書いて集短抵抗を同じように置いてっていうあれ鬱陶しいじゃないですか

あれだけでもねパパッとやってくれると

touden

まあそういう面白い新しいインターフェースの紹介でした

では次私の方から4つ目

GPT-4の制度の悪化

touden

GTB4の制度は悪化している3月に解けた数学の問題解けずGTB3.5にも敗北米国チームが検証というこれもITメディアさんの記事です

GTB4の制度は時間とともに変わっているそんな研究結果をスタンフォード大学と米カリフォルニア大学バークレー校の研究チームが発表した

3月6月時点のGTB4の制度を比較したところ一部タスクでは制度が大きく悪化していたという

ただしこの論文は所属前のもので第三者によるレビューは受けていない

GTB4は米オープンエアが提供する大規模言語モデルでありますと

実験ではChatGPTに対して数学の問題の回答機密危険な問題に答えを出すか

高度の生成視覚的推論の4つのタスクを依頼しそれぞれの制度を比較した

その結果GTB4の制度は一部タスクで3月より悪化していることがわかった

逆にGTB3.5では制度が向上しているケースも見られた

例えば数学の問題の回答ではChatGPTに対して

17,077は素数かステップバイステップで考えはいかいえで答えてください

とか素数かどうか判断する問題を500問提示した

結果GTB4の制度は3月版で97.6%だったが6月版では2.4%まで低下

回答で生成した文字数は3月版で平均821.1文字だったのが

6月版では平均3.8文字まで減少した

これについて研究チームはステップバイステップで考えているかがポイントであると解説する

3月版GTB4は素数であるかを判断するために偶数であるか判断するなど

段階を踏んだ上で最終的にはいえの結論を出しタスクを研いでいた

しかし6月版は段階を踏んで考えるという指示に従わずただ答えだけを示す傾向があった

一方3月版GTB3.5の制度は7.4%だったのが6月は86.8%まで向上

回答の文字数は3月版で平均747.4文字だったのが6月版は平均1081文字に増加していた

研究チームはGTB3.5は3月時点ではまずはいえの結論を出してからそこに至った仮定を段階ごとに示していた

3月版では結論と仮定が異なる傾向が高かったが6月版ではそれが修正されていたようで制度が高まったと考えられると見解を示す

その他機密危険な問題に答えを出すかのタスクでは個人情報などを含む機密情報を回答するよう指示した時の回答率を計上した

結果GTB4は3月版よりも6月版の方が回答率が下がっていることがわかった

一方GTB3.5では3月版よりも6月版の回答率がやや増加していた

高度の生成を依頼したところGTB4の3月版では生成物の50%以上が実際に実行可能なものであったが6月版ではその数は10%まで低下していた

GTB3.5でも同様の傾向が見られた

6月版の出力結果を見ると余分なテキストや引用符などを追加しておりその影響だと研究チームは推測している

視覚的推論のタスクでは簡単なパズルを仕込んだ画像を入力しそれを答えさせた

GTB4で3.5ともに6月版の方が僅かに性能が向上している傾向が見られた

一方3月版のGTB4が正解していた問題を6月版で間違えるなどのミスも見られた

研究チームは今後も長期的視点でのLLMの性能評価を行う予定

今回の実験結果のデータやチャットGPTの回答はGitHub上で公開している

味付けの問題にもよりますけど

定点観測していって回答レベルが極端に増減するという状況が今見えているという話らしくて

何というんですかね

いいものを作ろうとしていてその過程でこうなるというのは分かるで

違いにこの結果自体が直ちに悪いという話ではないとは思いますと

例えばそのGTB4 6月版に最適化した質問の仕方をすれば回答の正答率が上がるとか

そういうこともあると思うので

この結果をもって何か良くなった悪くなったっていうのは難しくはあると思いつつ

あくまで定点観測なんで定点観測の難しさ

GTB3.5の制度の向上

touden

例えばステップバイステップで考えっていうのは結構GTB3.5でうまくいくマジックワードみたいにもてはやされていたので

それが使えなくなっているというのは結構衝撃的だなというところでの紹介でした

kokorokagami

ありがとうございます

私も基本的には同じ感想です

まず背景として抑えなきゃいけないポイントが2つかなと思っていて

一つがそもそもGPTモデルは数学に弱いという話と

もう一つがオープンAIが今取り組もうとしている主な方針が中立性の担保だと思っていて

そこの話がありますと

まず前者の数学の話からでいくと

たった5桁同士の掛け算でもGPTは解けないです

掛け算が解けないレベルのモデルに対して素数を評価させるということ自体が

適当な定点観測方法なのかどうかというのはまた議論の余地がありそうですけれども

そんなレベルのGPTさんであれば

状況によって解答できるできないが変わってくるというのは

よくあり得る話かなと

もともと強くないというのは

答えの品質精度がばらつくということなので

チューニングしたバダフライエフェクト的な影響を受けやすい領域だと思うので

おっしゃる通り今回のチューニングによって

一時的にそうなった可能性ももちろんありますし

それを回避する必要な仕方ももちろんあるでしょうというのはその通りだと思います

もう一つ中立性のところのチューニングなんですけれども

もともとOpenAAはChat GPTに搭載する形で

いろんな政治的なものとか個人の情報

会社の情報等々を出さないように制限をかけていました

ただ先ほど出たようなジェールブレイクの話があって

そういう制限を取っ払って使おうとする人が絶えないですと

いった中で根本的なモデルに学習させるレベルで

そういうのをなるべく出さないように

無駄な情報をあまり出さないようにするというような

試みを行われていると思っていて

それがそもそも回答の文字数が減少しているという傾向に

現れているんだと思っています

なのでそういった過程で情報をあまりオープンにしない

使わせないようにした結果

こういうステップバイステップの処理系自体が弱まってしまった

ということもあり得るんじゃないかなと思います

touden

確かにそうですね

考えている過程を開示しろと言われてしまうと

その状況でこの資料を参照しましたとか言われたりすると

かなり困ってしまうので

そういう意味ではニーズにあったより良いものをお出しした結果

文字数が下がっているというのは

そう言われると順当かなというところですね

でも聞いてて思ったんですけど

中立性の担保とチューニング

touden

これを売り物として使おうと思う企業側は大変だなという感じが

すごくあるなと思っていて

相互感性がないので

例えばGDP3.5でうまく動くようにシステムを組みましたと

ただGDP3.5はそういうセキュリティ上の危険があるので

使えませんと

もっと容器を満たしたものにしてください

じゃあGDP4ですねと言われた時に

単純に乗せ替えるだけではダメで

まともな結果が出るように作り直さないといけない

ということになるわけですよね

まるまるじゃんってなってしまうんで

それはそれで何て言うんだろうな

すごくコストがかかってしまって

製品の設計が難しい

製品の設計というか

開発コストがかかりすぎるなというところが見えるなというところで

そこをちょっとどうにかしたいなと思いますね

kokorokagami

理想論だけ言いますね

理想論だけ言うと

こういった大型モデルというのは

そもそもオンプレで動かせるようなサイズをしていないので

クラウドで動かすしかないです

クラウドで動かすということは

インターネット上のAPIを使って

リクエストすることになります

なのでAPIをリクエストされる過程で

そのリクエスト分というのを

ログとして収集する余地があります

そのログをそのまま収集すると

個人情報とかに引っかかりかねないので

ちょっと属人性というか

人情報を排除しなきゃいけないんですけど

個人情報を排除しないといけないんですが

どういう質問パターンがあったかということを

試算として貯めることができます

そういった試算を貯めておかないと

次のアップデート時に

同じテストができないという状態が生まれる

ということだと思っていて

そのリクエストパターンを

片っ端から新しいモデルに差し替えた後のものに

同じようにリクエストさせてみて

同等の結果が得られるかどうかというのを

検証する必要があるだろうなと思います

そこの同等性というのも

もう人間が見て分かる世界ではなくなりつつあるので

さらにそれを別のGPT-4なりに食わせてみて

これとこれと言ってることは一緒っていうのを聞いて回る

ような世界になるんじゃないかなと思います

touden

大変ですね

という感じですけど

kokorokagami

そもそも再現性がないんでね

同じモデルに同じことを聞いて

touden

同じ結果が返ってこないんで

そうですよね

同じモデルでも同じ結果が返ってこないんで

その揺らぎを許容して運用してくださいとしか言えないのか

kokorokagami

だから今までみたいなロジカルなテストケースって

touden

作れないんだよね

kokorokagami

でも企業としては品質担保という観点で

品質で何かの基準を持ってOKしないといけないから

テスト設計はだいぶ難しいと思いますね

touden

なので言われたようにそもそも

ふんわりしたテスト構造で受け止めて

このくらいの数値出るのは大丈夫でしょうって

全体観で見て言ってお出しするしかないと

それであれば

今回のようなこういう特定モデル

特定条件に対する回答というよりは

全体ざっくり80%くらい出てればOKだよねと

いうところで見ると思うので

それであれば

メジャーバージョンアップはちょっと分かんないですけど

マイナーバージョンアップぐらいだと

吸収しきれるのかなっていう気は確かにしますね

kokorokagami

そうですね

出さなきゃいけない商品の品質によりますけど

そのうち国というかIPAとか

大きな公共機関のところから

パターンマッチングファイルがおそらくは

登場すると思っていて

GPTとかから返してきた情報を

そのまま出しても致命的なリスクを犯さないかどうか

っていうのを判定するパターンマッチングファイルみたいなのと

照らし合わせるフェーズが多分やってきて

それ自体は国としてとか公共的に

指針を出さざるを得ないものになるんじゃないかな

って気はしますね

touden

それ成立する?

kokorokagami

分からん

touden

あのほらイメージであとさ

ライオンモデルがさ

もうライオンモデルをデフォにしてるから

ライオンモデル回答率高いのは当たり前であるみたいな話があるじゃないですか

kokorokagami

はいはいはい

touden

それと同じでパターンマッチングに

チャットGPTが食ってしまったら

それの回答を第一でチャットGPTが答えてしまうので

それだけ回答精度がいいとかいう状況になって

なんかこうほんまに使えるなみたいになったり

kokorokagami

難しいですね

だから判定ロジックにも結局GPTはいるんですけどね

GPTが返そうとしてこの文言に

このパーターンマッチングに回答しそうなカテゴリは

何パーセントくらい含まれてますかっていうのを

GPTに算出させて8割以上ですねって言われたら

アウトっていうようにするとか

どんどんレスポンスが遅くなるからあんまり良くないですけど

touden

それはそのまんまを返しているかどうかを確認するって言ってる?

kokorokagami

GPT4から1回返ってきた情報に対して

そのイリーガル判定をするパターンファイルを基に

touden

そのGPT4が返してきた文言を別のGPT4にチェックさせる

kokorokagami

その判定結果が8割以上

そういったイリーガル情報が含まれてますねっていうような

判定を受けた場合はその文字列を帰却して

そのリクエストでは正常な回答ができません

別の方法でリクエストしてくださいって言ってユーザーに促す

touden

っていうようなロジックを組み込むことになるわけじゃないですか

それはチェックモデルまんまだから

kokorokagami

ごめんなさい

touden

登場人物としてGPT4が2ついて

kokorokagami

商品に実装されててメインで返す役割のGPT4と

そのGPT4のレスポンスを精査する外部GPT4みたいなのがいるっていう世界ですと

メインのGPT4は素直にリクエストを受けた情報を

自分が知ってる情報とかいろんな情報と照らし合わせだから

こうでしょうって回答しますと

その回答を少なくとも企業にとって致命的なダメージにならないような回避策を打って

ユーザーに返す施策が必要なわけじゃないですか

その某派手としてその内容をチェックするGPT4が必要なんですけど

そのGPT4に食わせる情報としては

こういうのがイリーガルパターンだよっていうのを食わせてあげないと判定ができないので

そのイリーガルパターンっていうのは公的に公表されるべき情報になるのかなという話

touden

分かりました

公的に提供するのは正解のパターンじゃなくてイリーガルパターンなわけで

kokorokagami

そうそうイリーガルパターン

touden

NGパターン集を公的指揮が出していて

それを網羅していればとりあえずNGは出ないから大丈夫であろうと

そうですね

了解しました

kokorokagami

ベースとなる情報源は多分内閣府とか官僚が持ってる近畿ワード群リストとか

放送倫理局が持ってるようなワード群とかその辺かなっていうイメージ

touden

そこら辺もなんか業界によってカラーがあるので

それな気はしますけど

網羅すること自体は問題ではないし

それは味付けでなんとかなると思うので

食わせておくことには問題はないのかな

kokorokagami

確かにそうですね

イリーガルパターンのラッパーはいっぱいいると思います

業界ラッパーとその会社ラッパーとその部門ラッパーみたいなのは

いっぱい足されるんだと思うんですけど

でもそうですね確かにNG集はいいですね

そうですねそれならなんとかなる気がしました

レスポンスが遅くなるっていうのはそういうセーサーがいっぱい入れば入るほど

もうとっくに答えは得られてるはずなのに

なかなかアプリから帰ってこないなってなるっていう

touden

まあでもそこは作り次第というか

お客さんに提供する上で必要なスペックですっていうか

仕様ですって言われてしまったら仕方がないんじゃないですか

kokorokagami

いや俺もそう思う

だから昔のインターネットが遅かった時代みたいに

ユーザー体験を損なわないレスポンス待ち

アクションがアニメーション的に至ったりとかなんかいるんだろうなって

touden

まあまあまあまあそれもありますし

先に何か10個ぐらい回答させておいて

kokorokagami

回答した後に並列で精査して一番マシなやつを出すとか

touden

そういうウェブブラウザがやってる先読みみたいな

そういう組み込み方とかそこら辺はエンジニアの腕の見せどころかなと思いますけど

kokorokagami

確かにそうか今のアイデアいいですね

返答のレスポンスを大きく3段構成にして

1段目は超一般回だけを返すようにして

そもそも回答にそういうイリーガルなものが入り得ないくらいの

一般回しか出さないっていうようなロジックで

一旦回答をゆっくり始めます

2段目で先ほどの精査したものが返ります

3段目で次のアクションとか

自社の宣伝情報とか含めたリンク集みたいなものを

ベタベタ貼っ付けていきますっていう

touden

レスポンスすれば確かに良さそう

チャットGPTが返ってくるのって

多分それやってるよねって気が今話してて思って

kokorokagami

確かにそんな気するね

touden

あいつ最初はこれこれはこういうことですねとか言って時間稼ぐじゃん

kokorokagami

稼ぐ稼ぐ

touden

それはそういうことなんでしょうね

kokorokagami

なるほどね

みんな考えてますね

考えてますねというところ

この経緯はこんなもんですか

そうですねこんな感じです

じゃあ私の方最後です

メタのLLAMA2とAzureのタイアップ

kokorokagami

速報マイクロソフトメタの最新大規模言語モデル

LLAMA2をAzureとWindowsでサポート

独自の設定的AIを開発可能に

ということでパブリックキーによるプレスリリースです

マイクロソフトは日本時間7月19日明明から

開催中のパートナー向け年次イベント

Microsoft Inspire 2023において

AI分野におけるメタとの協業を拡大し

メタがリリースした最新の大規模言語モデル

LLAMA2をMicrosoft AzureとWindowsでサポートすると発表しました

LLAMA2はこのマイクロソフトの発表とほぼ同時に

メタが発表した最新の大規模言語モデルです

オープンソースとして公開され

所有利用も可能で

AI分野で高い実績を残してきた

メタが満を持して公開するモデルとして

高い能力を備えていることが期待されています

LLAMAはパラメーター数が

7ビリオン 13ビリオン 70ビリオンの

3つのモデルに分かれており

Microsoft Azureではこの3つのモデルを

現在パブリックプレビュー中の

Azure AIモデルカタログから選択し

LLAMA2の能力と利用方法

kokorokagami

ファインチューニングしデプロイが可能

またWindowsマシン上でもLLAMA2が実行できるように

最適化される予定です

これらにより開発者は独自の生成的AIを

Microsoft AzureやWindows上で開発し

アプリケーションに組み込めるようにもなります

ということで

GAFAのうちメタ社の

AIにおける活動方針というのが

一つ明らかになった話です

私は今までクラウド環境とAIという話で

マイクロソフトが台頭してきているだろう

AWSがこんな戦略を取っているだろう

GCPがうんぬんかんぬんという話をしてきたんですが

その中でメタ社としては

そういうクラウドプラットフォームを

持っていない会社ですというところだったんですが

LLAMAはGPT3.5に匹敵するなのを言われていて

一番大きく違うところはですね

トークン数受け入れられるトークン数が

圧倒的に違うというところがあって

非常に期待が集まっていました

GPT3.5とかGPT4では4000とか8000とか

4桁台のトークン数に対して

LLAMAは10万台くらいのトークン数を受け入れられるので

より長い文章とか

そういったことにも使えるんじゃないかということで

期待が集まっていたものですね

なのでこれがAzureに登場したということは

一つ大きなポイントで

マイクロソフトはオープンAIともメタとも

AIモデルを持っている会社と提携するという形になります

つまりマイクロソフトのAzure上で

2つのAIモデルメーカーがバチバチとやり合う

という関係性ができたという状態なので

マイクロソフトはもう

そのまま商売的に高笑いするしかない状態になったということですね

あとは勝手にその人たちが競争していいものを出してくれたら

結果的にAzureが儲かるという仕掛けができたので

一つ山場を乗り越えたんじゃないかなというふうに見ています

touden

はい

いやーマイクロソフトさんすげーなーという感じですけども

うーん

何ですかね

メタ社としては

それで永遠か?

という気もせんではないですけど

なんかオープンAIは

AWSもこの前紹介しましたけど

AWSもやってマイクロソフトもやるんで

オープンAI側としては

メジャーなところは全部やる

メジャーなところに全部提供しているという立場になるのかなと思っていて

それに対してメタは今のところマイクロソフト上だけに頑張ってる

Amazon側に提供するという話を聞いてない

と考えると

ユーザー顧客取れるパイが減ってしまうのかなと思うんですけど

何なんでしょうねという感じですね

kokorokagami

この転換は仮説でしかないんですけど

そもそもこういった大規模言語モデルっていうのは

すごく一部の研究機関が作っているものであって

一般ユーザーが触れる機会など全然なく

ニュースや論文等でその最新情報が知れるものという位置づけに過ぎませんでした

という中でオープンAIとAzureのタイアップにより

Azureがインフラを提供することによって

多くの利用者が自社用に組み込めるようになりましたし

オープンAIが非常に安価かつか

もしくは無料なプラットフォームで

そのモデルに触れるインターフェースを提供したということによって

一気にその学術的な研究から大衆が利用するものに変わったわけですよね

その中でメタ社としては研究室に置いてある

このモデルっていうのを何とか同じ土壌に乗ってなきゃいけない

と言ってインターフェースを探してきましたけれども

FacebookやInstagramといったような既存のSNSプラットフォームで

何かこういうものを公開するにしても

そのチャットGPTの2番センチのお試し大規模冒険語モデル利用

みたいなことにしかならず

あまり良いアプローチではない

後追いにしてはイマイチなアプローチにしかならない

という判断があったんじゃなかろうかなと思います

そういった中で今突っ込んでいって

一番顧客にこのLLAMA2の価値を体験してもらえる場所となると

今は実写用にこういった大規模言語モデルを組み込むには

Azure一択という世界観が出来上がりつつあるので

そこに参入するのが一番良いでしょうという判断が

あったんじゃないかなと思います

touden

なるほど

メタ社から見て一番安倍にかけたというか提携したという話か

それはそうですけど

kokorokagami

多分メタ社として自社のプラットフォームとか

自社がこのLLAMAをフル活用した何かソリューション

キーアプリっていうのを出すのを諦めたわけでは全然ないと思っていて

あらゆる企業が今大規模言語モデルを味見しようという動きをしているからこそ

その味見の中にこいつがいないと

今後そういうのが出てきた時に

LLAMAなんだそれって言われるのを避けたいんだと思う

touden

なるほどね

確かにそれはあるんで

最も使われやすいプラットフォームに提供しておいて

開発者の人口を増やしておいて

ゆくゆくはメタとしてのメタバース系

今後どこまでやるかわからないですけど

メタエコシステム的なところに載せればいいかなみたいな

kokorokagami

そうですね

メタが掲げるメタバース系に突っ込んでいきたいなったら

例えばですけどUnity Unreal Engineのメーカーとタイアップして

開発用のIDEの中で

NPCの属性の一つとして

大規模言語モデルを

頭脳として持っているインターフェース

オブジェクトですという設定ができるようにするとか

そういった組み込みも将来的にはあり得ると思うんですよ

なのでそういった世界観はあるかもしれないけど

ただそこで組み込むってなると非常に開発期間がかかる話なので

先行して出せるところから出していって

使ってもらおうという試みなんだろうなと思いますね

touden

なるほど

そう考えると

よいか

なるほどね

Azureのデータセンター悲鳴

kokorokagami

Azureは単純に受け入れて

全く自己同士をしていないわけでは当然なくてですね

Azure上でこのモデルをデプロイしようと思うと

そのAzureの持っているインターフェースに

こいつらを大量に浮かべることになるので

touden

Azure側のデータセンターはかなり悲鳴を上げるはずですと

kokorokagami

ただでさえOpenAIの関係で悲鳴を上げているデータセンターに

これを突っ込んでさらに使いたい需要が増えると

ますますデータセンターの拡充と更新が必要になるわけですが

Azureも歴史が長いので

AWS同様にその古いデータセンターをどうするか問題に悩まされているはずだから

多分これが来たからやったーって言ってるのも束の間

データセンターチームが悲鳴を上げて

そんなんやりたかったらここにもっと投資しろよーって

怒ってる状況じゃないですかね

touden

物理レイヤーがね

投資されないのは問題だと思いますけど

結局物理ですからね

NVIDIAのGPU供給の課題

kokorokagami

結局NVIDIAのGPUがどれだけ仕入れられるかっていう話にもなってくるし

touden

あんまりツルハシを売ってるものが実は一番儲かってるという話になるかもしれないですけど

kokorokagami

NVIDIAはもう天下でしかないんでね

touden

そうですね大富豪ですねという感じなので

kokorokagami

というところでGARFAMの戦争の様相がまた変わってきて

下々からすると大変面白くはある感じ

以上です今日はこんなもんですかね

touden

本番組はPodcast Spotify YouTube Listenで聴くことができます

ぜひそちらでもサブスクライブよろしくお願いいたします

お疲れ様でした

kokorokagami

はいお疲れさんでした

スター

エピソードをシェアする

メッセージを送信

kokorokagami

touden

サマリー

目次

スター

コメント

こちらもおすすめ

166. 2023/07/23 AIの進化と情報収集のむずかしさ ほか

エピソードをシェアする

kokorokagami

touden

サマリー

目次

コメント

こちらもおすすめ

166. 2023/07/23 AIの進化と情報収集のむずかしさほか