1. Recalog
  2. 166. 2023/07/23 AIの進化と情..
2023-07-23 00:00

166. 2023/07/23 AIの進化と情報収集のむずかしさ ほか

spotify apple_podcasts

以下のようなトピックについて話をしました。

枕: Clusterの大型アップデート 1: ChatGPT Custom instructions 2: Twitter改め「X」 3: Visual Search in Bing Chat 4: GPT-4の精度悪化 5: Llama 2


本ラジオはあくまで個人の見解であり現実のいかなる団体を代表するものではありません
ご理解頂ますようよろしくおねがいします

サマリー

クラサーのアップデートでは、新機能やVR空間のマーケット動向についての情報が話題となっています。また、ChatGPTのカスタムインストラクションについても取り上げられています。AIの進化と情報収集の難しさについて考えられており、非常に強力なAI技術によるマーケティングの有効性やAIのチューニング設定についても議論されています。 2023年7月19日のマイクロソフトインスパイア2023のキーノートでは、リングチャットにビジュアル検索機能が実装され、手書きのスケッチ画像や画像を元にしたHTMLやCSSのコードが自動生成されることが発表されました。また、GPT-4の性能が低下していることがわかり、特に数学の回答の制度が低下していると報告されています。一方、GTB3.5では性能が向上し、結論と仮定の一致度が高まっている傾向があるようです。 さらに、マイクロソフトはパートナー向け年次イベントでメタの大規模言語モデルLLAMA2をAzureとWindowsでサポートすることを発表しました。メタ社とAzureの提携により、クラウドプラットフォーム上でAIモデルの提供が可能となり、マイクロソフトの競争力が高まりました。 一方、Azureのデータセンターへの需要増加が問題視されており、NVIDIAのGPUの供給も課題となっています。

クラサーアップデートとVR空間のマーケット動向
kokorokagami
クラサーのアップデート、いい感じですね、これ。
touden
そうですね。使ってみて結構変わったなというところはありますね。
kokorokagami
先週からではありますけど、なんか待機中にフワフワ動いたりとかしてて。
touden
はい。あと、このラジオだと歩いてないんであれですけど、歩きモーションとかもね、結構、何とですかね、自然になった?
というか、人間が歩いてる風になったという感じがあって。やっぱここら辺、何て言うんですかね、ジャンプしてみた?
kokorokagami
はい。歩いてみた。
touden
歩いてみた。ここら辺、何て言うんですかね。
やっぱりVR空間内で、より自然に自分がVR空間内に入っているという没入感を得るためには結構重要だったりする気もするので、そこら辺が頑張ってくれてるっていうのは良いことだなというところはありますね。
kokorokagami
それで気づいて、クラスターさんのリリースノートのほう見に行くと、結構かな大型なアップデートをいろいろかけてるみたいで。
クラスターさん曰く、分かりやすいクラスターAってことで、手触り、繋がり、始まりを改善するというところがコンセプトに掲げられてます。
この辺のモーション関係については手触りの話で、他にも手触りのところだと、メニューの改善だったりとか、アバターメーカー。
今私のやつとかは自作で上げてるんですけれども、こういったものをクラスター上で作れるようなアバターメーカーがあって、それの改善。
あとはサウンドも、実はモノラルな距離感だったんですけど、ステレオ音源に対応ということで、その辺も没入感が上がるアップデートが来そうですね。
touden
そうですね。
kokorokagami
繋がりっていうところだと、最後まで喋っちゃいます。繋がりっていうところだと、ユーザーが撮ったスマートフォン上の写真をフィードできる機能とか、
あとはスペースって言って、一つのワールドなんだけど、その中でもさらに分割して利用できるような感じの機能も追加されるみたいです。
今私たちってオープンに公開されてるワールドをそのまま使ってるので、たまに誰かが入ってきたりということがあったんですけど、
そういったのもスペース機能を使って分離すれば改善できる可能性があると。
あとはホームクラフトっていう機能が追加されていて、クラスターにログインした後の一番最初の初期画面ですね。
VRChatとかいろんなものであると思うんですが、そこがクラスターが提供するワールドクラフト機能で作れるようになりますっていうアップデートが入ってます。
あと始まりっていうところでは、チュートリアルとベテランユーザーによるガイドっていうのができるようになってます。
チュートリアルではクラスターが出かけるチュートリアルマップを対象にこんなことできますよっていうのを紹介するもので、
ベテランの人がガイドする系だと既存にいるユーザーが新しく入るユーザーに対していろいろ支援できるようなそういった機能が追加されますと。
個人的に一番面白いのが最後のチュートリアル系の話で、VRに馴染みがあるとか関心ある人っていうのはすでにVRChatにクラスターに入ってきているので、
これ以上の新しいユーザーを捕まえようとした時に何がハードルなのかということを考えて、おそらくそういったアプローチを取られたんだと思うんですけど、
それがチュートリアルとか新しいプラットフォームすぎて勝手がわからないっていうところが課題なんだろうと置いたのがちょっと関心どころかなというところですかね。
touden
チュートリアルに関してはそうですね。VRでいうとOculusのVRのチュートリアルとかもかなりきれいにできていて、
下手なゲームよりゲーム性が高いというか、それだけで関心できる作りだったので、チュートリアルってやっぱ大事ですよねという気がするので、
そこに力を入れるのは正しいのかなというところはありますね。
あと個人的にはやっぱりステレオ音源対応とかですね。
結構クラスター、昔から声の届く範囲が、キャラクターが遠くに行くと声が聞こえなくなるとか、
そういう空間オーディオも意識して作られてたと思うんですけど、そこステレオ対応っていうところ。
やっぱり使ってて没入感にも影響してくると思うので、ここら辺は頑張っていってくれてるのはありがたいなというところです。
kokorokagami
そうですね。私たちとしてはタタノリって言ったらあれですけど、クラスターさんにほぼほぼお金払わずにこうやって活動させてもらっているので、
こういうアップデートが全体にかかるのは大変ありがたいなと思いつつというところですかね。
touden
そうですね。棒立ちなんで、機能使ってないのは申し訳ない感じはちょっとありますけどね。
kokorokagami
そうですね。こういうメタバス空間の話も、やっぱりコロナが終わってちょっと盛り下がっているところはあるので、
どこまでその企業がイベントやったりとかでマネタリズしていると思うんですけど、そこが維持されるかどうかというところで、クラスターさん頑張ってほしいなというところですね。
touden
確かにそうですね。今はAIの方が投資の過熱感が出ちゃってますけど、現状私が見る範囲内では、言うてその前のVRブームみたいな感じにしぼんじゃってるというほどでもないと思うので、
そういう意味では根付いてくれているので、今後より大きい間口に広げていくタームになっていると考えると、今ぐらいがちょうどいいのかなという希望的観測ですけど、思ってますね。
kokorokagami
そうですね。着々と盛り上がっているんですけど、多分世界的に見てすぐ金になる技術がどっちかと言われればAIの方だったというだけの話で、
Metaverseで元々目指してた、MetaverseでというかVRで目指してた市場というのは着々と伸びているのかなとは思いますね。
touden
そうですね。
kokorokagami
Vket2023が今やってるのかなくらいなんですけど、入ってみると分かりますが企業ブースがすごく進化しててですね、
Vketって前からずっとやってるイベントですけれども、最初の頃はほぼ企業勢もハリボテを出してきて社名をドーンと出すだけで、
よく作ったねって言われる時代でしたが、今各企業のブースを見に行くと本当にVRでしかできない仕掛けっていうのを本当に作り込んでいて、
特に個人的に日清さんのカップヌードルアバターになって世界を救うみたいな意味のわからないイベントを実施されてるのが本当に良かったので、
そういったところに投資してVR空間に来るユーザーを市場として見てる企業が多いという現状自体がVRの進化を感じるなというところはあって、
そういった市場に向き合う企業が増えれば増えるほどクラスターさんも企業からの案件を受けれるんだろうと思うので、
その辺は心配はしてないんですけど、そこの市場価値があるよねって判断してた広報部とかが、みんなまた外に出るようになったから一旦いいかってなったらちょっと悲しいなって感じ。
touden
そうですね。そこに関しては大衆がどう判断するかっていうところもありますけど、
またコロナみたいな状況になるっていう可能性を考えると、そこで投資してないのは何て言うんですかね、
それはそれでなんで考え取らなかったんやということになりそうではあるので、
現状力入れてる企業さんとしては一通りやっておくっていうのは無駄にはならないと思いますし、
touden
そういう意味で結構頑張ってくれてる企業さんが多いっていうのはいいことなんじゃないのかなというか、
会社さん側としても市場価値があると判断しているということだと思いますので。
kokorokagami
私たちはそんなクラスターを応援していますって勝手に言うのも悪いけど、利用させていただいている以上はこのようなアップデートを非常に楽しみにしておりますので、
今後ともよろしくお願いしますって感じですね。
touden
今後ともよろしくお願いしますっていう感じですね。
kokorokagami
じゃあ枕はそんなところにして本編いきたいと思います。
ChatGPTのカスタムインストラクションズ
kokorokagami
1点目、ChatGPTの新しい機能、カスタムインストラクションズを最速で試してみたということで、
Kiitaで挙げている株式会社Lelic所属の熊田さんの記事です。
7月20日にオープンエイはChatGPTの新しい機能としてカスタムインストラクションを発表しました。
カスタムインストラクションズはChatGPTの応答機能をより詳細に制御できるようにするための機能で、
有効にするとその後のチャットの会話のすべてを設定に沿って回答してくれるようになります。
ということで、この話の通りではあるんですけど、非常に待望される機能がアップデートされたので共有したいと思います。
この機能を待望していた人はごく一部だとは思うんですけど、私としては非常に待望していました。
どういう機能かというとですね、よくChatGPTに投げるときにあなたはこういう回答をしてください、
こういう立場でこういう回答をしてくださいといったようなロール付けというプロンプトと、
自分が今から投げる質問に対しての事前背景情報を追加する話。
例えば私は今こういう仕事に従事していて、こういう経歴の持ち主です。
こういう問題にぶち当たりました。
なのでこの経歴の人に分かるような専門用語を使っていいので回答してくださいみたいな形で、
自分のプロファイルを伝えるというプロンプトの入力もありました。
それらの入力というのは質問が変わっても毎回同じになることが多々あるので、
そういったものを事前に設定しておけるというのがカスタムインストラクションズです。
多くの人が使う機能ではなくて一部と言っているのが、
そのロール付けということで解決できることと、
ロール付けなんかなくても解決できることというのを見比べたときに、
現状多くのUSKはそういったロール付けがなくても回答できるというものが多いので、
あんまり使われないだろうなと思いつつ、
私がウカガガとかでキャラクター付けを検討してたりとか、
そういうJAT GPTにこういうふうな応対を期待するというくらい深い付き合い方をしているような人たちにとっては、
非常に魅力的なサービスアップデートかなと思っての紹介です。
touden
これ実際の動作としては毎回このインデックスというか、
カスタムインストラクションのデータを付与してJAT GPT投げ込んでいるという状況なんですかね?
kokorokagami
内部実装がどうなっているかまで正直分かってはないですけれども、
事実上JAT GPTにはこういった情報を付与するためのシステムといわれるロールでのリクエストがあるんですよ、
もともとのインターフェースとして。
JAT GPTのWeb UIにはそのシステムに向かって直接投げるという入力フォーマットがなかった、
というところに対してできるようになったという見方が正しいかなと思います。
touden
それであれば、ユーザーとしてはより使いやすくなったという見方でいいんですかね?
kokorokagami
今の私の説明だと特に大きな内部的なアップデートがなく、
UIが追加されただけというように聞こえるとは思うんですけど、
若干だけ利用体験として違うところがあって、
さっき言ったAPAを投げるときのロールの種類として、
ユーザーとかシステムという2つあって、
普通にJATを投げるときはユーザーで投げるんですけど、
もう1つのシステムで投げると、
ITの役割とかを設定できるというところで説明をしたんですが、
そのシステムのロールでどういう文字列を投げれば、
期待通りに動いてくれるのかというのはかなりノウハウが必要で、
最初にそのシステムで投げて以降全部うまくいくかというと、
全然そんなことはなくてですね。
定期的に思い出してもらわないといけないみたいになると。
それを突き詰めていくと、結局これシステムで投げるより、
自分で毎回リクエストのときに、
こういう役割で解凍してねって付けた方が、
精度高くねって言われるくらいには、
そのシステムのロールって使いにくかったんですよ。
今回JAT GPTでそこを使う専用のインターフェースを用意してくれて、
そこにこちらが期待するものを入れると、
本来そのシステムで機能してもらいたかったことが、
その通りに機能して返ってくるという状態が今作れているので、
APIを正しく機能させる上でのラッパーとして、
すごく便利かなという体験にはなってます。
touden
なるほど。確かに毎回付けるのはめんどくさいし、
文字数が多くなるんで金がかかるとか。
kokorokagami
トークン数ですね。
touden
トークン数かかっちゃうとか、そういうところもあると思うので、
そういう意味では使いやすくなっていいのかなというところですね。
あとあれですね、JAT GPTよくわからない人に対して
AI技術の進化とマーケティング
touden
使ってみてくださいよという、
弊社が提供しますみたいな、
条件付けさせて顧客に提供するというような状況に対して
非常に強力だと思うので、良いのかなと思いますけど、
でもそれを言うと昔話してたように、
設定してたけどそこからジャイロブレークみたいな感じで
抜け出せられるとか。
そこら辺あるとどうなんだろうなというところもあるんですけど。
それは全然ありますよ。
kokorokagami
今回のこの機能を使って、例えばギャル語で回答してください
みたいな設定をするとそれじゃないですか。
その相手に対してプログラミングコードこういうのを実装してください
って言った時の回答でギャル語を書いてくれるかって言ったら
まず書いてくれないので、できる限界はありますね。
なるほどね。
touden
まあそれでも、さっき言った通り毎回使うために
セッティングを読み込ませないといけないみたいな
めんどくさいことにはならないという点だけでも
十分使い勝手はいいと思うので、良いですねと思います。
kokorokagami
これが公式が出してくれるっていうのがいいですね。
そうですね。
非常にまたChatGPTのポテンシャルを感じられるような
一つの機能だと思いますね。
商用とかで考えると、さっき東電さんが言ってた通り
利用ユーザーに合わせて回答するっていうところなんですけど
そのチューニングパターンとして一つ試す余地はあるんですが
なかなか下手なチューニングができないので
難しいなと思うところはあります。
例えばユーザーに対してですね
根節丁寧なチューニングをしようと思うと
おそらくこのユーザーは
小学校1年生くらいのまだあまり
こういったことに馴染みのないユーザーですっていう
本当に無知で言ってしまえばバカな人を相手に設定する方が
より正しくユーザーフォローアップ力の高い回答が得られるはずなんですけど
そんなことをバカ正直に書いて
ユーザーに伝わった日には大事になりかねないので
適度にその辺をチューニングする必要があって
なかなか面白い問題にあたりますね
touden
そこはでも自然言語的にオブラートに包んで
GPTに渡すことで
kokorokagami
いい感じに回が平たくなる優しくなる
touden
というようなチューニング設定をするっていう
kokorokagami
プロフェッショナルな仕事ができるんじゃないですか
もしかしたらチューニングの中で
ブラックボックスにするチューニングと
ホワイトボックスにするチューニングみたいなのがあるかもしれないなと思ってて
まさにセキュリティと機能制限みたいな感じがするんですけど
アプリケーションとしての機能制限って
オープンに制限はどういうものですというのをしておいて
ユーザーの理解とシステムとしての妥当性を評価するという方針で
実装されることが多いと思うんですが
セキュリティは逆にブラックボックス化して
勝手にチェックされてる
そのチェックさえ通ってれば大丈夫みたいな位置づけにして
ブラックボックス化する方がアタックも受けないし
いいよねっていう世界になってると思うんで
そういう関係性がもしかしたら
このプロンプトからモデルの間で行われるのかもしれないですね
touden
まあそうっすね
GPT-4を使った設定と限界
touden
話聞いてて思いましたけど
そこまでちゃんとやるんだったら
このプロンプトに依存せずに
自社側で一回ラッパーしろという感じがすごいしますね
kokorokagami
わかりますね
ラッパー層がいくらあっても足りない世界になってきますね
この件はこんなことです
touden
では次にてめ私の方から
アイテムイデニュースさんの記事です
まもなくツイッターブランドへさよならだとマスクし
Xの新ロゴデザイン募集中というタイトルの記事になります
ツイッターのオーナーイーロンマスク氏は
米国時間の7月22日土曜日の夜
プラットフォームカラーを現在の青から黒に変える
投票ツイートを投稿し
その後でそしてすぐにツイッターブランドに別れを告げ
段階的にすべての鳥たちにも別れを告げるだろうとツイートしました
国の優れたXのロゴが投稿されれば
それを明日世界中で公開しようとも
このツイートを受け
多数のユーザーがXのロゴデザインを投稿している
マスク氏はその後
家電をあまりスマートにすべきじゃないようななどとツイートしており
ロゴ変更のツイートは土曜日の夜の気まぐれのひとつのようにも見える
4月にも一時的にツイッターロゴを柴犬に変更しすぐに戻している
マスク氏は
ツイッター買収完了当時
ツイッターの買収はすべてのアプリであるXの構築を促進するものだとツイートしており
ツイッターをXというブランドに変更する可能性もなくはなさそうだと
いうことで
毎回のごとく適当言ってんなという感じではありますけども
補足情報といいますか
なんといいますかという感じなんですけど
マスクさんイーロンマスクさんスペースXもXですし
新しいXAIという会社も設立してますし
なんかこうX好きな人なんやなというところなんで
そのうちスマホのアイコンがXになるんじゃないかなという感じですという話です
kokorokagami
そうですねX好きなのは日本も買わなくてプロジェクトXとかみんな大好きなんで
きっと世界共通でXは大好きなんだと思いますね
X銘とかもそうだし
touden
まあ確かに
kokorokagami
ほらDXもXだしね
touden
まあ確かにねあれは何というか無理矢理じゃんという感じもありますけど
kokorokagami
そうですねツイッターは本当にどこに着地するのか分からず
またツイッター難民が溢れて結局ツイッターに帰ってくるみたいなループを通る人が出てきそうな話ですけど
touden
そうですねまあでもだいたい手段がね出ては消え出ては消え出て消えてはいないですねごめんなさい
という感じでまあでもなんか
まあ見切りの早い人はもうツイッターに投稿しなくなってきてる感じもあるので
なんか空中分解してるなという感じですけども話はずれますけど
とは言いつつもツイッターがまだメインストリームこの工業タイプのXNSとしてはメインストリーム感がまだあるかなという気はしていて
Facebookが出してたスレッズも
一時期めちゃくちゃ登録者数が増えたけど
今アクティブ稼働数でいうとツイッターの10分の1以下まで減ってしまっている
という感じがあるらしくて
なかなか移動
民族大移動するの難しいなという感じの印象です
kokorokagami
そうですね新規登録者数も完全に頭打ちになってツイッターの5分の1と思ったのかな
touden
はいそうですね
5分の1確保してるだけですごいというかめちゃくちゃすごいんですけどね
kokorokagami
そうですね2億人くらい
1億人がアクティブユーザーだという時点で十分すごいんですけど
そうですね
ツイッターの未来とニュースサイトの難しさ
kokorokagami
アップデート予定とかはちらほらスレッズも聞こえてきて
ツール内翻訳とかが機能するようになるんで
他言語コミュニケーションを加速するためのアップデートを促していきたいみたいなそんな感じの方向性も見えて
少なくともツイッターの未来よりは比較的共感できるアップデート方針が見えますね
touden
はいそうですね翻訳機能は機能としては成熟してると言って使えないと思いますから
しツイッターも実装してて結構それで使いやすくなったなという印象もあったので
そういうものが入ってくるっていうのは非常に使用者としてはありがたいなというところですね
kokorokagami
そういう対等するものが出るまでのつなぎとして現状アンテナの張り方を見直さないといけないんですが何があるかって話ですよね
touden
そうですね難しいですねという感じで
結構このラジオのネタもツイッターで漁ってた時期があったんですけど最近やっぱり
ツイッター稼働しててもなんか上手い具合に情報源として使えてないなぁ感もありつつのかといって今更またRSSなんですかという
RSSの悪口言うとこのラジオやっていけないですけど今更RSSなんですかという感じもしてどうしたもんかなと思ってるところです
kokorokagami
そうなんですよねあのツイッターが良くてニュースサイトがダメな理由っていうのがもう明確にあって
そのニュース記事のサイトとかで取り上げられるものっていうのは当たり前ですけどお金がかかるので
なるべく多くの人に刺さるものっていう探し方をして記事化するじゃないですか
書き方もなるべく多くの人にわかるようにということであまり掘り下げずに終わるということを意識してそこに留めているのが基本的にニュースサイトだと思っていますと
私たちが知りたいのって一時期ロケットの爆発してしまった原因を調査とかで
JAXAが出してきた調査レポートのPDFやパワーポイントが知りたいみたいな世界を喋ってるわけじゃないですか
そんなニュースサイトに載せるわけないので当たり前ですけどそれを読んでわかる人が少なすぎるから
そうなった時にそういうコアなユーザーが簡単にたどり着ける導線が唯一ツイッターだったっていうことなんですよね
touden
そうですね
kokorokagami
それの代わりになるものっていうのをニュースサイトにまた戻っていいのかって言われるとやっぱり無理だし
おっしゃる通りRSSで探す先って言ってもRSSの登録できるサイト自体がそういうコアな情報を拾えるようなものでなかったりとか
当たり前ですけどさっきのパワーポイントとかになってくるとそんな報告書って直接RSSフィードに引っかかるようになってないから
結局たどり着くのに2,3万回フェーズが必要だったりとかするしなかなか難しいんですよね
touden
なかなか難しいんですよね確かに自分で見に行けっていう話はなくはないんですけど
自分で見に行ってると日が暮れてしまいますし
誰かが見つけてくれた面白そうなものというのをキャッチアップするのが難しい
そうですねTwitterぐらいしかキャッチアップできないっていう現状から移動できないなというところですね
kokorokagami
あとは頑張って人を探すっていう世界ですよね
本当にコアなことをやってる中の人だったりとかそういうコミュニティだったりに参加してるユーザーだったりっていうのを探してきて
例えばFacebookとかその人が移行したであろうプラットフォームを探し出してフォローするっていう
そういう世界になってくるのかなという気はしますけど
touden
まあそうですね
kokorokagami
その場合Twitterと違ってダメなところが一つは明確にあって空発性がないんですよね
touden
Facebookだと?
そうそうそうFacebookとかだと
kokorokagami
関心はあるカテゴリーだけどフォローしてない人がチラッと流れることがなくなっちゃうじゃないですかFacebookだと
touden
まあ確かにそうですね
kokorokagami
だからそういう意味だとスレッツの方がまだいいんですけど
まあスレッツはさっきの状態なので今時点では大体にならないしっていうところがあって難しいですね
touden
はい
kokorokagami
まあその古いものにしがみついているだけではあると思うので
touden
まあ何でしょうね
プラットフォームの軸足をずらしてもいいんですけど
結局そういう情報源が今現状でどちらに多く流れているんだっていうとTwitterなんだなという気もしているので
kokorokagami
まあそうですね
touden
て感じですね
kokorokagami
まあ海外の情報に絞ればねスレッツは結構流れてくると思うんですけど
touden
まあね
kokorokagami
日本ユーザーが少ないだけなんで
touden
まあそこを含めて確かに翻訳機能とかね付加機能が追加されることでTwitterにはない情報源として使えるようになれればアクセス頻度は上がる気がするので
そういう意味では根性を入れてサービスを続けてほしいなというところスレッツの方側が
kokorokagami
はいはいはいそうですね
あと次にやってくる移行タイミングとしては公共系ですね
公共系自治体地方自治体とかがもうTwitterを一つの社会インフラとして捉えて各自発信できるようになってるじゃないですか
そういうものも集まってるからそのTwitterに入っておくと地域のことも知れるし自分の関心度も知れるっていう一石二鳥プラットフォームになってましたと
でLINEもそうあろうとしていて人同士のつながりと地域の情報を両方足すをやってるんですけど
その強豪があるからちょっとTwitterのいいところを分解してこれはこここれはここってやっていくしかないのかもなとは
なるほどね
touden
公共系はLINEで補填してやって情報系は別のサービスで補填してやって確かにそうですね
kokorokagami
その地方自治体が明確にこのSNSに行こうみたいな次のアクションがあったらもうその時に正式に決めるみたいなストーリーですかね
touden
今FacebookとかやってるFacebookはやってそうだなちょっとFacebookアクセスしないからなんですけど
でもインスタとかは多分やってないんですよね自治体系はあんまり
kokorokagami
企業っている場所にも文書にもいると思うんですけど環境部門とかはやってるんじゃないですかね
touden
なるほど写真として投稿するものがいっぱいありそうなところはやってますって感じかな確かに
確かにね企業ブランドとかも結構インスタはやってはいるのでそういう意味では確かにインフラとしてはインスタでもいいのかもしれないですけど
kokorokagami
あとうちの自治体でいうとホームページに来てくれるユーザーっていうのが少ないっていう風にもう舵を切って
touden
ホームページでやってる機能をLINEに載せるっていうのをやってたの
まあその方が正しい気はしますけどね
kokorokagami
LINEでその地方自治体の通話のところに行くとタイル上のメニューが出てきて
そのメニューを選択すると普通に中の機能が紹介される
この手続きはこうですっていう動線があったり
普通にLINEのチャットでチャットボット的に引き継ぎができるっていうのをやってたりするので
そういうのも増えていくのかなという感じですね
touden
いやでもその方が絶対いいでしょう
なんかこう市のホームページとか行くと
なんて言うんですかそのクーレベルって言うんですか
その細かい単位のやつがざーっと並んでて
自分のとこどこだっけポチポチ探していかないといけないの
たまによくあるんですけど
あれ結構手間ですしなんか欲しい情報にたどり着かなかったりするんで
LINEで個人情報を設定しておいて
自分の住んでるところの情報を出してくれてっていうのはかなりありがたいですね
kokorokagami
結構ありがたいですよ
だから自分ちのゴミ捨てが何曜日かっていうのをちょっと聞きながら
っていう風に別のプラットフォームに行こうっていう話もあるから
自分がTwitterに何使ってどういうことを期待しているのかを
ちょっと切り分けずつ探すしかないのかもですね
touden
そうですね
kokorokagami
はいこの辺ですかね
touden
はい
kokorokagami
はいでは次行きます
3つ目
ビジュアル検索機能の実装
kokorokagami
リングチャットの新機能ビジュアル検索で優しい世界ということで
KDDIアジャイル開発センター株式会社のS3KZKさんが書かれたキーとの記事です
2023年7月19日から開発されている
マイクロソフトインスパイア2023のキーノートにて
リングチャットにビジュアル検索機能が実装されたことが発表されました
その名前がVisual Search in Ring Chatという名前になっています
何ができるかというと
入力として手書きのスケッチ画像と
画像を元にしたHTMLと
イケてる見栄えにするためのCSSを作ってくれという指示を与えることで
完璧とは言えないものの入力項目やボタンなどスケッチに基づくコードが生成できるというようなデモが流れていました
この例ではそういうコード生成のデモですけど
単純に画像を読み取らせて
この画像ってどのような画像ですか
どんな情報がありますかとかを調べることができます
私ちょっとお試しでですね
家の図面引っ張り出してきて
食わせてみて
この図面はどういう図面ですかっていう質問から
どの部屋がどんな場所にありますか
寸法はどんなんですかっていうのを片っ端から聞いてみて
一通り正解を返してきたので
なかなかイケてるなって感じです
先ほど言ってたデモが
今回新しい機能としてすごいと囁かれているのが
その画像を元にそこにあるコンテキストを組み取って
そのプログラミングコードにできるというところがすごく評価されています
今まで私たちプログラマーというのは
みんな仕事上そうかもしれないですけど
テキストで要件定義 要求しようと書いていって
それを指示を出すということができていました
チャットJPGではそういう要件定義に基づいて
仕事をしたり CSS プログラムを書いたりとかはできていました
なのでそこにあんまり大きな違和感はなくて
私たちが普段からやっていることの一部が
AIに取って変われるようなことができるようになったのが
すごいなという世界で話してたんですけれども
これは誰かの頭の中にあるアイデアのスケッチを元に
実装にたどり着いているので
その間にあったこのアイデアというのは
つまりどういうことでいいといったところを
完全にすっ飛ばして実装に進められるというところがあって
非常に大きなインパクトのあるデモとなって
touden
紹介されているというところになります
プログラミングコードの生成
touden
これ 何ですかね
顧客が本当にやりたかったことというか
エンジニアが本当にやりたかったことって感じがしますけど
良いんじゃないでしょうかという感じですけど
kokorokagami
何ですかね
touden
要件定義書がこういうものを作ってくださいって言って
そこからもう実装してくれているのが
自動でできるということで
本当に単なるエンジニアはいらないかなってなってしまう
とは思います
kokorokagami
何かそれでいいのかと言われるといいと思うんですけど
touden
何でしょう
でもいいのか
要件定義書が間違っていると間違っているものが出るよね
っていうことを言われているというより
この記事的には要件定義書を変な具合に解釈してしまっているという
人間でもありそうなことが
このビングチャットで起こっているというところが面白いところですけど
何でしょうね
ここら辺プログラミングツールとしては良くないんでしょうけど
何ですかね
非常に人間らしくていいなという感じですね
kokorokagami
そうですね
人間としても
似たような要件を言い換えて言い換えてこうこうこうって
いろいろインプットした結果
エンジニアのアウトプットが意味不明なものになって仕上がってくる
よくありますからね
touden
よくありますし
これはその頼んでないキャンセルボタンが追加してたからつって
いろいろ言ったら変なことになったということが言われてますけど
これ普通に人間でも起こり得る話だと思いますし
プログラミングって入力したものがすぐ返ってくるっていう
界隈だったと思いますけどここはそうではないというところなんですけど
ツールとしてはこっちの方が良いのかな
良い気がするなという
どう思われます
kokorokagami
私はこっちでいいと思います
前回か前々回かに話したと思うんですけど
結局100%の商品をこれで作れることはないですと
AIで作れることはなくて
80%の性能でPOCを高速で回す
エンジニアに頼らずに回すという世界の話をしてたと思うんですけど
その世界においていじいじ明文化っていう作業がいるんかと言われたら
まあいらんよねっていう話だと思うんで
プログラミングツールとしての活用
kokorokagami
こっちの方がいいと思いますね
touden
なるほど
要件定義書を考える手間が時間を浪費するなという話でしたもんね
確かに
そうそう
確かにそれはそれでいい
ただこのビングチャットさんが
吉野に会わせてもらって
それがちょっと予想と違ったら
kokorokagami
そこでこねてくださいというお話ですね
そうですね
見方を変えるともう一つできる姿があってですね
フォトショップとかで適当なスケッチの絵を描くと
それを成形してこういう絵でしょうかって感じで
touden
綺麗な最後のアウトプットの絵を描いてくれる機能ってあるじゃないですか
kokorokagami
あれのプログラミング言語版ではあるんですよねこれ
まあ確かに
なので企画会議とかでホワイトボードに向き合いながら
みんなでこういうのがいいかなあいうのがいいかな
こんなイメージだよねっていうのを書いていきますと
で最近はそのホワイトボードのエッジを捕まえて
余計な情報をカットしてホワイトボードの中身を
綺麗な平面の画像として取り込む機能が
マイクロソフトレンズとかそういったものに入ってたりするので
それで画像化してでこのビングにそのマークを合わせたら
コードとして動くものができるから
その打ち合わせの最後10分くらいで出来上がったコードを
みんなでポジションで触ってこんなのこんなのって言って
終われば最高って感じですよね
touden
はい確かに
そう考えると
なんかそのアドビさんは昔からすごいことしてたかなという感じですけども
まあ確かにそういうことですね
データをいい感じに情報量を削減して
近接近似かなんかで整形して
ベクターで表せられるようにするってところが
アドビさんが昔書いてたこと
ベクターで表せられるってことはコードで別に表現できるでしょっつってね
コードで表現しましたというだけの話ではあるので
kokorokagami
まあ確かにそれはそうですねという感じですけど
そうですね
あとはそうだな
まあどこまで著作権的に引っかかるかわかんないですけど
この例でもう少し効率化を考えるんだったら
どっかのベースをしたいホームページを探してきて
それを画像として出力します
Photoshopに加わして一回文字列をPhotoshopに指示出して
全部白塗りするか消してもらいますと
普通の背景画像で埋めてもらいます
手書きでタイトル入れたいところに自分たちのサービスのタイトル入れたりとか
片っ端から文字列そこに手書きで埋めていって
出来上がった画像をこいつに壊して綺麗な生成をしてもらったら
touden
はいホームページできたみたいなね
まあそれだと原型が残るってちょっとあれですけど
まあそのMockレベルではねそういうこと全然あると思うので
まあ確かに
そうですね
いちいち手打ちをしなくていいというのは確かに
kokorokagami
かなりコース削減できるんでいいですね
いいですね
またiPadとかPhotoshopとかあの辺が
あの会議室に埋め込まれるっていう時代が一時期ありましたけど
あれの再現があるかもしれない話ですね
touden
はい
まあそうですね
やった方が便利になるんでやれば嬉しいなと思いますけど
kokorokagami
うん
いやカイロ屋さん的にはアーキテクチャ図書いたら
カイロキャドウを図面に変換してくれるのが一番ですけどね
touden
まあそうですね
アーキテクチャ図レベルだとちょっと情報量不足しすぎな気がしますけど
まあ確かにそうですね
kokorokagami
チップ形式書いたりとかFET記号を手書きで書き出すとちょっとめんどくさいもんな
touden
まあでもあれか
なんかその前のカイロ図と前のアーキテクチャ図と
新商品のアーキテクチャ図があったら変わったところを
いい感じに接続を変更して
なんか通信方式変わったんでじゃあこっちに変えてくださいつったら
まあそれに合わせたICが自動的に乗ってくるみたいなやってくれるとかなり楽なんで
確かにそういう意味で言うと食わせるデータがあれば精通すると思いますし
確かにかなり嬉しいあったら嬉しい機能ですね
kokorokagami
アートワーク設計もここからやりたいね
手書きで大体の部品配置こことこことここでバスこの辺電源この辺って言ってざっくりで書いて
touden
でアートワーク上で部品配置
kokorokagami
こういうファイル出せたと思うからそれで入ってもらって
あとは自動配線機能とかあの辺をピッと活かしたらある程度寄ってくるのかな
touden
まあどうなんだろう最近ちょっと引いてないんでわかんないですけど
プロユースだとあるんじゃないかな
どうなんだろうわからん
その前の回路図をインポートして部品の配置図を置くことができれば自動配線機能自体はあるからできそうな気がしますけどね
まあそれが結局ユーザーの求める回路図なのかって言われるとどうかわかんないですけど
kokorokagami
気にしなくていいその優先度が低いところはもうそれで引いたのでもういいと思いますし
毎回バス書いて集短抵抗を同じように置いてっていうあれ鬱陶しいじゃないですか
あれだけでもねパパッとやってくれると
touden
まあそういう面白い新しいインターフェースの紹介でした
では次私の方から4つ目
GPT-4の制度の悪化
touden
GTB4の制度は悪化している3月に解けた数学の問題解けずGTB3.5にも敗北米国チームが検証というこれもITメディアさんの記事です
GTB4の制度は時間とともに変わっているそんな研究結果をスタンフォード大学と米カリフォルニア大学バークレー校の研究チームが発表した
3月6月時点のGTB4の制度を比較したところ一部タスクでは制度が大きく悪化していたという
ただしこの論文は所属前のもので第三者によるレビューは受けていない
GTB4は米オープンエアが提供する大規模言語モデルでありますと
実験ではChatGPTに対して数学の問題の回答機密危険な問題に答えを出すか
高度の生成 視覚的推論の4つのタスクを依頼しそれぞれの制度を比較した
その結果GTB4の制度は一部タスクで3月より悪化していることがわかった
逆にGTB3.5では制度が向上しているケースも見られた
例えば数学の問題の回答ではChatGPTに対して
17,077は素数かステップバイステップで考えはいかいえで答えてください
とか素数かどうか判断する問題を500問提示した
結果GTB4の制度は3月版で97.6%だったが6月版では2.4%まで低下
回答で生成した文字数は3月版で平均821.1文字だったのが
6月版では平均3.8文字まで減少した
これについて研究チームはステップバイステップで考えているかがポイントであると解説する
3月版GTB4は素数であるかを判断するために偶数であるか判断するなど
段階を踏んだ上で最終的にはいえの結論を出しタスクを研いでいた
しかし6月版は段階を踏んで考えるという指示に従わずただ答えだけを示す傾向があった
一方3月版GTB3.5の制度は7.4%だったのが6月は86.8%まで向上
回答の文字数は3月版で平均747.4文字だったのが6月版は平均1081文字に増加していた
研究チームはGTB3.5は3月時点ではまずはいえの結論を出してからそこに至った仮定を段階ごとに示していた
3月版では結論と仮定が異なる傾向が高かったが6月版ではそれが修正されていたようで制度が高まったと考えられると見解を示す
その他機密危険な問題に答えを出すかのタスクでは個人情報などを含む機密情報を回答するよう指示した時の回答率を計上した
結果GTB4は3月版よりも6月版の方が回答率が下がっていることがわかった
一方GTB3.5では3月版よりも6月版の回答率がやや増加していた
高度の生成を依頼したところGTB4の3月版では生成物の50%以上が実際に実行可能なものであったが6月版ではその数は10%まで低下していた
GTB3.5でも同様の傾向が見られた
6月版の出力結果を見ると余分なテキストや引用符などを追加しておりその影響だと研究チームは推測している
視覚的推論のタスクでは簡単なパズルを仕込んだ画像を入力しそれを答えさせた
GTB4で3.5ともに6月版の方が僅かに性能が向上している傾向が見られた
一方3月版のGTB4が正解していた問題を6月版で間違えるなどのミスも見られた
研究チームは今後も長期的視点でのLLMの性能評価を行う予定
今回の実験結果のデータやチャットGPTの回答はGitHub上で公開している
味付けの問題にもよりますけど
定点観測していって回答レベルが極端に増減するという状況が今見えているという話らしくて
何というんですかね
いいものを作ろうとしていてその過程でこうなるというのは分かるで
違いにこの結果自体が直ちに悪いという話ではないとは思いますと
例えばそのGTB4 6月版に最適化した質問の仕方をすれば回答の正答率が上がるとか
そういうこともあると思うので
この結果をもって何か良くなった悪くなったっていうのは難しくはあると思いつつ
あくまで定点観測なんで定点観測の難しさ
GTB3.5の制度の向上
touden
例えばステップバイステップで考えっていうのは結構GTB3.5でうまくいくマジックワードみたいにもてはやされていたので
それが使えなくなっているというのは結構衝撃的だなというところでの紹介でした
kokorokagami
ありがとうございます
私も基本的には同じ感想です
まず背景として抑えなきゃいけないポイントが2つかなと思っていて
一つがそもそもGPTモデルは数学に弱いという話と
もう一つがオープンAIが今取り組もうとしている主な方針が中立性の担保だと思っていて
そこの話がありますと
まず前者の数学の話からでいくと
たった5桁同士の掛け算でもGPTは解けないです
掛け算が解けないレベルのモデルに対して素数を評価させるということ自体が
適当な定点観測方法なのかどうかというのはまた議論の余地がありそうですけれども
そんなレベルのGPTさんであれば
状況によって解答できるできないが変わってくるというのは
よくあり得る話かなと
もともと強くないというのは
答えの品質 精度がばらつくということなので
チューニングしたバダフライエフェクト的な影響を受けやすい領域だと思うので
おっしゃる通り今回のチューニングによって
一時的にそうなった可能性ももちろんありますし
それを回避する必要な仕方ももちろんあるでしょうというのはその通りだと思います
もう一つ中立性のところのチューニングなんですけれども
もともとOpenAAはChat GPTに搭載する形で
いろんな政治的なものとか個人の情報
会社の情報等々を出さないように制限をかけていました
ただ先ほど出たようなジェールブレイクの話があって
そういう制限を取っ払って使おうとする人が絶えないですと
いった中で根本的なモデルに学習させるレベルで
そういうのをなるべく出さないように
無駄な情報をあまり出さないようにするというような
試みを行われていると思っていて
それがそもそも回答の文字数が減少しているという傾向に
現れているんだと思っています
なのでそういった過程で情報をあまりオープンにしない
使わせないようにした結果
こういうステップバイステップの処理系自体が弱まってしまった
ということもあり得るんじゃないかなと思います
touden
確かにそうですね
考えている過程を開示しろと言われてしまうと
その状況でこの資料を参照しましたとか言われたりすると
かなり困ってしまうので
そういう意味ではニーズにあったより良いものをお出しした結果
文字数が下がっているというのは
そう言われると順当かなというところですね
でも聞いてて思ったんですけど
中立性の担保とチューニング
touden
これを売り物として使おうと思う企業側は大変だなという感じが
すごくあるなと思っていて
相互感性がないので
例えばGDP3.5でうまく動くようにシステムを組みましたと
ただGDP3.5はそういうセキュリティ上の危険があるので
使えませんと
もっと容器を満たしたものにしてください
じゃあGDP4ですねと言われた時に
単純に乗せ替えるだけではダメで
まともな結果が出るように作り直さないといけない
ということになるわけですよね
まるまるじゃんってなってしまうんで
それはそれで何て言うんだろうな
すごくコストがかかってしまって
製品の設計が難しい
製品の設計というか
開発コストがかかりすぎるなというところが見えるなというところで
そこをちょっとどうにかしたいなと思いますね
kokorokagami
理想論だけ言いますね
理想論だけ言うと
こういった大型モデルというのは
そもそもオンプレで動かせるようなサイズをしていないので
クラウドで動かすしかないです
クラウドで動かすということは
インターネット上のAPIを使って
リクエストすることになります
なのでAPIをリクエストされる過程で
そのリクエスト分というのを
ログとして収集する余地があります
そのログをそのまま収集すると
個人情報とかに引っかかりかねないので
ちょっと属人性というか
人情報を排除しなきゃいけないんですけど
個人情報を排除しないといけないんですが
どういう質問パターンがあったかということを
試算として貯めることができます
そういった試算を貯めておかないと
次のアップデート時に
同じテストができないという状態が生まれる
ということだと思っていて
そのリクエストパターンを
片っ端から新しいモデルに差し替えた後のものに
同じようにリクエストさせてみて
同等の結果が得られるかどうかというのを
検証する必要があるだろうなと思います
そこの同等性というのも
もう人間が見て分かる世界ではなくなりつつあるので
さらにそれを別のGPT-4なりに食わせてみて
これとこれと言ってることは一緒っていうのを聞いて回る
ような世界になるんじゃないかなと思います
touden
大変ですね
という感じですけど
kokorokagami
そもそも再現性がないんでね
同じモデルに同じことを聞いて
touden
同じ結果が返ってこないんで
そうですよね
同じモデルでも同じ結果が返ってこないんで
その揺らぎを許容して運用してくださいとしか言えないのか
kokorokagami
だから今までみたいなロジカルなテストケースって
touden
作れないんだよね
kokorokagami
でも企業としては品質担保という観点で
品質で何かの基準を持ってOKしないといけないから
テスト設計はだいぶ難しいと思いますね
touden
なので言われたようにそもそも
ふんわりしたテスト構造で受け止めて
このくらいの数値出るのは大丈夫でしょうって
全体観で見て言ってお出しするしかないと
それであれば
今回のようなこういう特定モデル
特定条件に対する回答というよりは
全体ざっくり80%くらい出てればOKだよねと
いうところで見ると思うので
それであれば
メジャーバージョンアップはちょっと分かんないですけど
マイナーバージョンアップぐらいだと
吸収しきれるのかなっていう気は確かにしますね
kokorokagami
そうですね
出さなきゃいけない商品の品質によりますけど
そのうち国というかIPAとか
大きな公共機関のところから
パターンマッチングファイルがおそらくは
登場すると思っていて
GPTとかから返してきた情報を
そのまま出しても致命的なリスクを犯さないかどうか
っていうのを判定するパターンマッチングファイルみたいなのと
照らし合わせるフェーズが多分やってきて
それ自体は国としてとか公共的に
指針を出さざるを得ないものになるんじゃないかな
って気はしますね
touden
それ成立する?
kokorokagami
分からん
touden
あのほらイメージであとさ
ライオンモデルがさ
もうライオンモデルをデフォにしてるから
ライオンモデル回答率高いのは当たり前であるみたいな話があるじゃないですか
kokorokagami
はいはいはい
touden
それと同じでパターンマッチングに
チャットGPTが食ってしまったら
それの回答を第一でチャットGPTが答えてしまうので
それだけ回答精度がいいとかいう状況になって
なんかこうほんまに使えるなみたいになったり
kokorokagami
難しいですね
だから判定ロジックにも結局GPTはいるんですけどね
GPTが返そうとしてこの文言に
このパーターンマッチングに回答しそうなカテゴリは
何パーセントくらい含まれてますかっていうのを
GPTに算出させて8割以上ですねって言われたら
アウトっていうようにするとか
どんどんレスポンスが遅くなるからあんまり良くないですけど
touden
それはそのまんまを返しているかどうかを確認するって言ってる?
kokorokagami
GPT4から1回返ってきた情報に対して
そのイリーガル判定をするパターンファイルを基に
touden
そのGPT4が返してきた文言を別のGPT4にチェックさせる
kokorokagami
その判定結果が8割以上
そういったイリーガル情報が含まれてますねっていうような
判定を受けた場合はその文字列を帰却して
そのリクエストでは正常な回答ができません
別の方法でリクエストしてくださいって言ってユーザーに促す
touden
っていうようなロジックを組み込むことになるわけじゃないですか
それはチェックモデルまんまだから
kokorokagami
ごめんなさい
touden
登場人物としてGPT4が2ついて
kokorokagami
商品に実装されててメインで返す役割のGPT4と
そのGPT4のレスポンスを精査する外部GPT4みたいなのがいるっていう世界ですと
メインのGPT4は素直にリクエストを受けた情報を
自分が知ってる情報とかいろんな情報と照らし合わせだから
こうでしょうって回答しますと
その回答を少なくとも企業にとって致命的なダメージにならないような回避策を打って
ユーザーに返す施策が必要なわけじゃないですか
その某派手としてその内容をチェックするGPT4が必要なんですけど
そのGPT4に食わせる情報としては
こういうのがイリーガルパターンだよっていうのを食わせてあげないと判定ができないので
そのイリーガルパターンっていうのは公的に公表されるべき情報になるのかなという話
touden
分かりました
公的に提供するのは正解のパターンじゃなくてイリーガルパターンなわけで
kokorokagami
そうそうイリーガルパターン
touden
NGパターン集を公的指揮が出していて
それを網羅していればとりあえずNGは出ないから大丈夫であろうと
そうですね
了解しました
kokorokagami
ベースとなる情報源は多分内閣府とか官僚が持ってる近畿ワード群リストとか
放送倫理局が持ってるようなワード群とかその辺かなっていうイメージ
touden
そこら辺もなんか業界によってカラーがあるので
それな気はしますけど
網羅すること自体は問題ではないし
それは味付けでなんとかなると思うので
食わせておくことには問題はないのかな
kokorokagami
確かにそうですね
イリーガルパターンのラッパーはいっぱいいると思います
業界ラッパーとその会社ラッパーとその部門ラッパーみたいなのは
いっぱい足されるんだと思うんですけど
でもそうですね確かにNG集はいいですね
そうですねそれならなんとかなる気がしました
レスポンスが遅くなるっていうのはそういうセーサーがいっぱい入れば入るほど
もうとっくに答えは得られてるはずなのに
なかなかアプリから帰ってこないなってなるっていう
touden
まあでもそこは作り次第というか
お客さんに提供する上で必要なスペックですっていうか
仕様ですって言われてしまったら仕方がないんじゃないですか
kokorokagami
いや俺もそう思う
だから昔のインターネットが遅かった時代みたいに
ユーザー体験を損なわないレスポンス待ち
アクションがアニメーション的に至ったりとかなんかいるんだろうなって
touden
まあまあまあまあそれもありますし
先に何か10個ぐらい回答させておいて
kokorokagami
回答した後に並列で精査して一番マシなやつを出すとか
touden
そういうウェブブラウザがやってる先読みみたいな
そういう組み込み方とかそこら辺はエンジニアの腕の見せどころかなと思いますけど
kokorokagami
確かにそうか今のアイデアいいですね
返答のレスポンスを大きく3段構成にして
1段目は超一般回だけを返すようにして
そもそも回答にそういうイリーガルなものが入り得ないくらいの
一般回しか出さないっていうようなロジックで
一旦回答をゆっくり始めます
2段目で先ほどの精査したものが返ります
3段目で次のアクションとか
自社の宣伝情報とか含めたリンク集みたいなものを
ベタベタ貼っ付けていきますっていう
touden
レスポンスすれば確かに良さそう
チャットGPTが返ってくるのって
多分それやってるよねって気が今話してて思って
kokorokagami
確かにそんな気するね
touden
あいつ最初はこれこれはこういうことですねとか言って時間稼ぐじゃん
kokorokagami
稼ぐ稼ぐ
touden
それはそういうことなんでしょうね
kokorokagami
なるほどね
みんな考えてますね
考えてますねというところ
この経緯はこんなもんですか
そうですねこんな感じです
じゃあ私の方最後です
メタのLLAMA2とAzureのタイアップ
kokorokagami
速報マイクロソフトメタの最新大規模言語モデル
LLAMA2をAzureとWindowsでサポート
独自の設定的AIを開発可能に
ということでパブリックキーによるプレスリリースです
マイクロソフトは日本時間7月19日明明から
開催中のパートナー向け年次イベント
Microsoft Inspire 2023において
AI分野におけるメタとの協業を拡大し
メタがリリースした最新の大規模言語モデル
LLAMA2をMicrosoft AzureとWindowsでサポートすると発表しました
LLAMA2はこのマイクロソフトの発表とほぼ同時に
メタが発表した最新の大規模言語モデルです
オープンソースとして公開され
所有利用も可能で
AI分野で高い実績を残してきた
メタが満を持して公開するモデルとして
高い能力を備えていることが期待されています
LLAMAはパラメーター数が
7ビリオン 13ビリオン 70ビリオンの
3つのモデルに分かれており
Microsoft Azureではこの3つのモデルを
現在パブリックプレビュー中の
Azure AIモデルカタログから選択し
LLAMA2の能力と利用方法
kokorokagami
ファインチューニングしデプロイが可能
またWindowsマシン上でもLLAMA2が実行できるように
最適化される予定です
これらにより開発者は独自の生成的AIを
Microsoft AzureやWindows上で開発し
アプリケーションに組み込めるようにもなります
ということで
GAFAのうちメタ社の
AIにおける活動方針というのが
一つ明らかになった話です
私は今までクラウド環境とAIという話で
マイクロソフトが台頭してきているだろう
AWSがこんな戦略を取っているだろう
GCPがうんぬんかんぬんという話をしてきたんですが
その中でメタ社としては
そういうクラウドプラットフォームを
持っていない会社ですというところだったんですが
LLAMAはGPT3.5に匹敵するなのを言われていて
一番大きく違うところはですね
トークン数 受け入れられるトークン数が
圧倒的に違うというところがあって
非常に期待が集まっていました
GPT3.5とかGPT4では4000とか8000とか
4桁台のトークン数に対して
LLAMAは10万台くらいのトークン数を受け入れられるので
より長い文章とか
そういったことにも使えるんじゃないかということで
期待が集まっていたものですね
なので これがAzureに登場したということは
一つ大きなポイントで
マイクロソフトはオープンAIともメタとも
AIモデルを持っている会社と提携するという形になります
つまりマイクロソフトのAzure上で
2つのAIモデルメーカーがバチバチとやり合う
という関係性ができたという状態なので
マイクロソフトはもう
そのまま商売的に高笑いするしかない状態になったということですね
あとは勝手にその人たちが競争していいものを出してくれたら
結果的にAzureが儲かるという仕掛けができたので
一つ山場を乗り越えたんじゃないかなというふうに見ています
touden
はい
いやーマイクロソフトさんすげーなーという感じですけども
うーん
何ですかね
メタ社としては
それで永遠か?
という気もせんではないですけど
なんかオープンAIは
AWSもこの前紹介しましたけど
AWSもやってマイクロソフトもやるんで
オープンAI側としては
メジャーなところは全部やる
メジャーなところに全部提供しているという立場になるのかなと思っていて
それに対してメタは今のところマイクロソフト上だけに頑張ってる
Amazon側に提供するという話を聞いてない
と考えると
ユーザー顧客取れるパイが減ってしまうのかなと思うんですけど
何なんでしょうねという感じですね
kokorokagami
この転換は仮説でしかないんですけど
そもそもこういった大規模言語モデルっていうのは
すごく一部の研究機関が作っているものであって
一般ユーザーが触れる機会など全然なく
ニュースや論文等でその最新情報が知れるものという位置づけに過ぎませんでした
という中でオープンAIとAzureのタイアップにより
Azureがインフラを提供することによって
多くの利用者が自社用に組み込めるようになりましたし
オープンAIが非常に安価かつか
もしくは無料なプラットフォームで
そのモデルに触れるインターフェースを提供したということによって
一気にその学術的な研究から大衆が利用するものに変わったわけですよね
その中でメタ社としては研究室に置いてある
このモデルっていうのを何とか同じ土壌に乗ってなきゃいけない
と言ってインターフェースを探してきましたけれども
FacebookやInstagramといったような既存のSNSプラットフォームで
何かこういうものを公開するにしても
そのチャットGPTの2番センチのお試し大規模冒険語モデル利用
みたいなことにしかならず
あまり良いアプローチではない
後追いにしてはイマイチなアプローチにしかならない
という判断があったんじゃなかろうかなと思います
そういった中で今突っ込んでいって
一番顧客にこのLLAMA2の価値を体験してもらえる場所となると
今は実写用にこういった大規模言語モデルを組み込むには
Azure一択という世界観が出来上がりつつあるので
そこに参入するのが一番良いでしょうという判断が
あったんじゃないかなと思います
touden
なるほど
メタ社から見て一番安倍にかけたというか提携したという話か
それはそうですけど
kokorokagami
多分メタ社として自社のプラットフォームとか
自社がこのLLAMAをフル活用した何かソリューション
キーアプリっていうのを出すのを諦めたわけでは全然ないと思っていて
あらゆる企業が今大規模言語モデルを味見しようという動きをしているからこそ
その味見の中にこいつがいないと
今後そういうのが出てきた時に
LLAMAなんだそれって言われるのを避けたいんだと思う
touden
なるほどね
確かにそれはあるんで
最も使われやすいプラットフォームに提供しておいて
開発者の人口を増やしておいて
ゆくゆくはメタとしてのメタバース系
今後どこまでやるかわからないですけど
メタエコシステム的なところに載せればいいかなみたいな
kokorokagami
そうですね
メタが掲げるメタバース系に突っ込んでいきたいなったら
例えばですけどUnity Unreal Engineのメーカーとタイアップして
開発用のIDEの中で
NPCの属性の一つとして
大規模言語モデルを
頭脳として持っているインターフェース
オブジェクトですという設定ができるようにするとか
そういった組み込みも将来的にはあり得ると思うんですよ
なのでそういった世界観はあるかもしれないけど
ただそこで組み込むってなると非常に開発期間がかかる話なので
先行して出せるところから出していって
使ってもらおうという試みなんだろうなと思いますね
touden
なるほど
そう考えると
よいか
なるほどね
Azureのデータセンター悲鳴
kokorokagami
Azureは単純に受け入れて
全く自己同士をしていないわけでは当然なくてですね
Azure上でこのモデルをデプロイしようと思うと
そのAzureの持っているインターフェースに
こいつらを大量に浮かべることになるので
touden
Azure側のデータセンターはかなり悲鳴を上げるはずですと
kokorokagami
ただでさえOpenAIの関係で悲鳴を上げているデータセンターに
これを突っ込んでさらに使いたい需要が増えると
ますますデータセンターの拡充と更新が必要になるわけですが
Azureも歴史が長いので
AWS同様にその古いデータセンターをどうするか問題に悩まされているはずだから
多分これが来たからやったーって言ってるのも束の間
データセンターチームが悲鳴を上げて
そんなんやりたかったらここにもっと投資しろよーって
怒ってる状況じゃないですかね
touden
物理レイヤーがね
投資されないのは問題だと思いますけど
結局物理ですからね
NVIDIAのGPU供給の課題
kokorokagami
結局NVIDIAのGPUがどれだけ仕入れられるかっていう話にもなってくるし
touden
あんまりツルハシを売ってるものが実は一番儲かってるという話になるかもしれないですけど
kokorokagami
NVIDIAはもう天下でしかないんでね
touden
そうですね大富豪ですねという感じなので
kokorokagami
というところでGARFAMの戦争の様相がまた変わってきて
下々からすると大変面白くはある感じ
以上です今日はこんなもんですかね
touden
本番組はPodcast Spotify YouTube Listenで聴くことができます
ぜひそちらでもサブスクライブよろしくお願いいたします
お疲れ様でした
kokorokagami
はいお疲れさんでした
00:00

コメント

スクロール