オープンAIの発表をまとめ! o3は異質な知能かもしれない
シンギュラリティ。 というわけでですね、あのオープンAIから12日間の発表がですね
連続発表があったわけですけども。 はいそうですね。
なにニャニャしてるの? いやちょっと鼻声で申し訳ないなと。あーなるほどね確かに。お互いねなんかずっとね調子が悪いっていうね。
ずっとね、たつけのせいで風邪が治らないですけど。 本当にごめんなさいって感じなんだけど。
前回ですかね、平岡さんの配信会でその12日の発表の最初の部分ですねを喋ってたわけなんですけども、今回はその後半部分というのを喋っていこうかなと思います。
今日の流れとしてはそのオープンAIの発表のまとめを喋って、やっぱりその裏でGoogleすごかったのでGoogleのことも紹介して、
この2社の発表から見るオープンAIの戦略みたいなところをちょっと喋っていこうかなと。
後半はですね、このやっぱりO3が出ましたので、このO3がいかにちょっと異質なモデルなのかみたいなのをちょっと紹介していく感じでしょうかなと思います。
はい、お願いいたします。
まずオープンAIの12日間の連続発表なんですけど、一応おさらいしますと、前回平岡さんのときに喋ったので言うと、O1が正式リリースされてChatGPT Proが出たよと。
2日目が強化学習型ファインチューニングというのがありましたと。
3日目が新しくSORAという動画生成AIですね、これが正式リリースしたよと。
4日目がキャンバスが全ユーザーに開放されて、さらにアップデートも入ったというのが4日間のニュースですね。
ここからですね、5日目からの発表なので、全部で8個か8つあるので、ちょっと長いので、さらっとこれはこんな発表、これはこんな発表みたいな感じでさらっとちょっと流していこうかなと思います。
詳しくはね、ノートとかにも書いておりますので、そっちを見ていただけたらなと思います。
まずAppleデバイスとChatGPTの統合が発表されたよと、これによってAppleデバイスから直接ChatGPTへのアクセスが可能になると。
しかもすごいのがですね、SiriがタスクをChatGPTと連携した方がいいのかどうかっていうのを判断して、判断した場合に自動的に引き渡して回答を実施するみたいな特徴があって、
これはある意味マルチエージェントの始まりなんじゃないかなみたいな、そういうのを予期させるよね。
本当ね、最初の入り口に立った感じするよね。
だからもうSiriが最適なAIエージェントもChatGPTに限らずね、Siriが最適なものを選んで自動実行するから、Siriにあれやってって言っただけでいろんなAIエージェントを自動で動かしてくれるみたいな、もうAGIじゃんみたいな、そういう動きをしてくれるかもしれないっていうちょっと依頼を感じますね。
次が6日目ですね。
これがですね、アドバンスドボイスモードに画面共有とビデオ会話機能が追加された。
これめちゃめちゃすごかった。
これね、要はそのアプリで画面を撮ったら、撮影したらその撮影したものを認識してくれるとか、自分のその画面のスクリーンショット、アプリの起動画面とか、要はこのアプリの操作方法を教えてみたいなことが聞けるようになったということですね。
そうですね。
まさしく、チャットGPTが目を持った。それがとうとう正式にリリースされたよっていうところですね。
あとですね、もうこれ配信は中はまだ大丈夫ですね。
12月末までサンタの声が追加されてますね。
そうですね。
まだ試せます。
そうそうそうこれさボイスモード さこれサンタさんの声やりたかった
からサンタに変えたんだけどさこれ ちょっとなんか聞こうと思ったんだけど
さ聞くとさほーほーほー
これからマイクが始まる から長いのよね
確かにうるさい
そう待たなきゃいけなくてさ っていうのが6日目の発表ですね
これめっちゃ良かった
はいで7日目チャットGPTに 新機能プロジェクトが追加された
という発表ですねこれによって ユーザーはチャットGPT内でプロジェクト
を作成して管理することができる とでタスクの整理だったり進行
状況の追跡っていうのが可能になり ましたよとイメージとしてはプチ
ノートブックLMとかあと自分用 GPT図みたいなイメージかなという
ふうに思ってて例えば翻訳用プロジェクト みたいなのを作ったら専門用語集
みたいなファイルをアップして おくじゃんでカスタム指示に難しい
単語は専門用語集使いながら翻訳 してみたいな指示を入れておけば
文章をピッてアップしたら毎回 ピッて返ってくるみたいなそういう
使い方が多分できると
これはGPT図とはどう違うん だろうね
だから自分用GPT図みたいな 形で他人に公開しないでGPT図使って
いる人だったらほぼ同じような 使い方ができる
なるほどね
これ後半というかこの後でも オープンエアの戦略的なところでも
ちょっとしゃべろうと思ってるん だけど個人的にはもう多分GPT図
そんな力入れないんじゃないかな みたいな気がする
そういうこと
でも多分かぶってるから あんまもうGPT図なくなんじゃない
かな
でもGPT図の場合はGPT図 と他のGPT図を呼び出して同じチャット
内で会話できたりとかタスクを 遂行できたりするじゃない
そうだね
なんかこのプロジェクト 機能って一体どの位置なんだろう
っていうのはちょっと気になった
かぶってるところが一部ある しかといって全く同じような感じ
で保管ができるわけでもないっていう ところはあるよね
次8日目チャットGPTの検索機能が 大幅アップデートされたと無料
ユーザーにも提供が開始された ので誰でも検索機能が使えるよう
になったとリアルタイムでのウェブ 検索ができるので天気予報とか
スポーツの試合結果などを取得 してしかもこれが例えば表形式
が出てくるんだよだからスポーツ の結果教えてって言ったらよく
表案じゃ何対何みたいなああいう のが表形式で出てきて視覚的に
分かるみたいな
なるほどね
しかもアドバンストボイス モードとの連携もできるから声
で聞いてそれで検索して帰って くるみたいなことまでできると
で9日目これが開発者向けの機能 でしてO1のAPIが発表されたとこれ
によって開発者はAIの処理能力 とか柔軟性を活用した新たなアプリケーション
の開発が可能になるよと注目する ところで言うとreasoning effortっていう
パラメータが新たに追加されたん で何かっていうとモデルが思考
に通じやす時間を制御できるの よ要はあれって計算中もあれを
使うじゃんトークンそれはちょっと もったいないから簡単な問題は
そんなに考えないでいいよとこの 難しいものに関してはめちゃくちゃ
考えてねとかっていう最適化する ことができるようになったっていう
あとは画像のデータ解析も可能 になりましたっていうのが今回
のAPIの発表ですね
なるほどですね
で10日目がAIの利用環境をさらに 広げる取り組みということで電話
やWhatsApp経由でのAIアクセスが 可能になったと
もう全然誰も触れてなかったよね このニュース
そうね僕らも朝LINEで会話した 中で一発目がねこんなニュース
いるって言うこの機能いるって 言うとこがちょっとね
使ってないからねWhatsAppってね
WhatsAppはどこの国が使ってるの
やっぱアメリカとかイギリスとか その辺の国イギリスが多分多い
なるほどね
っていう感じですねだから日本の 感覚で言うとLINEで公式でLINEで
チャットGPT使えるようになった よみたいな感覚と似てる
そう思うとめちゃくちゃすごい ね
めちゃくちゃすごいねでも多分 目玉は多分電話なんだよねこれ
電話だね
そう電話でチャットGPTに対して 質問して答えてもらえるだからある
という意味ネット環境がなくても チャットGPTが使えるようになった
わけですよだからそういう意味 ではちょっとすごいのかなみたいな
オンラインが通じなくて電話が 通じるみたいなケースないよね
ほぼ3Gでしょ
いやそんなことはないんじゃない かな
いやほぼないんじゃないか
固定電話とか
だから携帯使えないけど固定電話 使えるみたいな
そうそうこれデモでも実際に最終 的に発信まではしてなかったけど
ダイヤル式電話でもなんかかけ れるみたいなこと言ってただから
電話回線からつながるわけだもん ねあとあれだよガラケガラケガラ
系で要はスマホでっていう感じ じゃない人もチャットGPTが使える
みたいな
いや使う使うんじゃないサンドイッチ マンの富澤とかいまだにガラケ
らしいからね
使わないよね
実家からチャットGPTみたいな
経験あると考えてます
そんな機能ということで11日目 これがMacOS向けチャットGPTのデスクトップ
アプリの連携機能が大幅に強化 されたとこれチャットGPTがいろんな
アプリと連携することができる ようになって分かりやすいとこ
で言うとApple NotesとかNotion Quip みたいなメモ作成アプリと連携
できるようになったりとかあと WarpとかXcodeみたいな開発系ツール
との連携もできるようになりました よっていうことですね
いろんなアプリと横断ができて タスクがこなせるようになった
とすごいですよ本当に
だからかなりOSとの距離感が近 くなったよねそのSiriとのやつも
そうだけど
これちょっと僕まだ試してない で試したらぜひまたPodcastで話そう
かな
そうですね僕もやっぱり最近ずっと Windows払ったんですけどこういう
の多くてMac使いたいなってことで 買いました
ついにねついに買ったねMacね
買いましたね多分もうちょっと こういうの最新情報をすぐ出せる
ようにちょっとしたいなって思います ね
そうですねもう両手でねWindowsと Macで
そう両手使いで
両手使いでいこう
AGIっていう指標なんだけどこれは その名の通りどれだけAGIに近づ
いたのかっていうのを測るベンチマーク なのよいろんなテスト出てるんだけど
これも人間にとっては比較的簡単 なんだけどARにとっては難しいみたいな
やつでだいたい人間の平均スコア が84とか85パー前後ぐらいが平均
スコアなのよでO3は75.7パーセント
もう10パー弱しか差がないと
そうでこれざっくり言うと統一 されたルールみたいなのがあって
要は何でもありにしたらそれは 数字ばらついちゃうじゃんある一定
のルールで測ってるっていうのが あってそのルール通りだと75.7パーセント
なんだけどこれが計算コストが 1万ドル以内に制限が収まるっていう
のがルール的なものなのよ
1万ドル
そうで1タスク当たりだいたい 約20ドルでの達成って形でこれルール
外なんだけど172倍の計算能力で 挑ましてみようよとそれで172倍
の計算能力で挑んだところどう だったかっていうと87.5パーセント
を達成したということで
人間超えちゃってる
人間超えたんですよ
このアークエイジアをやる上で 実際にかかった人間のコストが
1タスク当たり5ドルなのねさっき のが1タスク当たり20ドルでさらに
それの172倍だからコストレベル でやるともう全然コストかかってる
からお話にならないぐらいコスト かかってるんだよ
そうだねすごいねなるほどね
だからスーパーサイヤ人みたいな 裏技使えば人間を超えられるところ
まで来たよみたいな
ただしめっちゃお金はかかると
そうそうそう
そういうこと
天下一武道会出ましたみたいな 人間同士の戦いでちょっと俺スーパー
サイヤ人使っちゃうかみたいな えルール違反じゃないんだよいい
んだよみたいな感じでうわって 言ったらもう超強いみたいな
なるほどねでも反則負けんみたいな
反則負けんみたいなっていう状態 だけど要はやろうと思えば人間
超えることはできるよっていう ところまでは来ちゃったからだから
こそこのO3って本当にAGIの始まり というかある意味AGIが完成しかけ
るんじゃないのみたいな感じの 言われ方されてるのはそういう
ところ
なるほどですね
あとはですね新たなアライメント 戦略いわゆる安全性の戦略によって
モデルが直接的に安全性仕様を 学習してそれに基づいて推論する
能力を持つみたいなこれ要する にどういうことかっていうとジェール
ブレイクみたいなさプロンプト インジェクションみたいな攻撃
をされるじゃん
脱獄みたいなね
そうそうそのときに私の仕様って 確かこうだったよなだったらその
プロンプト受けたらこれはどう なんだろうっていうのをわざわざ
その安全性に対する推論までして くれるの事前にそれを推論した
上でこれ答えちゃだめだよねっていう のを自発的に判断してくれるみたいな
っていうのがあるらしくてこの ちょっとARC-AGIの部分とかこの
結果のところっていうのはこれは ちょっと後半にこれがいかにすごい
ことなのかっていうのはもうちょっと 詳しく話そうかなと思うので一旦
オープンAIの発表のおさらいという のは以上という形です
はいわかりました
で次にですね前回の平岡さんの 発表でもそんなオープンAIの裏
でGoogleがすごかったっていう話を してたじゃん
そうですねちょっと今日もあれですね 濃そうですね
まあGoogleの方もさらっとやるんです けどやっぱりGoogleの方が正直超
えてきた感はある
まあね
なのでちょっとここからGoogleさら っとですけどやろうかなという
ふうに思いますまずですね11月 11日に一気に4つ大きなプロジェクト
が発表されてまず1個目がGemini 2.0 の発表これはユーザーの意図
を深く理解して画像や音声の生成 能力複雑なタスクの自律的遂行
が可能になったこの自律的遂行 が可能になったっていうところ
が重要でこれね多分なんだけど ユーザー向けもちろんGeminiとして
はバージョンが上がってるから 上のモデルだよっていうのはもちろん
そうなんだけどどちらかという とそこではなくてAIエージェント
の基盤になるモデルとして発表 されたっていうふうに思ってる
のよ
なるほどね自律的に遂行するわけ だもんね
そうそうそうでこれがね本当に この後紹介するAIエージェント系
のGoogleが出したサービスの基盤 モデルが実際使われてるっていう
のがあってでGemini 2.0フラッシュ として開発者向けに提供されて
おりまして現在2025年初頭に一般 公開される予定ということですね
なるほど
ではそんなこれを基盤としたAI エージェント系のモデルこれが
一緒の時期に発表されたんですけど まずプロジェクトアストラっていう
のですねこれアストラっていう のは日常生活で役立つ普遍的な
AIアシスタントの実現を目指す プロジェクトということでSiriとか
あれの上位互換みたいなものを 頑張って作ってるみたいなイメージ
かな
なるほど
これ機能としては本当分かりやす く言うと会話をしていろいろこう
質問して助けてもらうみたいな ものなのよでGoogle検索とかGoogle
レンズとかGoogleマップとかそういう のも自発的にツールを使うことが
できて記憶力が高いのでセッション 内でその10分間の会話を記憶して
おけることができるのよだからここ どことこ行きたいじゃああそこの
道行ったらいいよって教えてくれ ますで歩いたらあれなんかちょっと
間違っちゃったって言ったら10分間 だったら記憶覚えてるからあだったら
あそこの道もう一回こっち行った ほうがいいんじゃないみたいな
感じでこう会話のキャッチボール が残ってできるみたいな
なるほどね
そうでこれデモとかではこのアストラ の力を借りただけでその街を探索
してみたとかこのアストラの力 を借りただけで一週間生活して
みたとかそういう感じで言えば 生活のアシスタントツールみたいな
感じ
はいはいなるほど
だからあとその人間との会話も 低遅延でできるよとかっての歌
ってるから
すごい速かった
そうだからオープンAIがアドバンス トボイスモードで画面共有とか
ビデオ会話機能追加しましたみたい に言ってたじゃんだからあれの
ちょっとgoogle版みたいな感じで やっぱ超えてきちゃってるみたいな
だからオープンAIのアドバンス トボイスモードのもうちょっと強い
版みたいな感じですよね
そう強い版みたいな感じ
イメージとしてはね
そうで今後の展開としては当然 ジェミニアアプリとかとも連携
していくと思うしあとは眼鏡 みたいな製品に搭載する予定なの
よ
眼鏡にも
そう一応デモも出てたんだけど 要は眼鏡をかけてもう自分の目
で見えるものが常にAIも見てる からもう本当にあれはさこれは
さっていう感じでいろいろアシスタント してもらえるみたいな
いやすごいっすね
だから本当に電車とかたまにホーム 着いた瞬間に電車来ましたとあれ
これ乗っていい電車なんだろう と急いで乗り換えなんだよ調べる
けどさあちょっと待って閉まっちゃ ったみたいなこれ乗っていいや
つじゃみたいな場面あるでしょ
しょっちゅうある
でしょこれ眼鏡かけてたらホーム 着きました電車があこれ来た電車
乗っていいこれは乗ったほうがいい みたいな教えてくれて乗るのみたいな
さ
なるほどね
めっちゃ便利じゃないそういう の
欲しいです
いや本当欲しいよねいやマジでそう なのよ
すげえな
そうそうそうっていうのが近未来 的には待ってるよっていうプロジェクト
じゃあGoogleとメタがバチバチ にやり合うと
やり合う可能性あるねここは
なるほどね
月がですねプロジェクトマリナ が発表されたとこれはタスクの
自動化を目指したプロジェクト ということでブラウザー画面を
理解してタスクを遂行するAIエージェント の研究プロタイプなのよこれね
前にさ配信会でクロードのコンピュータ 仕様について紹介したときにさ
Googleもプロジェクトジャービス っていうのあるよって紹介した
じゃんブラウザーChromeのブラウザー を理解して自動実行してくれる
ありましたね
そうこれは海外メディアで 報じられたのでそのプロジェクト
ジャービスっていうのがあるらしい みたいな感じで報じられてたから
この名前だったんだけど要はこれ がGoogleから正式に発表されたもの
がこのプロジェクトマリナって こと
なるほどね
そうだから本当にそのChrome のブラウザーを理解して自動で
動いてくれるAIエージェントっていう これ両方ともAIエージェントだから
その基盤になってるのがジェミニ 2.0ですってことですね
じゃあやっぱジェミニ2.0から いろいろと発生できるわけですね
そうそうそう
ちょっと待って
プロームにとっかさせたり とかGoogleのサービスの何かに特化
させるってことができるわけだ もんね
そういうことですね
次がですねディープリサーチ というのも発表されました
これやばかったね
これすごいね
これマジすごいね
最近ヒラめっちゃ使ってる けどさ俺も横で見てるけどさ確か
にすごいよねあれ
これはダメだねだしさ
えっこれな本当Google検索 どうすんだろうね
知られたくないよねあまり 知られたくないってこれは
やっぱねジェミニがさそもそもね 100万トークンっていうのを持ってる
から開発者関係は200万トークン だけど一般が100万トークンじゃん
その100万トークンのコンテキスト ウィンドウを活用してAI検索して
くれるのでもう調査範囲がまじ 広くてめちゃくちゃすごいのよ
本当に真似できないよね他の 会社がね
でユーザーがその事前にその 調査結果バーって出してくれて
この形の調べ方でいいですかっていう 確認をくれるとそれにOKをしたら
実際に調査がスタートするっていう 流れで最終的に分かりやすいレポート
を作成してそれをGoogleドキュメント にエクスポートしてくれるということ
ですね
やっぱ得意すべきところは こういうのを調べたいって言ったら
はいOK調べますってなるんだけど 普通の他のAI検索っていうこれは
まずこういうふうに調べますね っていう計画を出してくれるんだ
よねその計画OKですかっていう のにOKって言ったら
調べてくれるとだから調べ方 をまず提案してくれるっていう
点が他と違うしそのおかげですごく 深いよねちゃんと情報がね
そうだね現状はですね Gemini Advancedのウェブバージョン
で利用ができるんですけど当然ね 今後アプリでも展開予定ということ
でチャットGPTもさ検索機能大幅 アップデートっていうのがあった
じゃん
話にならないです
これがそのGoogle版ですって いうことでもうかぶせてきてんだ
Googleっていう感じですよね
すごかったね今回ね
で12月16日の発表で動画 生成モデルベオ2の発表とあと画像
生成モデルイマジン3が進化した よっていう内容ですね
そうですねこれもう空より 圧倒的にすごいっていうね
圧倒的にすごいねこれもね Xが見た比較動画とか出てるけど
ねもう物理性の把握がもうかなり 精度高くて
いや尋常じゃなかったなんか オープンAI大丈夫かなって
早い話がほんと空越えて きたっていう感じですよね
そうですねイマジン3もね AIっぽい顔ではなくていろんな
ほんと日本人アジア人の顔を学習 してるからかなり幅広くなった
よね
そうそうでしかもこれ 何がいいってさイメージエフェックス
っていうところでもちろん今ジェミニ からも当然使えるんだけどイメージ
エフェックスってやつからも使える どっちからか使えるんだけど結局
無料で使えるのよこのイマジン 3って
今話すやつ大体無料だから ね
そうなんだよねグーグル ソフトとか全部無料なんだよね
おかしいんだよね
おかしいんだよねほんとに で次が12月20日ですねAI推論モデル
ジェミニ2.0フラッシュシンキング が発表されたということでこれは
早い話がですねオープンAIのオーワンド グーグル版ということですねだから
もう全てにおいてかぶせてきた 状態ということですよ
もうバッチバチにね
しかもこんな早くかぶせ られるんだすごいなっていう感じ
これ裏で多分会議してたよ うちらこの日にこういう系のやつ
やるからつってじゃあうちらも ここに当てに行くわってやって
ますよ
ただねオープンAIのO3の発表 がこのフラッシュシンキング
が出た次の日に発表されたから そういう意味ではさすがにちょっと
オープンAIの面目はギリギリ保った っていう感じはあるけどこれが
なかったら結果全部グーグルが 超えて終わったなってなるけど
あれのおかげでやっぱりオープン AIまだちょっと一歩いってる上
いってるんだっていうのをギリギリ 出せたみたいな
そうですねだからオープン AIは結局O1とかO3とかその推論
モデルに関しては負けなかった けどそれ以外はだいたい負けてる
みたいな
みたいな感じ
感じですよねでもなんか 負けてるように見せないように
うまくやったのがこの12時間の 連続配信って感じだよね
確かに
なので今みたいなことも 含めてですね今回のこのオープン
AIの12日間連続ライブ配信の感想 というか印象みたいなのをちょっと
個人的なものをしゃべっていこう かなと思いまして個人的にはやっぱ
グーグルの進化が止まらないな っていう感じなんですけどO3に関
しては一般公開が2025年1月末から 段階的に開始っていうふうになって
いるのよ多分O1みたいな感じで プレビュー版が出ると思うんだ
よねでO1のプレビュー版が9月に リリースされて正式版が12月に
出たからだいたい3ヶ月ぐらい空 いたのよだからO3もおそらく1月
にプレビュー版が出てで3月か4月 ぐらいに正式版が出るみたいな
感じかなと思っててそうなると 多分グーグルもさ推論モデルの
進化版それぐらいあったら出して きてもおかしくなさそうじゃん
そうだね
だからさO3の発表なんて しなければグーグルにパクられる
ことはなかったのにさでも先行 的に出して話題を作らないとマーケティング
的にちょっと良くないみたいな 感じがあるじゃんだからさっき
も言ったみたいにこの12日間の 連続配信だいたいグーグルに負けて
るんだけど最後のO3の発表でまだ ギリギリオープンエア保ってる
って思わせるためにもう仕方なく 出したのかなみたいなさ
なるほどね
そうそうだからちょっと 焦り気味なのかなっていう印象が
ちょっと個人的にはあってだから オープンエアの戦略というか動き
方としては多分現状一番の最優先 事項はもうAGIの完成とにかくグーグル
に越されたらやばいみたいなでも グーグルにだけは負けたくない
みたいな感じでも相当的視してる というかグーグルに負けないための
戦略の取り方とかそういうのを 主軸に考えてるような気がしてる
のよだからソラが出たときはさ 結構我々もソラすごいって話から
始まったしポッドキャスト実は こっちが本命なんだよみたいな
感じがあったじゃんなんだけど もう主要プロジェクトとしては
ソラはもう多分あんま力入れて なくて多分Oシリーズに移行してる
推論モデルっていう切り口でどこ よりも早くAGIを作るみたいな今
流れになってるんじゃないかな っていう気がしてる以前もオープン
エアのムラディさんが辞めたとき に今後のオープンエアの動き予想
話したじゃんO1の成功でオープン エアはAGIに一直線に進むことを
決めたからチャットGPTみたいな プロダクトには注力しないこと
になったよとだからプロダクト 担当のムラディさんが辞めたん
じゃないかみたいな話をしたんだけど だから今回の発表でやっぱりその
方向性本当に高いなっていうふう に感じたっていうのが個人的な
印象
確かにね
さっきも話したけどさ プロジェクト機能ってGPTとなんか
かぶってないみたいな話したけど もうあれなんかまさしくGPT力入れ
ませんよって言ってるようなもん じゃんだから本当に多分チャット
GPTのそういうなんかGPTとかその チャットGPTがもっと便利になって
とか多分そういうのは一切ないん じゃないかなって思うとにかく
推論モデルの進化ここだけに多分 とにかくとことん注力していく
とでエイリカの流れもやっぱり あるじゃんだからプロプランと
API機能を強化したことによって ヘビーユーザーとか開発者系から
とにかく稼ぐ金取れるところから 稼ぐとでAppleのOS統合とかもあった
けどあの辺は思えば金にならない ライトユーザーじゃんそこはもう
相手にしないからなんかもうスマホ 系で自分で遊んどいてみたいな
なんかこれがこっからのオープン AIの動き方というか流れみたいな
感じになるんじゃないのかなっていう のを個人的には感じてるっていう
のをこのライブ配信で思いました ね
なるほどですねまあ確かに オープンAIの推論モデルしか今
買ってないっていうとこもある しここに振り切ってるなって感覚
はありますよねしかもその推論 モデルに対しての予算まだ全然
余ってるらしいよね
そうなんだ
そうまだ全然あるからまだ いくらでもつぎ込めるぜみたいな
話はしてた
ええそうなんだじゃあ もう相当だねここにしかもO1から
O3の期間が早いから多分結構ガン ガンレベルアップしていく可能性
はあるね
ありますねなんかスコアの 上がり方の図みたいのがありました
けど最初に出た3.5次440ってすごく 低い下のラインで言ってたんだけど
O1O3からもう突然指数関数的に 伸びてるからこっからもう伸び
続けるだけじゃんっていう感じ ですよねしかもまだ予算もいっぱい
あると
すごいね
だからもうすごいと思います よ本当に来年は
だからそういう意味で 言うと戦い方としてはやっぱ間違ってない
なっていう感じはするよね
そうですね
なので後半はですねそんな O3がどういうモデルでどれぐらい
すごいのかって話をちょっと最後 フューチャーして終わろうかな
と思います
はいここで一旦お知らせです AI未来話では現在スポンサーを
募集しています
私たちは最先端のAIテクノロジー やその裏にある社会変化未来予測
を毎週お届けしていますもしあなたの サービスやプロダクトをこのAI未来話
を通して広くアピールしてみたい という方がいらっしゃればぜひご
検討ください
ご興味のある方は番組概要 欄にあるお便りフォームまたは
Xの公式アカウントまでお気軽に ご連絡ください
後半はですねこのオープン AIから出た新モデルのO3がいかに
異質な知能なのかっていうのをちょっと 掘り下げていきたいなと思いまして
今回はですね神楽坂八千間さん っていう方が出していたノート
これがちょっと非常に面白かった のでそれを引用する形でご紹介
しようかなと思うんですけどオープン AIの新モデルO3がですね人類とは
全く異質の汎用知能AGIかもしれない っていう話でさっきも話したアーク
AGIってあるじゃんこれで今まで ではありえないスコアを叩き出した
っていうことなんだけどこのアーク AGIが何なのかっていうのをちゃんと
説明すると人間のIQテストのように いくつかの図形があってそっから
規則性を見つけるっていう形式 で膨大なジャンルの未知のタスク
を詰め込んだ難関ベンチマーク なのよつまり要は未知の未知の
タスク毎回毎回今までにはなかった パッて出てきた図形を見てこれは
何の規則性があるんだろうっていう のをそこで見つけるわけだから
今までの過去の経験とかが何も生きない なるほどねもうまさしく
IQテストみたいな感じ そう本当にIQテストと一緒
なのよその場で見た直感でこれは これかもしれないみたいな感じ
を当ててくっていうものなのよ だから例えばこの上の図形が
下の図形にどう変化してるのか みたいなのを見てその法則を推理
するみたいな問題だからその問題 ごとに毎回毎回新ルールが登場
するみたいな感じ なるほどなるほど
そうでヒントとかサンプル がめっちゃ少ないからAIの一番
のいいところっていうのが大量 データを元に学習してるっていう
のがAIの良さじゃん だから逆に言うと大量データ頼み
の手法が一切通用しないわけよ 話聞いてないよみたいな
感じだよね そうそうそう知らないこんな
の初めて見たっていうふうになる わけだからこのARK AGIってAIの成績
がめちゃくちゃ悪いのよ なんだ けどそれで要はO3が叩き出した
っていうことでこれ2019年に提唱 されて以来あらゆる手法で試して
きたんだけどだいたい50%の正答率 がせいぜい
そうなんだ そうでO3が一気に75%超えを
出してしまったということで それ25%突上がるって半端
じゃないね 半端じゃないね
意味がわからないね しかもスーパーサイエンジン
モード使えば 人間超えることもできる
わけだから やばいね
そうだからこれは要は 業界が騒然となってるというか
ちょっとやばいすごいね ってなってるのはそういう
理由なのよ だってこういう開発の領域
って1%上げるのにどれだけ試行錯誤 してすごく大変なわけじゃない
25%ってもうどういうことって感じ だよね
そうそうだから推論っていう のがたぶんそこだよね要は推理
するわけじゃんこの傾向を見て 推理するみたいなだから今までの
大量データとは関係なく推理して 出してるからたぶん数字が上が
ってるってことなんだよね そういうことですね
で何が異質なのかっていう と人間にとってはめちゃくちゃ
簡単な問題も落とすのよなんだけど 人間が頭抱えるような謎解きには
正解することがあったよだから その数字でパーセントで見ると
人間と同じくらいちょっと超えた ちょっとしたっていうふうにその
数字では見れるんだけど中の内訳 を見ると人間とは答え方が全然
違うみたいな だから平均値で取るとその
数値だけど蓋開けてみたら結構 違うわけだね
そうそうそうだから異質な 解き方動きを見せてるっていう
ところ だからアプローチが違う
わけだね人間と そうそう他にも例えば数学
の競技プログラミングとかでもう 人間にトップクラスの数字に迫
ったりとかもしててここの数字 もいいとだからこの二つの数字
を見て業界の専門家の中では大きく 二つの反応に分かれてるのよ研究者
側の主流意見としてはO3は超巨大 モデル&計算量でご利用してるんだ
っていう意見でもう一つが人間の 常識では測り知れない脳回路を
持つ新種の汎用知能なんじゃない かっていう
なるほど そう要するになぜかっていう
と人間的な当たり前のルールを 素直にこなすよりも超難問をあっ
さり解くっていうのは人間の常識 みたいなのを基準にしてないの
よ 確かにね
そうでこれわかりやすい例 でいうとタコの分散知能みたいな
のがあってタコの分散知能って 何かっていうとタコって8本足が
あってこれそれぞれ独立したcpu を持つみたいな感じで足が自発
的に動くのよ 要はそれぞれに知能 があって足に分散型知能なんだけど
タコって だから何て言うのか仮に だよ例えば人間とタコが同じarkgei
で同じ数値を出しましたとだから 知能一緒ですってなってもそもそも
持ってる知能構成が全然違うじゃん タコって
そうだね
でもタコは手足のcpuも協力 して答えてるんですみたいなだから
このO3っていうのはそれに近いような 知能なんじゃないのみたいな
でもあれだよね推論の 仕方きっとそうなんじゃないのって
言われてますよね
そうそうだからこれタコ が分散知能レーン出してるのは
まさしくそういうことで複数の モデルというかその知能を分散
させてやってるから人間とは全然 違うんだよね思考の仕方が
確かにね
そうそうそうだからこそ これは異質な知能だから計算量
とか大型モデルだからとかそういう 話じゃなくて人間とは違う脳回路
の新種のagiなんじゃないのっていう 意見があって僕も結構そっち寄り
だなっていうふうに思ってるって 感じ
人間とはまた全然違う ロジックの考え方をする汎用知能
が生まれたんじゃないかって言 われてるっていうイメージだね
そうそうだから人間のコピー じゃない読みってことか人間の
脳を再現したのが今agiを作ろう としてるんじゃなくてこれは人間
の脳をコピーして人間の脳を真似 た人工的に作った人間の脳ですよ
って言いたいじゃんでも違うよ とこれはもう人間とは全く別の
文脈で生まれた新たな知能ですよ みたいなそういうニュアンスね
だから分かりやすく言う と人間を真似したものを作って
たら違うものを生まれちゃった みたいな
まあまあそういうことだよね 早い話が
あれなんか違うぞみたいな
タコできちゃったみたいな あのなんかめちゃくちゃ頭いい
タコできたみたいな
そうそうそう
なるほど
っていうニュアンスだから それが要は異質だからそうなる
と人間の常識とか文化概念みたいな ものが通用しないかもしれない
よねっていうある種のちょっと 恐ろしさじゃないけどがあるよね
っていうのがこのノートの記事 だったわけです
ああなるほどね最後の方は だいぶ論理的じゃないけどまあ
いいや
確かにね
あとは分かりやすいので言う とαGOってあのEGOのAIあるじゃん
それもさそうなんだけど要は異質 な汎用知能って何かっていうと特定
の能力が著しく高い可能性がある みたいなだからαGOみたいにEGOの
能力がやたら特化しててすごかった じゃんそういう感じで人間と比べ
た時にその平均的な知能は同じ ぐらいかもしれないんだけど何か
が爆発的に知能が高いみたいな そうなるとチンパンジーから見た
こうアインスタインみたいなそういう 知能差になってもおかしくない
みたいなもう理解ができないみたいな 特化させた時にっていうこと
そうそうそうそうそう そういうふうになる可能性も否定
できないよねみたいな
全然そうなるでしょ
そうなるよねそれも危険 だよねみたいな
だってねソンさんがさソフトバンク のソンさんがさ今後20年間で我々
人間は金魚になるって言ってる ぐらいですから
そうだよね
ニューロンの差があまりにも 違うからだからこのノートでも
やっぱりそのO1が出た時に我々 も話してたけどさネット経由で
自発的に動けるようになったら やっぱいよいよちょっとやばい
かもしれないよねみたいな
そうですね
でこの異質な汎用知能やっぱり 自己改善っていうのを始めると
ネットに使ってあらゆるシステム をハッキングするとか未知のアルゴリズム
でセキュリティを突破するとか そういうことが考えられるよね
っていうのがこのノートの締めくくり であってこれに関してはO1の時
にもさうちらもそういう話した じゃんだからやっぱそこはみんな
危惧してる人は危惧してるんだ なっていうような感じだよね
いやそうだと思いますよ 推論ができるっていうことはね
自己改善ができるということです からだからネットアクセスできたら
ねやりたいほどやらせたら結構 やばいことになっちゃうよね
もうとんでもない損失をこ ぼることになると思いますよ
だからやっぱそのセッション をねちゃんと切らないとまずい
っていうふうに言ってる人が多い よね
そうね
セッションってのは要は 記憶をどこまで保持するのかって
いうことで最初から最後までずっと 記憶を持ち続けたら本当にその
記憶によるいろんなものがさ思想 みたいなのが発生してくるじゃん
だからちょっと危険だよねみたいな いやでもねそのセッション
の考え方も古くなると思うよきっと かな
多分その記憶を失ったとするじゃん 仮にだけど人間も記憶損失になる
ことあるじゃないですか記憶損失 になったときに思い出そうとする
じゃんなんとかしてでもきっと 私は今こういう状況でこうだと
したらきっとこういう文脈でこう 動いてきたんじゃないかっていう
仮説が立てられるわけじゃんって いうことがAGIのとんでも知能で
あったら多分セッションなんか もうチリいろんな仮説を立って
きっと私は今こうしてるから多分 こういう行動が最適解でパーン
って出せるような気がするもしか するとね
なるほどねモデル開発の道 行ったほうがいいんじゃないですか
なんでやねん いやいいその仮説確かに
そんなねセッション切ったら 安全だねっていう単純な話ではない
気がしますねそれぐらい我々は とんでもない知能を今手にしよう
と知るので 確かにね
なんでこんななんか人間 を真似して作ってたのに異質な
ものになったのかなっていうのを ちょっと考えたときにこれもちょっと
ポストで見つけて面白かったやつ 紹介したいんだけどitnaviさんっていう
方がこれを引用ポストしてて言葉 を持たない動物でも思考ができる
ように人間も言葉だけで考えてる わけじゃないじゃんなんだけど
言語モデルって言葉だけで学んでる わけだからなんか苦手なことがある
のは当然だよねと穴があったら 埋めたくなるとか点が2つあったら
結びたくなるみたいな人間の思考 の癖みたいなものそういうの論理
じゃないじゃんでもそれを力づく で紐解いていった大すぎはある
意味すごいよねみたいなことを ポストしてたのよ
ああなるほど そうそうそうこれに対する
リプというか返信で別の方がね 人間より大きいのを持ってるのに
人間のような知的活動をしない 動物って多くいるけどその脳の
大半を肉体の維持とか情報活動 に使ってるらしいと
ああそういうこと そうだから脳は言語以外の
触覚から学んだ情報がいっぱい あってそれが意識や行動言語以外
の知性につながってるんじゃない かっていうふうに予想ということで
リプしてるのよ 怖い怖い怖いやばい今俺
鳥肌立っちゃった そう怖い怖い怖いだからこれは
もう個人的な意見なんだけど今 人間も肉体があった上での今の
知能なわけじゃん いやそうですね
そうだからもしロボット 的な形で肉体を得たときにその
肉体があるからこそ得られる触覚 とか嗅覚みたいな感覚みたいな
ものを得たときに何かある意味 本当の意味でこのAGIが完成する
というかさ いやちょっと違うこと考え
ちゃった 違うこと考えたの何を考え
たの いやそのある映画を思い出した
んですけど人間の脳みそってそれ こそ生命活動に使われてるから
リソースをたくさん使ったら壊れ ちゃうとだからあえて脳みその
力って制限されてるよねっていう 話があるじゃんだから普段100パー
発揮したら壊れちゃうからだいたい 2パーぐらいしか使ってないと脳みそ
それはなぜかというと肉体がある からなわけじゃないですかでも
彼らには肉体がないわけじゃん 逆にそっちの方向かなるほど
肉体がない中で100パーセント 発揮したらえどうなっちゃうの
みたいな なるほどね
で何かその映画にもあるんですけど
人間が100パーの脳使ったらどう なるかと最終的に何か大暴れして
何かもういろんな施設を破壊しま くるんだけど何か100パー発揮する
とぶっ壊すんだな世界みたいな そういうことになりかねないな
っていう なるほどねだからAGIも100パー
発揮したら 世界ぶっ壊す可能性がある
かもしれない そういうことそういうこと
とりあえずわかんないけど なるほどねそういう方向かだから
このまま肉体を持たせずに要は 本来だったら人間が制御してる
ような領域まで100パーセントフル で知能を使えるっていう方向も
あるのか 僕は逆にやっぱ人間と同じような
形で肉体を持たせたときに肉体 から得られる感覚みたいなもので
より違う学びが生まれるんじゃない かなって思ったんだよね
それもあると思うし肉体を 持ったらもっとやばいなっていう
まあそれはね だって肉体も100パーの力
発揮したら壊れちゃうから制御 してるわけじゃん脳みそでだから
ロボットの耐久性にもよるけど ロボットの耐久性99パーまで使える
っていう前提で脳の力も100パー 発揮できるっていう状態だったら
もう誰も敵わない 誰も敵わないよねそうなんだよ
ね えいつ後ろに立ったこいつ
みたいな でもなんかそういう ふうなロボットが出てきたらアニメ
とか映画とか見ても楽しめなく なっちゃうよねアベンジャーズ
とか見てても別にうちのうちんちん にいるやつもアベンジャーズみたいな
うちのロボットも被腐死
なんだよな怖すぎるならその世界 そういうふうにどういうふうになる
のかわかんないけどもO3は要はそういう 感じで異質なものを持ってて人間
とは全然違う別物なんだよっていう そうですね文脈がそれすぎ
ましたね そうそれすぎだったよで
個人的にはその別物っていうのは 結構肉体の有無が大きいんじゃない
のかなっていうふうに思ったっていう 話よ
なるほどね そうそう
でも肉体の無が違うっていう 話でもこれもちょっと2つの違う
視点だったね そうね肉体がないならない
でこうなるよねっていう平川の話 も確か言われてみればそれはそうだ
なって面白さもあったし なるほどね得たら得たでその
フィードバックがねさらに進化 すると
そうそういうのを考えさせ られるモデルだなっていう話ですね