1. AI未来話
  2. #番外編 ついにAIに「考える時..
2024-09-13 22:21

#番外編 ついにAIに「考える時間」が!OpenAI新モデル「o1」でAGI実現へ前進

spotify apple_podcasts

[ChatGPT o1-previewの記事はこちら]
https://miralab.co.jp/media/chatgpt-o1/

[今回のタイムスタンプ]

() o1最大の特徴「推論特化」 - ついにAIが「考える時間」を持つように! () 驚異的なベンチマーク結果 - o1はAGI実現への第一歩となるか? () o1とChatGPT-4の使い分け - 複雑なタスク vs 一般的なタスク () AI開発の新時代!「推論スケーリング」でAGIへの道が加速 () Googleも参戦 - 推論スケーリングを巡るAI開発競争が激化 () 思考時間の延長がもたらす未来 - 人類を超えるAIの誕生は近い? () マルチエージェント時代到来? - o1はAIエージェントの司令塔となるか () エンディング - 統合型AI vs 分散型AI、AI社会の未来像とは?

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

[AI顧問サービスはじめました!]
https://miralab.co.jp/adviser/

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

[お便りが一番の励みになります!]
https://forms.gle/j8sJ1v1hH5JSaZm97

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

[公式X] [AI未来話]
https://x.com/ai_miraitalk [平岡]
https://twitter.com/dicamp_hiraoka

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

[AI未来話/各種リンク] [note] https://note.com/aimiraitalk [Spotify] https://open.spotify.com/show/4YQI4JvX83mURM6xywKn5w?si=34b96be128584bad [Apple] https://podcasts.apple.com/jp/podcast/ai未来話/id1733462439?uo=2 [LISTEN] https://listen.style/p/aifuturetalk

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

[更新スケジュール] 毎週木曜日AMに更新

[パーソナリティプロフィール] 田附(タツケ)AIメディア「MiraLab AI」編集長 平岡(ヒラオカ)AIコンサルタント

[運営しているAIメディアはこちら]
https://miralab.co.jp/media/

サマリー

OpenAIは新しいモデル「O1」を発表し、AGIの実現に向けた重要な一歩と期待されています。このモデルは推論特化型で、多くの時間をかけて考えることで、より高度な出力を実現する技術革新を備えています。O1の登場により、AIの進化が進んでいます。このO1は、これまでのGPTシリーズとは異なるアプローチを採用し、AGIの実現に向けた重要なステップと見なされています。

O1の登場とAGIの可能性
AIメディア編集長のたつけです。 AIコンサルタントの平岡です。さて本日は緊急で
音声を回しております。YouTuberっぽいですね。 一度行ってみたかったんです。ポッドキャスターあんまりないよね。緊急で回してるんですけど。
普段は毎週木曜日に配信してるんですけど、ちょっとね、ヤバいモデルが出たということで、別で撮らせていただいております。
これがね、OpenAIからですね、新しく「o1」というモデルが出まして、そのプレビュー版がですね、今チャットGPTに導入されたというのが
今朝方というか昨日の深夜に出たニュースですね。 ついにね、AGIが誕生したということですね。
AGIが誕生したはちょっと言い過ぎかもしれないけど。 言い過ぎ? ただでもそのAGIに繋がるであろう
伏跡というか、その最初の初めての一歩みたいな。 そうですね。
AGIの赤ちゃんが誕生したみたいな感じかな。 もうまさしく証拠づけるようなものすごいモデルだなっていうところで。
だから今日はまさしくこのAGIが生まれた日、生まれた記念日と言っても過言かもしれないけど。 過言かもしれないけどでも本当そうですね。
結構人類史に残るんじゃないかなっていうぐらいの、今回すごいモデルが出たということで、ちょっとお話ししていきたいという感じですね。
じゃあまず最初はですね、この新しいO1というのがどういうモデルなのかという話しして、どういう技術が使われていて何がすごいのか。
過去のモデルとはどう違うのかみたいな話をちょっとメインでやっていこうかなというふうに思います。 お願いします。
まずですね、今回のこの新しいO1というモデルはですね、一番の特徴は推論特化という推論に特化したモデルっていうのが一番大きい特徴で、
何か質問をすると、もう数十秒考え込んでちゃんと考えてから答えを回答してくれるっていうのが一番違いになりますね、このモデルの。
今考えてますみたいな感じのね、文字出ますからね。 そう、質問するとね、今考えてますみたいな、わざとちゃんと言ってくれるっていう。
ね、その考えてる思考も全部ね見れるからちょっと面白いんですけどね。 そうそう。
で、そういうふうに推論に特化したことによって、出力結果がものすごく良くなったよっていうことで、
まあだからね、いろんなこうベンチマークの数字とかあって、毎回毎回新モデルが出るたんびにやってるんだけど、今回もそういうモデルが出てて、
まあそれはねちょっと細かい数字なんで、我々が書いてる記事の方を見ていただければと思うんですけども、
わかりやすいベンチマークで言うと、例えば数学の試験みたいなのを受けさせた結果、そのスコアが全国の上位500人に入るぐらいの能力が出てきたとか、
まあ数学オリンピックの予選の結果が4よりも何倍も良かったみたいな感じで、まあとにかく良い出力結果が出るようになったっていうのが特徴ですね。
なんか10倍前後ぐらいスコア良かったですよね。
そう、ものによるけどそれぐらいのやつもあるぐらいすごいっていう。
まあ詳しくは記事で読んでくださいと。
そうですね、まあちょっと細かい数字なんで。
で、過去のChat GPT-40と今回新しく出たO1をどういう風に使い分けるのがいいのかということで、
これ結構皆さんChat GPT-40の新しい上位モデルが出たっていう風に結構勘違いされてる方多いと思うんですけど、
これはもう40とO1っていうのは全く別物、新しい新モデルっていう風に思った方が良くて、
思った方が良いっていうかもう本当に別モデルなので、
もう利用用途が全く違くて、
そうらしいですね。
だから基本的に一般的なタスク、今までやってたような資料作成に活用するとか、アイデア出しに使うとか、
そういう一般的なタスクっていうのは今まで通り40を使った方が良い出力結果が得られる。
だけど複雑な、もう本当に考えて考えて考え抜かないと出てこないようなものに関しては、
この新しいO1を使うことによってしっかり推論してくれるから良い出力結果が得られるみたいな感じだよね。
推論に特化したモデルっていうことですからね。
そう。
そういったタスクの方がやっぱり合ってるってことですよね。
そう。だからあんまりにも考える必要がないようなことをO1に聞いちゃうと、無駄に試行してしまうっていうことが起きるらしくて。
例えば何かあります?
例えば本当に分かりやすく言うと、1たす1は何ですか?とかって質問すると、
うーん、2!みたいな。
いや分かるわみたいな。
そういう現象が起きかねない。
なるほどですね。
さすがに1たす1はすぐ2って出てきそうだけどね。
まあ試行したとしてもね。
確かに。
だけど要は本当にスピードだったりとか、すぐに答えが欲しい時とかっていうのは4。
今まで通り使うんだったら4で、より長く試行させる時には新しいものっていう使い分けですね。
結構利用制限も強いらしいですよね、これね。
あ、そうだね。
今出てる制限だと、まずそもそもプラスの有料ユーザーしか使えない状態で、
O1プレビューが週30メッセージ、でO1ミニが週50メッセージっていう制限。
週30と50って一瞬だよね。
一瞬だね。
ね。
だからもうかなり無駄舌使いになっちゃいますよね、1たす1とかなんてね。
そうだね、だから本当最初の1週目だけだね、そういうのを遊びで試してみるのに使えるのは。
そうっすよね。
いや結構だから僕もJabJab使いたいなと思ったんですけど、結構使えねえなと思って。
APIとかでやれば突破できるかなって思ったんですけど、APIもね、結構あのTier5っていうめちゃめちゃ課金してる人じゃないと使えない開発者向けのものっていう感じらしいんで。
そうだ基本的にはもうAPIでは使えないものと思った方が良くて、で有料ユーザーだけ少しだけ使えるっていう状況。
っていう感じらしいですよね。
でゆくゆくはこのmini、O1 miniの方だけ無料ユーザーに開放されるらしいので、ただ無料ユーザーはこのO1のプレビューはおそらく使えないのかなっていうところ。
なるほど。
あとやっぱこのO1がプレビューって名前が付いてるだけあって、本ちゃんのO1っていうのがまた別であるみたいなもんね。
でこれ以前ニュースになってたんですけど、オープンAがストロベリーっていうモデルを月額2000ドルっていう高額で提供する可能性があるっていうのがニュースになってて。
日本円にすると30万くらいってことですよね。
月額だからねしかもそれ。
結構ですよね。
でこのストロベリーっていうのが質問に対して試行して時間を置いて考えてから回答するモデルってことなので、このO1がストロベリーであるってのは間違いなくて。
でそのプレビュー版が今回チャットGPTに内蔵されてるってことを考えると、プレビュー版じゃない本ちゃんはおそらくこの高額料金で、
法人向けだけなのかお金払えば一般ユーザーも使えるのかちょっとわかんないですけど、本ちゃんはかなり高額になるんじゃないかっていう風に見られてますね。
なるほどですね。
ちなみにGPT-O1とO1 miniの違いは何なんですか?
O1 miniの方が基本的には高速の軽量モデルになってて、コーディングに特化したモデルになってます。
なるほどなるほど。
だからプログラマーさんとかエンジニアの方とかでコーディングがメインっていう方はこのO1のプレビュー版じゃなくてminiの方をあえて使った方がいい出力結果が得られるっていう感じですね。
なるほどですね。
miniの方がコストもかなり安いらしいですよね。
そうだね。
だから基本的にはそこまで大きい、長く考えさせるものじゃないものはminiの方がいいのかもしれないよね。
なるほど。
この辺はね、僕らもまだ使い込んでないので、どういう違いがあるのかっていうのは体感してない部分があるから。
そうですね。今日出て今日話してますからね。
これからっていうところはありますね。
そうですね。いろんな情報を今まとめたっていう感じですけど。
今回のO1を舌ざさいている技術っていうのは何なんですかね。
推論スケーリングの進化
これが一番すごいところで、推論スケーリングが起きてるっていうところが一番大きいんですよ。
推論スケーリング。
これは何かっていうと、今までAIの学習するときにその学習にGPUを使いまくってたわけじゃん。
パラメーターとかの大部分も基本的には学習データなんだよね。
いかにめちゃくちゃ学習してるかどうかっていうところが重要だったわけで。
だからモデルが大きくなるっていうのは、イコールそこが大きくなるっていうのがモデルの大きさの話だったわけですよ。
つまりモデルが大きくなると、いわゆる性能が上がるよねっていう話ですよね、シンプルに。
そう。そのモデルが大きくなるってどういうことっていうのは学習の部分の話だったわけ。
だけど今回はその学習を全部取っ払って、変な話。
推論の部分にそのGPUをすべてつぎ込んだっていうのが今回のモデルなんですよね。
なるほど。アプローチが全然違うってわけですね。
そう。だから変な話、今ってラグとかあって、その学習データというか情報って別のところを参照すればいいわけじゃん。
だからそこに大量にかけるのってあんまり意味ないよねっていうアプローチを取ったっていうこと。
なるほど。
で、ここの推論がスケーリングだからどんどんどんどん大きくなっていくことによってさらに進化していくんじゃないのっていう話で。
なるほど。
で、これGoogleとかからも論文が出てるので、もしかしたら結構いろんなところがモデル出すとそれに追随した新しいモデル出したりとかするじゃん。
うん。
もしかしたらGeminiもこういう感じで推論に振った新しいモデルが出てくる可能性はあるよね。
まあ大いにありますよね。
Googleの方が結構オープンに論文出してたりするらしいですもんね、こういうのって。
基盤技術っていうのかな、基幹技術っていうのかな。
この元はやっぱGoogleが持ってるみたいなところがあるからね。
結構何でもそうですよね。未来話でもいっぱい話してますけど、やっぱりGoogleすごいねみたいな秘訣になること多いですよね。
そうそう。元を正せば全部Googleだみたいな。
そうそうそうそう。
だからオープンAIがそのアプローチの仕方をやってくれたことによってGoogleもそれいいねって言ってすぐ同じようなものを出してくる可能性は全然あり得る。
確かに。
だから今後は今まではモデルをいかに大きくするかっていうそのモデルのスケーリングの競争だったけど、今後はこの推論の部分でどっちが大きいのかみたいな推論でのスケーリングの戦いに入っていくんじゃないかということで。
なるほどですね。これGPUのいわゆるリソースを今まで学習に集めたところを推論に振ったって話じゃないですか。
そうすることによって可能になることって何なんですかね、この今までとの違いというか。
だから推論の時間を要はより長く取ることができるようになるわけよね。
今まで要は20秒とか30秒とか考えて出力することによっていい結果が得られる。
それが今後は24時間とか3日とか考えることによっていい出力結果が得られるようになる。
下手したら1ヶ月とか半年1年考えて結果を出すようになる可能性があって、
そんだけ考えたものが出てくるのは人類じゃ考えられないような結果が出る可能性があるわけじゃん。
確かに。
これってもうAGIだよねっていう。
確かに。
だから今はまだ短い時間しか推論できないけど、これが長くなっていく可能性があって、
その長く考えれば考えるほどとてつもない出力を出す可能性を秘めているみたいな感じですかね。
そう、そういうこと。
なるほど。
だからこれは推論に特化してるっていうのがそういうことで、
これ推論に特化してるっていうのがすごい重要なんですけど、
推論といえば推論者という言葉覚えてますか。
推論者?
はい。
分かんないです、なんすか。
分かんないことはないんじゃないですかね。
なぜなら来週の我々の配信でこの話をめちゃくちゃしてるという。
レベル1チャットボット、レベル2推論者、レベル3がエージェントって言って。
その話か。
その推論者で、要は次の配信聞いていただくと分かるんですけど、
今1と2の狭間で2に差し掛かるかどうかですよって話をしてるんですよね。
これはあれですよね、生成AIの進化の話でしたっけ、GPTの話だっけ。
オープンAIが引いてるAGIに向けたレベル5段階のスケジュールの話で、
レベル1がチャットボットっていうのが一番最初に出たチャットGPTで、
今現状のチャットGPT4みたいなのが、要はレベル1からレベル2。
レベル2というのが推論者で、そこに差し掛かるかどうか、
チャットボットから推論者になるかどうかのモデルですよ。
レベル3がAIエージェントで、前回、次回、我々が連続で話してるAIエージェントは、
ここのを目指してるんですよっていう話をしてるんですけど、
新モデルO1の発表
今回出たこの新しいO1っていうのが、まさにこのレベル2の推論者だって言われてるわけですよ。
そうですね、確かに。
だからそのO4の次の進化じゃなくて、全く別のアプローチから、
このレベル2の推論者をオープンAIは達成したわけですよ。
なるほど。
一応我々としては10月にあるDevDayで新モデルの発表があるんじゃないかって予想してたんで、
10月かなって話してたんですけど、ちょっと思ったより早かったので。
思ったよりね、本当に。
じゃあ10月何出るんだって話もね、気になりますけど。
もしかしたらこのO1についての詳細な説明だったりとか、
本ちゃんの方のO1についての話とか、その辺が出てくるのかな、もしかしたら。
なるほどっすね。
じゃあ来週我々が話してる内容はちょっと間違えてるってことですね。
間違えてるってことですね。
それぐらいでもAIって移り変わりが早いんで。
タイムラグがね、こんな形で出てくるとは。
思わなかったですね。
GPTシリーズとの関係
でもとうとうこのレベル2を達成したっていうことなんで、
逆に言うとこのレベル5までのAGIの進捗状況としては、
悪くない進み方してるんじゃないのかなっていうところだよね。
確かに。来週その話しましたよね。
来週その話しましたね。
やっぱり進捗悪くなかったですね。
答え合わせできた。
答え合わせできたね。
確かに。
で、気になるのが、じゃあGPT-5はなくて、
このO1っていうのが要はGPT-5の新しい名前なのみたいな、
そういう感じでふわっと多分想像してる方いると思うんだけど、
これさっきも話したように、4の上位版じゃなくて全く別のモデルなわけですよ。
これオープンAIも言ってて、
GPTシリーズはGPTシリーズで並行して開発を続けるって言ってるから、
だからおそらくGPT-5はGPT-5でまた別で出るだろうっていうふうに思ってます。
だからオープンAIは今GPTシリーズとOシリーズっていう2つのシリーズを持ってるっていうようなイメージですね。
なるほどですね。
これなんかまさしくエージェント界、我々今話してますけど、
マルチエージェントっぽい感じですよね。
そう、まさしくね。
だから、それこそチャットGPTっていうのはGPTシリーズは学習に重きを置いてるからこそ、
多分そういう作業レベルのことって優秀なの、タスククリアするので。
だけど考えるうちの推論が弱いじゃん。
それを今回のこの新しいO1の方が補ってくれるから、
要は上司のポジションで指示を出して、実際の作業はGPTが行うみたいな、
そういう階層構造がイメージしやすいところあるよね。
確かに。だから思考をする人はやっぱトップの上司とかで、それがO1であると。
で、下の部下に指示をしていくと。
これ、クロードのオーパスとソネット、ハイク、いわゆるクロードの下位モデル、中位モデルもこういう依存関係じゃないですか。
結構各社こういう形で出てきそうですよね。
そうね、実際クロードも今年の後半ぐらいにはオーパスの3.5出すっていう風に言ってるので。
言ってましたね。
順調にいけば3.5オーパス出るはずだから、もしかしたらクロードも同じようにこのオーパスはそういう感じで推論ベースでやってってるのかな。
いや可能性ありますよね、全然。
だから12月ぐらいにはクロード、グーグル、オープンAI、各社から同じような推論モデルとタスクを遂行するモデルが出て、これを噛み合わせてプロジェクトを遂行できるぞと。
AIの未来像
こうなってくると結構AIエージェントの手前ぐらいの形ですよね。
まさしくだよね。
だから本当にこれがAIエージェントの卵というか、最初の一歩っていうのはそういうことで、ここからそれが形になってた時の未来像はやっぱAGIだよねと思う。
いやそうっすよね、だから今レベル5の中の2に来たということで、この9月12日、日本にすると9月13日、13日の金曜日。
平岡がずっとこれ13日の金曜日意味あるんじゃないのかなって言ってたんだけど、実際の発表はアメリカ時間の12日なんで、全然関係ないからね。
めちゃくちゃ恥ずかしかったわ、本当に。
ということで緊急で音声を録らせていただいたという感じでございます。
はい、それではエンディングでございます。
なんか個人的に思うのはさ、今回GPTシリーズと並走して新しいモデルっていうのが出たわけじゃん。
なんかこれってさ、そのまんま独立していくのかなとかっていうのはちょっと気になるよね。
要はAGIが誕生した時にはさ、全部が統合されてさ、推論もするし作業もするしみたいな感じになるのか、
それは表向きは統合されてるように見えるけど、やっぱ結局裏側では頭脳としてのO1と作業者としてのGPTみたいなのが分断して動いてるのかとか、
なんかその辺まではちょっと見えないからこそ気になるよなとはちょっと思った。
そうですね。なんかAIエージェントの回で今話してるけど、それこそ社会性を持ったりとかさ、
いろいろもう自律的に動くようになるじゃないですか。
あれって推論能力なくても動いてるんですかね。
っていうかまぁ、ある程度の推論能力ってことなのかな。
それだけで動けちゃってるみたいな感じなんですかね。
でも人間社会に起こすと、やっぱり推論をする人、タスクを動かす人って役割分担されてるじゃん。
同じ人間でも。
そうだね。
なんかやっぱ同じAI界隈でも同じことが起きるんじゃないかなと思っていて。
やっぱその人間と違うのは統合できるっていうね。
ドラゴンボールの世界だとフュージョンできちゃうけど、現実の世界ではフュージョンできないじゃないですか。
でもAIの世界だったら本当にフュージョンできちゃうじゃん。
って考えると、裏でしっかり見てみると悟空とトランクスだっけ。
息子ベジータじゃん。
ベジータだ。
急に息子の方になっちゃった。
悟空とベジータが、まぁ実際は動いてると。
でも表から見たら、あれ何くっついた名前、名所何だっけ。
ポタラ?
違うな。
フュージョンでもないしね。
あれどっちがどっちだっけ。ゴジータとベジットだよね。
あーゴジータかベジットか。
どっちかだよね。ゴジータがフュージョンの方かな。でベジットがポタラかな。
そうっすね。あーなるほどなるほど。
だから僕らからするとゴジータなんだけど、中で見ると悟空とベジータみたいな。
余計難しい話してるよ。
そうね。
なんかそんな感じになるんじゃないかなとはちょっと思いますよね。
まあだから利用者側というか消費者側から見ると、そこが別なのか一緒なのかっていうのはもう大した問題じゃないレベル感なのかもしれない。
あーなんか分かりやすくないかもしれないけど、何回分かりやすくない話すんだよ。
そのインターネットが出た時ってさ、厳密に言うとプロファイラーがあって、インターネットというものがあって、
なんかもういろいろあるわけじゃないですか、プロトコルがあってとかセキュリティがあってとか、
もう様々なものが組み合わさってネットサーフィンができるわけじゃん。
でも消費者ってネットサーフィンできるかどうかだけでいいわけじゃん。
そういう感じなんじゃないかなっていう。
すごい分かりづらいね。
分かりづらいかー。
でもプロトコルって出た時点でさ、ああ確かになる人いないでしょ。
え、ドラゴンボールとどっちのほうが分かりやすい?
ちなみに。
どっちもどっちだよ。
それでは最後に告知でございます。
AI未来話の公式Xが始まりました。
Xでは最新ニュースやお便りの紹介など、リスナーの皆様との交流の場にできたらと考えていますので、
ぜひフォローのほどお願いいたします。
概要欄にリンクを貼っております。
またお聞きのPodcastアプリでAI未来話の番組フォローとレビューもお待ちしています。
フォローすることで最新話が更新されると通知がきます。
この番組はランキングに入る可能性が上がります。
お互いウィンウィンなのでぜひフォローのほどお願いいたします。
来週も木曜朝7時に更新されます。
通勤通読のともに聞いてくれると嬉しいです。
来週なのかな。
来週ですね。
来週なのか。
今日配信するから。
あとあれだね。
たぶん前回の配信で来週お便り待ってますって言ってると思うんですけど、
今のところまだ来てないので。
あ、そうですね。
ここに差し込むの?
聞く順番としてはそうなっていいんじゃないの?
そっかそっか。
じゃあそんな感じでお待ちしております。
22:21

コメント

スクロール