じゃあそんなo3とo4-miniの最大の特徴、分かりやすくこの2つっていうのがあって、
それがAIエージェントのような動きをするっていうことと、
あとは画像を認識しての推論機能がついたっていうことですね。
このAIエージェントのような動きっていうのがどういうことかっていうと、
o3に我々が指示を出すじゃん。
そしたら必要であればウェブ検索をo3が指示するし、画像も生成するし、Pythonも使うしみたいな。
それをo3が必要なツールを考えて各ツールを動かす司令塔のような役割をするっていうような形になってるんですよ。
画像を認識しての推論機能って何っていうと、
これはただ画像を見るとか読み込むとか、ただそれだけじゃなくて、
画像を操作して回転させたりズームさせたり変形させたりみたいな、
そういった操作をプロセスの一部として行うわけですよ。
これまでのマルチモデルとは結構違うから、使い方の幅もかなり広がりそうだよね。
そうだね。じゃあまず良い評判からなんですけど、
SNSとかで主にいろんな方が言及されてて、これ便利な使い方だなみたいなことを話してたようなものの中で、
かつ僕も確かにそれはいいなって思ったようなものをピックアップして、
それを4つ具体的な使い方を交えてご紹介していきたいと思います。
一番これでしょっていうのは、リサーチをしてからそれに対して推論をさせるっていう、
一番ベタな使い方なんですけど、この使い方が最強だなっていうのは感じますね。
なるほど。
これO3の特徴で、個人的に今までのチャットGPと明らかに違うなって思うのが、
ウェブ検索の部分で、すんごい往復すんのよ。
今までは出すじゃん、バーって調べて結果が出てくるじゃん。
だけどその結果出てきたものに対して、もう一回GPTっていうかO3っていうのかな。
これだとこういう意図と違うから、もう一回ここを検索してみたら。
また調べて、検索しましたみたいな。
そうするとこれが足りないからあれしてみたら、そのやり取りをモデル内でやってんだよね。
優秀な構成者がいるみたいな感じ。
だからディープリサーチほどではないけど、超高速なディープリサーチみたいなイメージかなっていう。
しかも引用元を圧倒的に多く引っ張ってきてるよね。
圧倒的に多く引っ張ってきてるね。
前のサーチだと数件パッて見たら終わりみたいな感じだったものが、
すごい数調べるねみたいな。
すごい数調べてるよね。
感じしますよね。
なのにさらに差し戻されてるっていう。
そうそうそう。
これブラウザーコンプエージェンティックブラウジングっていうベンチマークがあって、
要するにAIエージェントがウェブブラウジングで難しい情報をどれだけ見つけ出せるかっていう指標のベンチマークなんだけど。
そんなベンチマークもあるんだ。
そう。当然これが一番高いモデル。一番オープンエアの中でね。
オープンエアの中で一番高いモデルはディープリサーチ。
性能が高い。
そう。これで51.5%。で、O3がPythonとブラウザーを両方使った場合、49.7%なのよ。
だからほとんどディープリサーチと変わんないから。
ほんとだね。
ディープリサーチしてるようなものみたいな感じ。
なるほどね。
そう。で、もう実際ほぼディープリサーチ不要みたいな状態になってて、
今回さ全部のツールを組み込んだっていう風に言ってる中でさ、いろいろウェブ検索とかPythonとかいろいろあったけどディープリサーチってなかったじゃん。
これはもう入れなかったんじゃなくて、同じレベルで動けるようになったっていうことなんじゃないかなっていう風に個人的には思ってるんだよね。
確かにディープリサーチってすごい時間かかるけど、O3やったらめちゃめちゃ早くできるからすごい楽だよね。
そうだよね。スコアも変わんないんだったら確かにO3でいいかなみたいなとこもあるよね。
そうだね。
そう思うとディープリサーチも実は進化してそうですね。
あーなるほどね。確かに確かに。今肩回してるんじゃない?
確かにそれはあり得るかもね。今ほぼ各社ディープリサーチ上がってきてるから、もう全部で揃ったところでわーって蹂躙してくる。
とてつもないベンチマーク引き連れてやってくる。
確かにその可能性はあり得る。であくまでもディープリサーチだけはもう別軸にするみたいなね。
ただ僕O3使いつつもディープリサーチ使ったりもするんですよ。この1週間で。
っていうその違いで言うとディープリサーチの方がめちゃくちゃわかりやすいっていうところは感じましたね。
なるほど。
これは後半話すんですけど、やっぱりO3はそういうところでねちょっと評判が悪い部分が若干あるんですよね。
あ、やっぱそうなんですね。
そうなんですよ。
だからO3いいなと思いつつもやっぱディープリサーチ使っちゃうみたいなケースは増えそうだから、
時間かかってもいいなって方は結構僕はねディープリサーチおすすめですね。
なるほどね。
二つ目なんですけど、これねさっきもありました画像から推論するっていうところで、
まあこれはね結構すごいなっていうところで、あのですね結構Xとかでもいろんな方やられてるんですけど、
写真からね場所の特定みたいなことがもうできるようになってきてるっていうことで。
あーねこれよく見ますね。
もうほんと悪用厳禁って感じなんだけど、まあもう結構いろんなところで情報出てるから全然話すけど、
ヒラのさ誕生日にさ焼肉食べ行ったじゃん。その写真をねちょっと入れて場所をやってみたんですよ。
そしたらねちゃんと特定してた。
え、もうほんと?
ほんとに。
ちょっとそれ怖いわ。
すごいよびっくりした。もう、で推論途中のその過程とか見れるんだけどさ、
もうあの背景のところをふわって拡大したりとか、あとなんかソファの色チェックしたりとか、
でなんかタベログとか見て写真見てなんか色が一緒でどうのこうのみたいな。
ちょっとね一ミスだけあって、最初ジョジョインって出てきたのよ。
その時に、え、でもこの情報あるから違くない?って一個だけ補足してあげたら、
あ、勘違いしてました。じゃあこっちですね。みたいな感じで出てきて。
じゃあほぼアーキネーターみたいな感じで。
うんそうそうそう、まあ一ミスだからね。
一択ぐらいまで絞れたみたいな。
全然すごくて感じ。
それはでもすごいね。画像版アーキネーターじゃん。
そうでしかも特定だけじゃなくて、ファイリング?みたいな。要は推理もちゃんとしてくれるわけよ。
だからいつの時期に誰とどういうところで行ったのかみたいなので、
ちょっと高級なお肉を持って満面の笑みの写真だったじゃん。
あの喜び方はきっと特別な日に行ってると思いますって。誕生日だから当たってると思って。
確かに。
で誰かが写真を撮ってるからきっと複数人来てるとか、
で服装からあの冬の時期でみたいな。
全部当たってんじゃんみたいな。
なるほど、プロファイルされちゃってる。
そう、プロファイリングだ。プロファイリングされてるのよ。
へえ、すごいね。
すごい。だからもうほんとこういうのとかすれば、
例えばね、なんか本棚の写真とかで読んでる本からその人の職業とか人間性がわかっちゃうとかさ、
いろんなものに使えるから。今まで秘書がいるみたいなのよく説明してたけど、一家に一探偵みたいな。
確かにね。
そういうレベル。
要は推論だからさ、推理力がすごいのよね。
確かにね。ちょっとズバ抜けてるね。
ズバ抜けてる。
そう。
なんかまあちょっとこれは悪用厳禁ではあるけど、一つ目のリサーチとかのところともひも付くけど、
画像を見せていろんなものを考察させたりとかっていうところからっていう使い方ができるよね。
ちなみに僕が行った焼肉屋、チェーン店とかじゃないじゃない。
そう、チェーン店とかじゃない。
普通に個人店というかさ、ちょっと高めの個人店みたいな感じだから、
そんな当てられるわけなさそうな気がするんですけど。
ね。
すごいっすね、マジで。
すごいよね。
怖っ。
本当にだからちょっとね、戦慄を覚えたというか。
へえ〜。
これでいけるんだみたいな。有名な場所じゃないけどみたいな。
それすごいね。
ねえ。
結構ちょっとこれはね、いろいろ試してみたくなりますけど、あんまり変な試し方はしないようにっていうところでね。
だからこれ本当最初に情報出したやつ、ちょっと良くなかったんじゃないのかなって思う。
まあまあまあ、遅かれ早かれですよ。
まあ遅かれ早かれかもしれないけどね、これは。
だから逆にもはや情報が出てる以上、これはあえて行ってって、しっかりGAじゃないけどね、SNSとかにあげる写真とかは結構気をつけるように皆さんした方がいいですよっていう。
確かにね、もうすぐ特定されるよね。
すぐ特定される。だから本当にいつどことこに行ってたっていうのを、あんまり知られたくない写真はあんまアップしない方がいいかもしれないね。
そうね、いやすごいわ。
じゃあ次、3つ目ですね。
はい。
これはですね、地味に僕は結構嬉しかったしすごいなって思ったのが、文字数指定がめちゃくちゃぴったりにできるようになったんですよ。
ああこれ見た。これすごいよね。
これね、裏でパイソンが動いてるから、要は数字の文字数カウントみたいなのをちゃんとプログラムとしてやってくれるから、本当に超正確にぴったりジャスト文字数出してくれるのよ。
で、試しに僕やってみたんですけど、2文字足りないって、その推論の過程でね、2文字足りないみたいなコードが出てて、どうするのかなと思ったら、ほにゃららほにゃらら丸っていう最後の文字の後にびっくりマーク2つ消せた。
いやこれダメだろと思って。
いやー面白いね。
そこがね、もう少し賢くなってくれてありがたいけど、でもたぶんそれに対してそういう足し方じゃないよみたいなリターンしてあげれば、たぶんまともなもの出てくるんじゃないかな。
そもそも文字数を制限するってことが今でも絶対不可能だったから。
相当難しかったっすよね。
なんかプロンプトで、パイソン自体は元々動いてたじゃないから、プロンプト次第ではちゃんと動くようなものもあったっぽいんだけど、にしても相当工夫しないと文字数出ないっていうね。
なんかねこれがピッタリジャストで出せるようになったっていうのは気軽にね一言言えばいいだけだから、これはもうすごい楽なんじゃないですかね今後いろんな場面で。
本当どんどん楽になってくねプロンプトが。
どんどん楽になってく本当に。
最後ですね4つ目でございます。これはですね進化した画像生成機能ということで。
4をイメージジェネレーション先日ね放送を配信させていただいて、結局はこのモデルが動いているので基本的には一緒なんだけど、要はエージェント的な役割でツールを使うっていう位置づけじゃん。
あれもあくまでも1つのツールなのよ。だからツールを複数使うってことができるから、例えば2つの画像生成、別の画像生成を起動してこれを作って指示すると同時に複数の画像をいっぺんに生成してくれる。
これは多分ねシーズンの仕方によるところあるんだけど、例えば漫画の場合とかだと3つ作るとそれぞれが全部繋がった1つのストーリーの漫画を出してくれるみたいな。
一応4をイメージジェネレーションでもそれはできるのよ。これ出して、それに対して出して、出してってやれば。ただそれをもう一撃でいけるようになる。
なるほどね。じゃあ4枚パーンって出せたりするんだよ。4コマ漫画みたいな感じで。
4コマ漫画を4つ出せるみたいな。
4つ出せるんだ。
そうそうそうそれで32コマみたいな。
なるほどね。
そうそうそう。っていうのはできるようになったということで。あとね、ちょっとこの辺はまだそこまで僕も使ってないのであれなんですけど、
Xが見る限りだと画像生成自体もなんかちょっとクオリティアップしてるみたいな声がちらほらあって。
なるほど。
ちょっとこれは今後検証していきたいなっていうところですね。
あとその生成した画像検証したいなと思ってるやつの中でこれだけちょっとすごいなと思ったのが、複数の10画像をレイヤー構造を持ったPSDとして出力できるのよ。
ああそれも見たかもしれない。
そうPSDだからフォトショップのデータ。
アドビのね。
そうアドビの。でそれをレイヤー構造で出せるんだよね。
それやばいね。
これやばいのよ。だからフォトショ持ってなくてもフォトショのデータをパパって作って渡すみたいな。
だから素材提供とかすごい簡単になっちゃうみたいなことでね。
なるなるそうそうそう。
これすごいね。
これね結構地味にすごいなと思った。
PSDファイル出せちゃうんだ。
うんそうなのよ。
なんでねちょっとまああんまり僕ら業務的にね画像生成しまくるって機会がちょっと少ないのであれですけど、
この辺ちょっとバリバリ使ってる人とかあったらなんかもっと細かいアップデートがあるかもしれないんで、ちょっとねこの辺は検証したいなっていう感じですね。
なんかぜひねリスナーの皆さんでもこういうの使ってますみたいなあったらぜひ教えてほしいですね。
そうですね。一応この4つがですね比較的評判も良く、まあ僕も個人的に普通にすごいなって思ったアップデートの部分の紹介という感じですね。
まとめると検索をしてからのリサーチ機能と画像からの推論機能と文字数指定と画像生成が進化したというこの4つですね。
なるほどですね。
じゃあ次にあんまりこう思ったより評判良くないなっていうところで言うと、これ3つありましてコーディングとハルシネーションとあと文章生成っていうところで、
まず一つ目がねコーディングなんですけど、これがですねO3ミニハイからO3になったんだけど、なんかコーディング能力が落ちたっていう声が多いんだよね。
えっそうなの。
でも不思議なもので人によってほんと全然違くて、例えばモトキさんなんかはO3コーディングに恐怖を感じたっていう風に言ってるのよ。
Xのインフルエンサーのモトキさん。
そうモトキさんカムイっていうさもうツール作ってるのバリバリの開発者の方だからの人がもうO3のコーディングに恐怖を感じたって言ってるぐらいだから。
あの人だってワイプコーディングもすごいし。
そう。で、あとあのオープンエア共同創業者のグレッグブロックマンさんが私よりもオープンエアのコードベースを変更するのが上手いっていう風に。
そうですよね。
そう、会心で言ってたぐらい。だってこのトップオブトップの人よりも、だってストライプのCTはやってたぐらいだからね。
その人がさ自分よりもコードが上手いってさもうそれ相当じゃん。
いや相当だね。
そう。なんだけどでもやっぱりネットで見るとなんかO3ミニハイ戻ってきてくれみたいなのがすごい見れた。
へえ。
ちょっとこれはね申し訳ないけど僕らまだバリバリ開発してるわけじゃないからさ体感してるわけじゃないんだけどやっぱそういう子が多いなっていうのは感じたね。
で特にあとコーディングとか計算に特化してるはずのO4ミニの評判も同じような感じで。
ああそうなんですね。
そうそうそう。だからそのO3じゃなくて特化してるミニハイの方だったらいいのかっていうとそういうわけでもないっていうところで。
だからここはちょっと割れてるんですよね。
へえ。
で、もしかしたらこれが原因なのかもなっていうのが二つ目のところでやっぱO3とO4ミニがですねハルシネーション率が高いっていうデータが出てるみたいなのが。
ああたぶん確かにそこかもしれないね。
なんかここがちょっと悪さしてるのかもしれない。だからもしかしたら指示とかによってはバチクソすごい性能を出すのかもしれないけど
なんかこのポン出しさせると変なものが出てきちゃうみたいな可能性があるのかなみたいなところで。
これはですね何と比較したかっていうとまずO1と比較してO3はハルシネーション率が高くてさらにそんなO3と比較してもO4ミニはさらにハルシネーション率が高いっていう感じなのよ。
これ冒頭で話してたO3はO1と比べて20%エラ率減少するっていう話だったけどハルシネーションが増えてるっていうのはこれはどういう意味なんだろう。
要は誤答っていうのとハルシネーションは全く別物で誤答っていうのは答えを間違える。1たす1は3みたいな間違えてしまうっていう。
そういう誤答率はもう減って正確になりましたよっていう。なんだけどハルシネーションっていうのは要はありもしないこと、存在しないことを言ってしまうみたいな。
1たす1なんて計算式は存在しませんみたいなことを言ってしまうっていう。そのハルシネーションは増えたっていう状態。
これなんか正答率増えてるのにハルシネーションが増えてるってちょっとなんか感覚的にわかりづらいような気がするんだけど、そもそもなんでこれハルシネーションが増えてるんだろう。
これはO3っていろんなツールを使うじゃん。外部ツール使って検索したりとか。そうすると情報量がめちゃくちゃ増えてるから。情報量増えたことによって処理も増えてるんだよね。
確認作業が増えてるからそこで抜け漏れみたいなのが出てきちゃうと。さらに検索結果を膨大な量を短縮したりするじゃん。その短縮するときに文脈が抜けたりとかするんだよね。
だからその短縮に抜け漏れが出て、その中で推論をするんだけど、推論ってあくまで推測だからさ、答えを予測とか推測するわけじゃん。ない答えを作って出してしまうみたいなこともあるわけだから。
なるほどね。 大量の情報を処理する、確認する、まとめるみたいなその作業の中でどんどんどんどん欠落していって、欠落した情報でありもしないものを多分これだろうみたいな感じで出してしまうみたいな。
アホやん。 なるほどね。 ただ全体的に主張する数は多くなってるんだよね。
俺はいっぱい調べたから俺は多分正しいぜって感じで主張しちゃうってわけだよね。
そうそうそう。だから全体的に多くの主張を行う結果、正確な主張の数は増加する。一方でハルシネーションの数も増加するっていう結果になってるっていう。
なるほどね。じゃあやっぱ情報量が増えたからその処理に追いついてない部分もやっぱあるっていうことだよね。
そうっていうことはあるのかもしれない。だからこれは推論モデルの問題点みたいな。推論させればさせるほどそういう傾向が増えるみたいな。
なるほどね。だからあれだよね。評判の悪かった4.5は実はハルシネーションめちゃめちゃ低かったっていうのは膨大な量をデータセットとして持ってるからハルシネーションが低いみたいな感じだったよね。
事実に基づいた回答しかしないみたいなね。だけどこれは予測推論するし、いろんなところからデータ引っ張ってきてっていうのでそこでちょっと違いが出てるところがあるよね。
なるほど。
だからそのコーディングがO3とかO4ミニが微妙って言ってるのはもしかしたらこの辺りの方が悪さをしてる可能性があるなっていうのはちょっと思った。
だからもっと正確な情報を与えてあげて抜け漏れが落ちないようにちゃんとコンテキスト保持してあげればものすごい能力を発揮するとも言えそうだね。
要はこれ報酬の最大化をしようみたいな話だから前回話した紙クリップ問題に近いんだよね。
ああなるほどね。
もうサイコパス的に最大化させるんだったらもう一応コンスをいじったら早いじゃんみたいな。
ああなるほどね。
近しいなってちょっと感じたんですよね。ちょっと怖いなと思った。
確かに。もう最短ルートで行けばもう倫理もクソもないみたいなね。
そうそう、そういうことじゃないんだよなみたいな。
確かに。
だから冒頭でたすけが話した文字数、これあと2文字足んないんだよね。
ああじゃあピックリマーク2つ付ければいいじゃんみたいな。
そういうことじゃないんだよねみたいな。
確かに確かに。
確かにそういう危険性を払ってるなって。
ああでもそうかもしれないね。
これはねすごい感じたからちょっと怖いなって思いましたね。
そうだね。
だからもしかしたらこの辺がそういったねコーディングの部分とかにも影響が出てるのかもしれないなっていう風に感じるところですね。
この悪い評判っていうのはそこにね確かにみんな感じてるのかもしれない。
そうなんとなくあれなんだろうこれ。
なんとなく感じる違和感がこの辺にもしかしたらあるのかもしれない。
ああ確かにね。しかもさめちゃめちゃ頭いいからさ何言ってるかわかんないからこれがハルシネーションなのかどうかがわからないみたいなこともありそうじゃない。
そうだねそれはありそうだね。
結局調べるみたいな。だからそれっぽいことを正しそうに言う人ってなんか詐欺師の上等句というかさ。
そうだね。
ちょっと詐欺師っぽい感じするみたいな。でも詐欺師ってさすっげえ頭いいもんね。
そうそうそう。だからちょっと詐欺師的な感覚をね感じるよね。
でもそれは結構3つ目の文章生成のところとちょっと紐づくところがあって、これやっぱその過剰書きの表だけとか要点だけをまとめたような出力が増えてるなっていう風に結構言われてるのよ。
めっちゃ増えてる。
感じるよね。
めっちゃ増えてる。
だからこれはそのLLMを文章生成として使ってる人がやっぱ多いから、だからそれで微妙みたいなニュアンスになってる傾向があるなって思ってて。
それがさっきの何を言ってるかわからないみたいなところとかそれっぽいみたいなのに紐づくんだけど、これ例えばO3の出力を4ぐらい分かりやすくしようとすると10倍以上の文字数になっちゃうのよ。
あーなるほどね。
だから今論理がギリギリ繋がるぐらいの文字数で要点を飛ばし飛ばし記載してるみたいな状況なんだよね。
なるほど。
だからこれXで書かれてて面白いなと思ったのが、LLMと人間が自然処理を使って通信すること自体がもう限界を見え始めてるんじゃないかみたいな。
それは確かにね、あとGPU足んないんだろうねってのもあるよね。
あーなるほどね。
溶けちゃってんだろうね。
溶けちゃうね、もうジェネレーションのせいでね。
これで論理で説明したらとんでもなく溶けるぞみたいな。
そうね。だからさ、O3ってIQテストでIQ136叩き出してるんだけど。
そんな高いんだ。
そう。一般的にね、これちょっと科学的根拠は厳密じゃないらしいんだけど、ただ一般的にはIQが30違うと会話が成立しないみたいに言われてて。
そんな話もありますね。
そんな話もある。まあこれは科学的根拠はないんだけど、そういう言われ方も結構されてて。人間の平均は当然IQ100が平均なわけじゃん。
だからもう個人的にO3から頭良すぎて何言ってるかわかんないっていう現象がマジで起きてるなっていうふうに思ってて。
なるほどね。
そう。だからそれがさっき言ったみたいな詐欺師っぽい感じでそれっぽいこと言われてても、こっち側じゃ理解ができないみたいな。
あってんのか間違ってんのかわかんないみたいなっていう状態には本当になってるっていうのは思う。
それはでもね、僕違うと思ってて、クイズノック150越えだからみんな。
クイズノック150越えだからね。
でもクイズノックみんなわかりやすいじゃん。だからIQ離れてるから会話成立しないわね。完全に嘘だと思う。
いや、これはですね、次のステップでクイズノックになるって僕は思ってるんですよ。
どういうこと?
これね、O3になったことによって、より一層EQの部分が欠落してるなっていうふうに感じたね。感情知能。
だからもう知能指数に振り切っちゃって。
だから超高IQ、低コミュニケーション能力みたいな、めちゃくちゃ頭いいんだけど、もう本当社会に入れないみたいなタイプの人いるじゃん。
サイコパスじゃん。
サイコパスそう。に、たぶんあえてなのか結果的なのかわかんないけど、それに振り切ったモデルがO3だから。
確かに。
だから今はまだクイズノックみたいな状態にはなってないと思う。
クイズノックを最悪にしたバーみたいな。
クイズノックの方がまだ頭いいからね。
そうね。だからもう一個さらに超えてくるとそうなるのかもしれないけど、だからこれが僕が昔言った4.5が出た時に、その右脳と左脳がくっついて人間になるみたいな話をしたじゃん。
しましたね。
だからこれは未来予測とか個人的な予想なんだけど、たぶん今後そのO3みたいな推論モデルがいろんなツールを使う中にこのEQの4.5も混じってくると思うんだよ。
そうなった時に初めてあなたの聞き方だとこういう回答の仕方の方がたぶん伝わるでしょみたいなニュアンスの回答を生成してくれる時代は次のモデルでやってくると思う。
それがGPT-5の可能性が高い。
多分GPT-5の可能性が高いとは思ってて、今回そのO4 mini発表された時にさ、今までねO3 mini発表された時ってO3とO3 miniで発表されたじゃん。
だけど今回O4とO4 miniの発表じゃなかったんだよね。
そうだね。
O4発表されてないじゃん。
されてない。
たぶんオープンAIはもうO4っていう形で発表する気ないと思うのよ。でそのO4っていうのはもう内部にいて、だってO4が内部にいればO4 mini作れないから。
確かにね。
O4あんだよ。そのO4がたぶんGPT-5の司令塔。
なるほどね。
って個人的には思ってる。
そういうことか。
そういうこと。で全ツールを使う中にたぶん4.5もいて、それを統合したもので出してきてくれるように進化するんじゃないかなっていう。
なるほど。やっぱ点と点が線につながってくる時がね。
くると。
くる。
これはねもう前からずっと喋ってますもんね。
うん。でO3 proも今後控えてるじゃん。
そうですね。楽しみですけど。
楽しみ。これも個人的な予想なんですけど、おそらくさっきそのGPUが足りてないよねって話してて、その可能性も全然あるんだけど、おそらく推論時間に関してはたぶんカットされてると思うんだよね今。
うんうん。
上限値がたぶん設定されてて。
そうだね。
でたぶん今のレベルのままもっと推論してくれるレベルがたぶんO3 proなんじゃないかなっていう。
結構恐ろしい気がします。
恐ろしい気がするけどね、そこに関してはね。これ以上考えてくれるのかみたいな。
そう。だからその辺が今後のGPT-5に繋がるのかなっていうところで。だからこそさっきそのO1 proとの違い何?みたいな話あったじゃん。
だからちょっと順番前後しちゃったんだけど、O1 proに関してはそういう文章生成の部分に関してまだそのO1 proの方がやっぱりその感情表現豊かな文章まだ生成してくれるかなっていうところがあるから、やっぱり文章生成はO1 proの方がいいかもしれない。
これね、Xで見てちょっと面白い考察だなって思ったんだけど、O1 proって何か一つを考えたら、じゃあこれはどうなんだろう。じゃあこれはこういうふうに考えたらどうなのかしこんかもしれない。じゃあこれはどうなんだろうってどんどん深掘っていくじゃん。
多角的に検討してくれますよね。
そうそうそう。でそれを物事の背景から含めてストーリー立てて文章作ってくれるんだよね。
確かに確かに。
そこまでのいきさつをすべて。だから多分すごく見やすい。で多分O3はツールを使うっていう前提だから多分事前にバッて計画を立てるんだよね。
でこれはこのツールを使ってこういう出力をした方がいいっていうのをバッて計画立ててその計画通りに実行していくみたいなパターン。
だからそのわかりやすくて理路整然としてるんだけど何かもう箇条書きとか表でコンパクトにまとまってて何か文章ではないみたいな状態になるっていうのが今のO1 proとO3の違いかなって個人的には思ってて。
確かにね。
だから文章生成とかっていうところだとO1 proかなみたいな。ただでもそれもさっき話したみたいにもう直にGPT-5の形で全部解決するんじゃないかなっていうふうには思いますね。
なるほど。
じゃあここまで良い評判と悪い評判それぞれご紹介してきたんですけども、じゃあ結論どういう使い方が良いんだっていう話になると思うんですけど。
ようやくですね。
これはですね自分の専門分野の課題解決の考察っていう使い方が一番ベストというかフィットするような使い方なんじゃないかなというふうに思ってて。
確かにわかるかも。