GPT-5.2の公開
みなさんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIを分かりやすく解説する番組です。
今回のテーマは、OpenAIから新しく公開されたGPT-5.2というモデルについて話していきます。
はい、ということで今日はGPT-5.2について話していきます。
みなさん、こちらの新しいモデルは使ってみましたでしょうか。
今日はこのOpenAIから新しく発表されたGPT-5.2について話していきます。
具体的には、直近で起こったことやGPT-5.2の特徴などについて話していきます。
今日話すポイントは主に3つです。
1つ目に、直近で起きたニュース、GPT-5.2の公開について。
2つ目に、GPT-5.2の特徴。
3点目に、AI各社の最新モデルで比較した結果。
具体的には、GPT-5.2とGemini 3.0とCloud Opus 4.5で比較をしました。
その結果について話していきます。
はい、では早速話していきましょう。
まずはGPT-5.2のニュースから、直近で何が起きたのかについて。
ちょうど先週、OpenAIからGPT-5.2という新しいモデルが公開されました。
OpenAIもGoogleも定期的に新しいモデルは投入しているんですけど
前回のモデル、GPT-5.1の公開から、かなり早いペースで次のモデル、5.2を公開してきたと思います。
背景としては、おそらく先日OpenAIが発令したCodeRed緊急事態が関係していると思われます。
このポッドキャストでもたびたび触れてきたんですけど、最近Googleの勢いがすごいんですよね。
以前までGoogleといえば、OpenAI、ChatGPTよりも性能が悪いAIという認識が多かったんですけど、
2024年の後半ぐらいからどんどん追い上げがすごくなってきたと。
Googleが直近で発表したGemini 3.0、非常に高性能なモデルになっていると。
それからOpenAIがCodeRed緊急事態を発令して競争力を高めてきたのではないかという話もあります。
実際、事情はどうかわからないんですけど、今回のGPT-5.2、早いスパンで公開されたので
Googleを意識しているのではないのか、という市場関係者の声もあります。
OpenAIの発表にはなるんですけど、今回発表されたGPT-5.2、ベンチマークの結果によると
他社のAIに比べて良い結果を出しています。
このベンチマークのテスト結果だけを切り取ると、現時点で公開されているAIモデルの中でも
最も性能の高いモデルということになります。
ただ、これはOpenAIの発表であるということを差し引いてみる必要があると思います。
新しい機能と特徴
じゃあ、このものすごい性能のGPT-5.2、誰が使えるのかという話になるんですけど、
一応これはChatGPTの全ユーザーが使えるという話になっています。
公開当初、有料ユーザーのみ使えるという話だったんですけど、
その後のOpenAIの説明によると、全ユーザーに展開するというような話になっています。
なので、無料ユーザーの方も有料ユーザーの方も、このGPT-5.2は使えるモデルというわけになります。
公式の説明を引用すると、ちょっと読みますね。
GPT-5.2はChatGPTの全プランでご利用いただけます。
無料のアカウントでは、5時間ごとに最大10件のメッセージを送信できます。
この制限に達すると、制限がリセットされるまで、自動的にモデルのミニバージョンが使用されます。
つまり、無料ユーザーの場合は、5時間ごとに最大10件のメッセージを送信できるというわけです、このGPT-5.2。
続けます。ChatGPTの有料ユーザーは、GPT-5.2を使用して、3時間ごとに最大160件のメッセージを送信できます。
とあります。つまり、無料プランの人はちょっと制限があると。
5時間ごとに最大10件の制限なので、頻繁に使っていたらすぐリミットに達すると思います、現時点では。
一方で、有料プランの方は3時間ごとに最大160件のメッセージのやり取りなので、通常の使い方であれば問題なく利用できると思います。
じゃあ、このGPT-5.2、どういうことが変わったのか、どういった特徴があるのかというのをちょっと今から話していきます。
GPT-5.2、いくつか特徴があって、まず一般的な業務のタスクに強いと言われています。
会社で日常を行われるような業務に強いと。よりビジネスのシーンで活躍してくれるようなAIモデルだと。
あとは長文の入力にも強いというような説明がされています。
あと、ハルシネーションも少なくなっていると。つまり、AIが誤った回答を出すことが少なくなっていると。
あとは、これちょっと驚いたんですけど、AIが学習している内容が2025年の8月まで伸びています。
AIって最新の情報は学習していないので、基本的に回答はできないんですね。
例えば今日起こった出来事とか、AIが学習していないので回答はできません。基本的には。
ただ、今はインターネットの情報を参照して回答できる機能がついているので、今日起こった出来事でも回答はできます。
例えば、今日の日経平均株価いくらですか?とか。このようなインターネットの情報を参照しなくても、
もともとモデルが学習している内容というのが、2025年8月までのものを情報源として学習しているということです。
こうした点がGPT-5.2の特徴として挙げられます。
ちょっとまとめると、1つ目がビジネス業務のタスクに強い。2つ目が長文の入力にも強い。
3点目がハルシネーション、AIの誤りが少なくなっている。
そして4点目が2025年8月の情報までを学習している。こうした特徴が挙げられます。
少し前まで私たちが使っていたGPT-5.1、こちらは廃止の方向で進んでいくようです。
他社モデルとの比較
なので、どちらにしろ私たちは今後GPT-5.2のモデルを使っていくことになると思います。
もちろん、前のモデルのGPT-5.1よりも性能は良くなっているので、私たちとしてはメリットだと思います。
じゃあ、このGPT-5.2、他社のAIモデルと比べてどうなのという点について話していきたいと思います。
実際にいくつかのタスクで、GPT-5.2と、あとはGemini 3.0、Cloud Opus 4.5のモデルで比較をしてみました。
現状、各生成AIの会社が出している最新のモデルとなります。
比較したタスク内容はいくつかありまして、文章の構成、あとはAIにプロンプトを作らせるメタプロンプトのタスク、
ファクトチェック、Excelファイルの作成、あとはスライド作成のタスクを行わせました。
結論先に言うと、この3つのモデルの間で大きな違いっていうのは、それほど感じなかったのが正直な感想です。
どのAIもかなり高い精度でタスクを行ってくれると。
これあの直近のポッドキャストでも比較結果をお伝えしたんですけど、その時とあまり変わらないかなっていうのが正直な感想です。
ただ、細かい点ではこっちのモデルの方がちょっと良かったねと、そういった点もあったので今からその話をしていきます。
まず行ったのが文章構成のタスク、文章の誤字脱字を発見するようなタスクです。
文章構成に関してはクロードのモデル、もともと文章構成のタスクには弱いんですけど、今回も実験結果クロードが一番性能が悪かったです。
肝心のChatGPTとGeminiに関しては、こちらどちらも同じスコアでした。
ChatGPTが見逃した誤字脱字をGeminiが拾ったり、
逆にGeminiが逃した誤字脱字をChatGPTが拾ったりと、このような結果になりました。
このポッドキャストでも何度も話しているんですけど、文章構成に関してはモデルの併用がおすすめです。
つまりChatGPTとGeminiを同時で使っていくと、同じプロンプトをChatGPTとGeminiに渡して、2つのモデルで誤字脱字を検知してもらうと、
こうすることで漏れが少なくなると思います。
今度はプロンプトをAIに改善してもらうというタスクで比較をしました。
これはメタプロンプトなどと呼ばれるアプローチとなります。
こちら先ほど文章構成で使ったプロンプトをそのまま改善してもらうようにChatGPTとGeminiに指示をしました。
どちらもスコア改善したんですけど、どちらかというとGeminiの方が結果は良かったかなと。
ただ、以前行った別のプロンプト改善のタスク、ChatGPTの方がスコアが良かったんですよね。
なのでここら辺も誤差の範囲かなと思いました。
次はファクトチェックのタスクを比較してみました。
今回、GPT 5.2のニュース。
こちらの要約をわざと嘘の情報を紛れ込ませて、それをAIが見抜けるかどうかというのをチェックしました。
例えば、新しくGPT 5.3がリリースされましたとか、モデルの公開日をわざと嘘の日程に変更したりとか、
こんな感じでテキストの中に嘘の情報を紛れ込ませて、それをAIが見抜けるかどうかのファクトチェックを行いました。
先に結論言うと、このファクトチェックに関してもAIの間でさほど違いというのは感じなかったです。
ただ、あえて順位をつけるなら、ジェミニ、クロード、チャットGPTの順番になりました。
ただここら辺もファクトチェックする内容によるかなと思います。
例えば、テクノロジーのニュース系のファクトチェックなのか、論文に基づいた情報のファクトチェックなのか、
内容でいろいろ結果というのは変わってくると思います。
ファクトチェック系のタスクも、文章構成と同じようにAIの併用がおすすめです。
複数のAIを使ってファクトチェックの漏れを監視すると。
はい、では次は表テーブルの作成を行いました。
具体的には、チャットGPTとクロードではExcelを作成してもらって、
GPT 5.2の機能と比較
ジェミニではGoogleのスプレッドシートの作成を依頼しました。
ちょっと余談なんですけど、ジェミニってExcelのファイルをそのまま出力できないんですよね、現時点では。
なので今回、ジェミニに関してはExcelではなくスプレッドシートでの出力を依頼しました。
どういった内容にしたのかっていうと、2015年から2024年までの日本の人口、GDP、為替レート、あとは日経平均株価、
これをExcelにまとめてくださいと、このような指示をしました。
こちらの意図したデータ、作ってくれたのはジェミニが一番でした。
とは言っても、差ほどAIのモデル感で違いはないかなと感じました。
Excelをそのまま作らせるのであれば、チャットGPTの方が使いやすいと思いました。
ちなみにGPT 5.2ではExcelやスライドの作成が強化されているらしいです。
なのでExcelやPowerPointをよく作る人は、このGPT 5.2も試してみることをお勧めします。
使い分けが一番しっくりくるかもしれないですね。
Excelを作りたい人はチャットGPT、スプレッドシートを作りたい人はジェミニ、こんな具合で使い分けるといいと思います。
はい、では次はスライドの作成をお願いしてみました。
具体的には、プログラミングに関するトピックを初心者向けに説明するようなスライドを作成してもらいました。
スライドを作成する時って、デザインをどうするのかっていうのをプロンプトに含めるとうまく機能します。
ただ、今回はあえてデザインに関してはノーコメントでAIに自由に作らせてみました。
結果をお伝えすると、まずデザイン面、見た目でいうと、クロード、ジェミニ、チャットGPTの順番でした。
スライドの中身、中身の分かりやすさでいうと、クロード、ジェミニ、チャットGPTの順番でした。
スライド作成系のタスクに関しては、クロードが現時点では一番お勧めかなと思いました。
どのようなアプローチでスライドを構成すれば、もっと分かりやすい内容になるのかっていうのを試行してくれる。
その試行過程とか、あとは出来上がり、納得感のあるのはクロードが一番だったかなと思います。
はい、以上5つのタスクで比較をしました。
プロンプトオプティマイザーの活用
正直、どのAIを選んでも仕事を進めていく上で、そんなに不都合差はないかなと思いました。
AI自体の性能ももちろんなんですけど、周辺機能とかを検討材料に入れ込むと、どのAIを使うのか決めやすいかなと思います。
例えば、オープンAIの動画生成のソラ、これを使いたい人はチャットGPTの有料プラに加入をすると。
GoogleのノートブックLMとか、あとは画像生成のナノバナナ、こうしたものを使いたい人はGeminiの有料プラに加入すると。
あとは、AIコーディングツールのクロードコード、こちらを使いたい人はクロードの有料プラに加入をすると。
モデルの性能に関しては現時点でそんなに差はないので、周辺の機能であったり、ツールで全体を見て決めていくと決めやすいかなと思いました。
ちなみに、オープンAI、チャットGPTもAIコーディングツールのコーデックスCLIというものを出しています。
こちらでもGPT5.2は既に使えるようになっています。
少し私も試してみたんですけど、使いやすいですね。
私、メインでクロードコードというツールを使っているんですけど、コーデックスCLIも全然使いやすいです。
ちょっとせっかくなので補足なんですけど、チャットGPTやGemini、クロードってそれぞれ有料プランありますよね。月額3000円ぐらいの。
あれ、加入すると各AIが展開しているAIコーディングツールも使うことができるんですよ。
チャットGPTならコーデックスCLI、GeminiならGemini CLI、クロードならクロードコード。
各AIの有料プランに加入すると、AIコーディングツールもたくさん使えるようになるので、別で改めて契約する必要というのはありません。
なのでコーディングツールが気になる方、AIを使ってコーディングやってみたいという方は、もしご自身が何かのAIの有料プランに加入されているのであれば、そちらが出しているコーディングツールチェックしてみることをお勧めします。
あと最後にプロンプトオプティマイザーの話をして締めたいと思います。
プロンプトオプティマイザーというオープンAIのツールはご存知でしょうか。
オプティマイザー、オプティマイズ、日本語で言うと最適化などの意味合いがあるんですけど、
簡単に言うとプロンプトを最適化してくれるオープンAIのツールとなります。
プロンプトオプティマイザー。
つまりプロンプトオプティマイザーを使うことで、今皆さんが手元で使っているプロンプト、それをAIがより良いものにしてくれると、そんなツールとなります。
でこれ何がいいのかっていうと、GPT 5.2向けのプロンプトを最適化してくれる体制が整っているんですね。
今皆さんが使っているプロンプトをペタッと貼り付けて、あとはボタンを押すだけでAIがプロンプトを修正してくれます。
付け加えるとGPT 5.2のモデル向けに最適化をしてくれると。
以前このポッドキャストでお便りでもいただいたんですけど、最近はプロンプト自体をAIに考えてもらっていますと、というお便りをいただきました。
プロンプト考えるの結構面倒な側面もあると思います。
そういった時はAI自身にプロンプトを作らせたり、あとはプロンプトオプティマイザーのようなAI自身にプロンプトを最適化してもらう。
そのようなアプローチもお勧めです。
プロンプトオプティマイザーの使い方、こちらのノートで記事を書きましたので、興味のある方はこちらもチェックしてみてください。
概要欄にリンクを貼っておきます。
はい、それでは今日のポイントをまとめます。
1つ目に、オープンAIから新しくGPT 5.2というモデルがリリースされました。
こちらは無料ユーザーの方にも順次展開されていくモデルとなります。
2つ目に、オープンAIのベンチマークによると、ジェミニア、クロードを上回っているという結果が出ています。
ただしこれはオープンAI自身の発表となります。
3点目、私も5つのタスクでAIの比較をしました。
私が試した範囲にはなるんですけど、そこまで大きな違いというのは感じられませんでした。
GPT 5.2、こんなタスクで活躍してくれた、こんなタスクでは使えなかった、いろいろな感想あると思います。
リスナーの皆さんが使った感想、ぜひお便りいただければ嬉しいです。
はい、今日はこの辺ということで、本日もお付き合いいただきありがとうございました。
現在、ポッドキャストアワードへの応募手続きをしています。
リスナーの皆さんに、この耳で学ぶAIの投票をご協力いただければ嬉しいです。
投票リンク、こちらも概要欄に記載をしておきますので、ぜひご協力をお願いします。
番組ではこのように、耳で学べるAIを毎週発信しています。
通勤中や家事の合間にAI情報をキャッチアップできます。
毎週水曜朝に更新していますので、ぜひフォローをお願いします。
お相手は、耳で学ぶAIの矢野鉄平でした。
また次の配信でお会いしましょう。