1. 耳で学ぶAI、ロボシンク
  2. #83 ⚔️GPT-5 vs Claude Opus 4..
2025-08-13 20:47

#83 ⚔️GPT-5 vs Claude Opus 4.1 vs gpt-oss

✍️内容

今回のエピソードではGPT-5, Claude Opus 4.1, gpt-ossの最新モデルについて話します。

GPT-5は無料・有料関係なく誰でも使えるモデルなので試してみた人も多いのではないでしょうか。

今回はこれら3つのモデルの概要や複数のタスクで比較した結果について話します。

---

おすすめ生成AIツールの資料を配布中🎉

→資料を受け取る

---

🔗リンク

gpt-oss-120b, 20bを簡単に試す方法

---

🎧番組紹介

「耳で学ぶAI」はChatGPTやGemini、Claudeなど生成AIを初心者・中級者向けに分かりやすく解説する番組です。

---

👨‍💻パーソナリティ: 矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。

note

X: 矢野哲平

---

📩番組の感想や要望はこちら

サマリー

このエピソードでは、最新のAIモデルであるGPT-5、Claude Opus 4.1、及びGPT-OSSを深く掘り下げ、それぞれの特徴や性能を比較している。特にGPT-5の登場により、ユーザーはモデルの選択に迷うことが少なくなり、業務運用がより効率的になった点に注目されている。また、GPT-5、Claude Opus 4.1、及びGPT-OSSの性能や特徴が探求され、特にコーディングやスライド作成、営業メール作成、文章構成、デザインタスクにおける各モデルの優劣が明らかになっている。今後のAI技術の進展にも期待が寄せられている。

新しいAIモデルの紹介
みなさんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIをわかりやすく解説する番組です。
今回のテーマは、GPT-5 vs Claude Opus 4.1 vs gpt-oss について話していきます。
はい、ということで今日は、直近で新しく発表されたAIモデルについて話していきます。
先週、すごかったですよね。1週間の間にGPT-5 vs Claude Opus 4.1 vs gpt-oss という新しいモデルが発表されました。
特にGPT-5は、オープンAIの新しいモデルということで、非常に注目されています。
今回のエピソードでは、新しく公開されたこれらのAIモデルの概要をそれぞれ説明します。
そして、私の方で複数のタスクで比較の実験を行いました。
具体的には、コーディング、スライド作成、営業メールの作成、文章構成、デザインなど、複数のタスクで比較を行いました。
その結果についても共有したいと思います。
今日話すポイントは主に3つです。
1つ目に、オープンAIの最新モデルGPT-5について。
そして2つ目に、同じくオープンAIが発表したオープンウェイト言語モデルのGPT-OSSについて。
そして3点目に、アンソロピックの最新モデル、Claude Opus 4.1について話していきます。
直近で様々なAI情報が発表されましたけど、このエピソードで一緒に整理をしていきましょう。
はい、では早速話していきます。
先週起きたことをまずちょっと整理をしたいと思います。
直近で色々なことが起きました。
何が起きたかかいつまんで説明すると、AI各社が新しいモデルを発表しました。
ChatGPTを開発するオープンAIからはGPT-5とGPT-OSSというモデルが、
そしてClaudeというAIモデルを開発するアンソロピックからはClaude Opus 4.1というモデルが発表されました。
GPT-5の性能と特徴
これらのモデル、一つずつちょっと解説をしていきます。
ではまずGPT-5から話しましょうか。
もともとGPT-5は噂されていましたよね。
そろそろGPT-5登場するぞと。
もうちょっと後かなと思っていましたけど、先週いきなり発表されました。
GPT-5。名前からわかるように、今まで私たちが使っていたGPT-40や、あとはGPT-4.1の後継モデルとなります。
これありがたいことにGPT-5は全ユーザーが使えます。
無料ユーザーも有料ユーザーも関係なく使うことができます。
なのでGPT-5実際に触ってみた方多いと思います。
リスナーの皆さんはGPT-5についてどのような感想を持ちましたでしょうか。
結構これ海外でも意見が割れていまして、すごくいいねっていうポジティブな意見もあれば、
期待していたほどそんなに良くなかったというネガティブな意見もあります。
私もいろいろなタスクで使ってみましたけど、まずシンプルに回答速度が速いと感じました。
AIに質問してから回答をもらうまでの速度が速いです。
このAIの回答速度って結構この業務効率に直結するので、回答が速いのは使いやすいと思いました。
で、あと今回GPT-5の発表でモデルの統一がされたのも良かったかなと思いました。
結構チャットGPTって今までいろいろなモデルが乱立していたんですよね。
GPT-4.0とかGPT-4.1、あとはGPT-03、GPT-04 miniとかこんな感じでいろいろモデルが乱立していました。
ユーザーとしてはどのタスクでどのモデルを使えばいいのか結構迷う場面多かったと思うんですけど、
GPT-5からはシンプルにGPT-5一本で統一されました。
なのでモデルの選択に迷う必要がなくなったのかなと思いました。
GPT-5には質問によってAIがモデルをうまく変えるみたいな機能が搭載されています。
今までだったら人間の方でこの質問は複雑だから水路モデルを使おうとか、
この質問は簡単だからGPT-4.0で十分かなとそういうように人間の方で切り替えをやっていたと思うんですけど、
GPT-5からはAIの方でシンキングモードを使うか使わないかっていうのを自動で切り替えてくれます。
つまりAIが質問の難易度に応じて自動で内部でモデルを切り替えてくれるわけですね。
この機能オープンAの公式も説明しているのでちょっと引用しますね。
GPT-5はコーディング、数学、データ分析、科学など、
より長い思考が求められる場面では回答前に自動で推論を行い最適な回答を導き出します。
そのためどのモデルを使うかを意識しなくても常に丁寧で専門的レベルの回答を受け取れますと説明されています。
こんな感じで質問の内容によってAIが自動で推論を行って最適な回答を出してくれるわけです。
これもちろん人間の方でシンキングモードか通常のモードかっていうのは明示的に選択できます。
方法は2つあって、モデルの画面で選択的にシンキングモードを選択すると。
これは有料プランの画面でシンキングモードを選択できるようになっています。
で、あともう一つの方法はプロンプトにシンクハードと入力することで意図的にシンキングモードで回答を生成するようにもできます。
GPT-5の肝心の性能なんですけど、あらゆるタスクで以前のモデルよりも高度な回答ができるとオープンAIは説明しています。
一例を挙げるとコーディングや文章作成、あとはヘルスケア関連の質問などです。
ちなみにコンテキストウィンドウ、これは40万トークンになります。
このコンテキストウィンドウっていうのはAIの短期記憶のようなものです。
つまり長い指示、会話をどれだけGPT-5が保持できるのかっていう値です。
それが40万トークンというわけです。
じゃあこの40万トークンってどれぐらいの立ち位置なのかっていうと、
クロードオーパス4.1が20万トークンです。
あとはGoogleのジェミニ2.5プロ、これが100万トークンとなります。
なのでちょうど2番手ぐらいの位置というわけですね。
コンテキストウィンドウは少ないわけじゃないけど、現状あるモデルの中で一番多いわけでもないという立ち位置です。
ちょうど中間ぐらいのコンテキストウィンドウというわけです。
あとはGPT-5、価格面も安いです。
ちょっと切り分けて考えると、まずこのGPT-5はChatGPTのチャット画面で誰でも利用できます。
チャット画面で使わなくて、プログラムとか自動化でAPI経由で使う場合、
この場合の価格も安く設定されているという意味です。
これどのぐらい安いのかっていうと、GPT-4.0やGPT-4.1などのこの前のモデル、それよりも安い価格で設定されています。
なので、こうしたモデルよりも精度も高いので、
現状GPT-4.0とかGPT-4.1、これらのモデルのAPIを使っている人はGPT-5を使わない選択肢っていうのはあまりないのかなと思ったりします。
あとは公式の発表になるんですけど、ハルシネーション、AIが誤った回答を出してしまう現象ですね。
こうした現象もかなり低減されていると発表されています。
GPT-OSSの登場
はい、ではGPT-5の概要はこのぐらいにして、次はクロードオーパス4.1について話します。
これはアンソロピックという会社が開発しているクロードというAIモデルです。
ちなみにこのアンソロピックのCEOは元オープンAIの上級メンバーの方です。
ダリオ・アモディさんという方になります。
今回発表されたモデルはクロードオーパス4のアップグレード版となります。
クロードオーパス4からクロードオーパス4.1にアップグレードしたというわけです。
アンソロピックは3つのモデルを展開していて、下から順にハイク、ソネット、オーパスという3つのAIモデルを展開しています。
今回最上位モデルであるオーパスのグレードが4から4.1にアップグレードしたと。
じゃあこのクロードオーパス4.1、どのようなタスクが得意のかっていうと、
基本的にはコーディングを伴うエージェント系のタスクが得意です。
クロードは着々とコーディング系のタスクで地位を築いてますよね。
アンソロピックがクロードコードというプログラミングに特化したツールを出しているんですけど、
やっぱりプログラミング系のタスクはクロードが強いかなという印象があります。
ちなみにこのクロードオーパス4.1、誰が利用できるのかっていうと、
現時点では有料プラン以上の方が利用できます。
なのでGPT-5と違って、無料プランの方でも利用できるモデルというわけではありません。
クロードオーパス4.1の話はこれぐらいにして、次はGPT-OSSについて話します。
このニュースも個人的に驚きました。
GPT-OSSはオープンAAが公開したオープンウェイトの言語モデルとなります。
例えて言うなら、設計図の一部が公開されていて、誰でも自分の環境で動かせるようなモデルとなります。
2つモデルが発表されまして、GPT-OSS120Bと、あとはGPT-OSS20Bの2つが発表されました。
このBっていうのはビリオンのBとなります。
これちょっと説明が難しいんですけど、簡単に言うと、
誰でも自分が用意したマシンにインストールして使うことができるモデルとなります。
120Bの方がちょっと容量が大きいので、個人でマシンを用意するのはなかなか難しいんですけど、
20Bの小さなモデルになると、手元のパソコンでインストールすることができます。
オープンAAの説明によると、120Bの方がO4 miniに匹敵する性能、
20Bの方がO3 miniに匹敵する性能ということです。
今回GPT-5の発表でちょっと隠れちゃいましたけど、これすごくないですか?
もともとオープンAAってGPT-2のモデルまでは公開していました。
で、その後GPT-3から公開をしなくなって、
オープンAAなのに全然オープンじゃないじゃないかと批判されたりしてたんですけど、
今回GPT-OSSというオープンウェイトの言語モデルを投入してきた形になります。
GPT-5の最新モデルが公開されたから、そっちを使った方が良くないと思う方もいるかもしれないんですけど、
業務によってはGPT-OSSが活躍する場面があると思います。
例えば金融機関とか、あとは機密情報を扱う会社、
業務でAAを使いたくてもなかなか使えないという会社あると思うんですけど、
そういったところでも自前で環境さえ用意すれば、
O4 miniやO3 miniに匹敵するAIモデルを外部にデータを送信せずに動かすことができると。
機密情報を扱うタスクに関してはGPT-OSSを使うと。
それ以外のタスクではGPT-5を使う。
そんな使い分けをする選択肢も取れるわけです。
GPT-OSSを使おうと思うと、マシンをセッティングする必要があるので、
GPT-5みたいにChat GPTのホームページにアクセスをすれば、
すぐに使えるというわけではないのがちょっとハードルかなと思います。
でも逆を言うと、環境さえ用意すれば、
O4 miniに匹敵するAIモデルを動かすことができると。
個人的にはGPT-OSSの発表は驚きました。
今回発表されたこの3つのモデルを複数のタスクで比較してみました。
AIモデルの比較
実際はGPT-5とGPT-OSSを同じ度表で比較するというのはちょっとあれなんですけど、
せっかくの機会なので一緒に比較をしてみました。
具体的にはコーディング、あとはコーディングのエラー解決、
スライド作成、営業メールの作成、文章構成、デザインタスクの実行、
これらの6つのタスクで比較を行いました。
まずはコーディング。具体的にはChrome拡張機能の開発に使用しました。
少ない指示からこちらが求める機能、要件を満たしたコードを書けるかどうかということをチェックしました。
これ結論言うと、クロードオーパス4.1だけパスをしてGPT-5とGPT-OSSは実装できませんでした。
やっぱりコーディング系のタスクはクロードが強いと感じました。
次はiPhoneアプリのエラーを解決するタスクを行わせてみました。
具体的にはエラーの画面をスクリーンショットで撮影して、その画像を渡して、
開発中にこんなエラーが発生しましたよと、解決する方法を教えてくださいというような内容です。
これはGPT-5とクロードオーパス4.1で比較してみました。
このタスクに関してはGPT-5の方が精度が良かったです。
画像認識を絡めると、GPT-5の方が精度が高いと感じました。
はい、ではどんどん行きます。
次はスライド作成の比較を行いました。
具体的にはスライドの中のコンテンツ、テキストをこちらの指示通りに生成できるかというタスクです。
あるテーマに対して読み手にとって分かりやすいコンテンツを生成できるかということをチェックしました。
結果としてはクロードオーパス4.1、GPT-5、GPT-OSSの順番でした。
結構意外だったのが、GPT-OSSでも精度が高いコンテンツを生成してくれるという点です。
これは結構意外でしたね。
例えば会社の機密情報を扱った資料作成とか、GPT-OSSの選択肢があるかもしれないですね。
一番はクロードオーパス4.1だったんですけど、GPT-OSSも意外と良い結果になりました。
はい、では次は営業メールの作成のタスクで比較をしました。
これ結論言うと、どのAIモデルも自然な営業メールを作成してくれました。
GPT-5かクロードオーパス4.1、ちょっとコース付けがたいなという感じでした。
GPT-OSSもメールの文面としては悪くないんですけど、
GPT-5やクロードオーパス4.1に比べると、ちょっと劣るかなという感じです。
ただ、GPT-OSSも結構自然な文章を作成してくれました。
次世代モデルの展望
メールの作成に関しては、結構今のAIモデルだと、
人間が作成したか、AIが作成したか、ほぼほぼ見分けつかないんじゃないかなと思いました。
はい、では次は文章構成のタスクを行いました。文章の誤字・雑字を指摘するタスクです。
結論言うと、文章構成のタスクはGPT-5が一番精度が高かったです。
これはもう今までと同じ結果ですね。
クロードよりもチャットGPTの方が文章構成のタスクは得意だと思います。
意外とGPT-OSSも検討しました。
なので、外部に送信できない文章の構成タスク、
そうしたタスクではGPT-OSSを使うのもありかなと思いました。
ちょっと余談なんですけど、文章構成とか、例えばあとはAIにアイディアを募る、
そういったタスクって一つのモデルを使うよりも複数のAIモデルを使った方が精度が高くなります。
例えばGPT-5、今回は文章構成のタスクで使ったんですけど、
全部の間違いを拾ったわけではないんですね。
なので私がよくやる方法としては、複数のAIを組み合わせて文章構成を行う。
この方法がおすすめです。文章構成の指示をチャットGPTに渡しますよね。
それと同じプロンプトをコピペして、それをそのままGeminiに投げると。
Geminiも文章構成のタスク得意なので、チャットGPTとGeminiでダブルチェックをさせるアプローチです。
なおGPT-5の通常モードで文章構成を行った場合は、結構精度が落ちました。
なので文章構成のタスクを行う場合は、GPT-5のシンキングモードをおすすめします。
はい、では最後にデザイン系のタスクを行いました。
具体的にはダッシュボードのデザインと、あとはWebサービスの公式サイトの作成を依頼しました。
このタスクではクロードが精度が高かったです。
このタスクも結構鉄板ですよね。コーディングやデザイン関連のタスクはクロードが強いと。
こちらのタスクは割と想定内でした。
クロードをパス4.1、GPT-5、GPT-OSSの順番でした。
以上6つのタスクで比較を行いました。
いろいろ実験して感じたのは、GPT-5確かに精度が良くなっている印象があります。
ただこちらの期待値が高すぎたのか、以前GPT-3からGPT-4にアップグレードした時のような衝撃まではなかったかなと。
というのが正直な感想です。
ただ回答速度の改善であったり、より安いコストで利用できるようになったということは、
やはり我々ユーザーからすると非常にありがたいことだと思います。
今回GPT-5とクロードオーパス4.1を比較しましたけど、
そもそもクロードオーパス4.1、GPT-5に比べて約7倍から10倍ぐらいコストが高いんですよね。
そうした価格の違いを踏まえると、GPT-5はコストパフォーマンスが良いのかなと思います。
あとはGPT-OSS、これも意外と精度が高いなと感じました。
このモデル、マシンさえ用意すれば誰でも動かせるっていうのは結構大きなことだと思いました。
機密情報の取り扱いとか、あとはコスト面で可能性のあるモデルだなと思いました。
以上が直近で起きたAIモデルのニュースとなります。
いや本当先週は慌ただしかったですよね。
こうなってくると、また次の動きっていうのもちょっと気になってきます。
まずアンソロピックは、今回クロードオーパス4.1を公開した時にこのような気になる発言もしています。
今後数週間のうちにモデルに大幅な改良を加えたリリースを予定していますと発表しています。
8月中、もしくは9月あたりにまた新しいモデルを投入してくる可能性、大いにあると思います。
次はクロード4.5とか、クロード5はなさそうですけど、クロード4.5あたりを投入してくるのかなと思いました。
で、Googleはまだ発表していないんですけど、おそらく新しいモデルも公開してきそうですよね。
今の最新モデルがGemini 2.5 Proなので、順当に行くとGemini 3とかでしょうか。
Google、新しいAIモデルの開発もそうなんですけど、AI全般で勢いがあるので、今後どういった展開をしていくのかっていうのも楽しみです。
はい、それでは今日のポイントをまとめます。
1つ目に、一般的なタスクではGPT-5がおすすめです。無料ユーザーでも使えて高速に動作します。
2つ目に、コーディングのタスクではクロードオーパス4.1がおすすめです。
その他にも、メール作成やスライド資料の作成など、文章作成に活躍してくれるモデルです。
3点目に、機密情報を扱う外部データにデータを送信したくない、こういったタスクではGPT-OSSの使用も検討してみてください。
GPT-OSS、自分で環境構築するの少しハードルが高いんですけど、既に環境を準備してくれているサービスもあります。
まずは面倒なこと抜きで、GPT-OSSを試してみたいという人は、ノートに簡単に試す方法を書きました。
興味がある方はこちらを参考にしてください。概要欄にリンクを貼っておきます。
はい、今日はこのへんということで、本日もお付き合いいただきありがとうございました。
番組ではこのように、耳で学べるAIを毎週発信しています。通勤中や家事の合間にAI情報をキャッチアップできます。
毎週水曜朝に更新していますので、ぜひフォローをお願いします。
そして、おすすめの生成AIツールをまとめた資料も配布しています。
興味のある方はこちらもぜひ概要欄にリンクを貼っておきます。
お相手は耳で学ぶAIの矢野てっぺいでした。また次の配信でお会いしましょう。
20:47

コメント

スクロール