✍️内容
新しくリリースされたAIモデルについて紹介。
GPT-4.5とGPT-4o、そしてClaude 3.7 Sonnetで複数のタスクを比較してみた結果について話します。
GPT-4.5を3万円を支払わずに利用する2つのルートについても言及します。
---
おすすめの生成AIツールをまとめた資料を配布中🎉
資料を受け取る→https://bit.ly/3Cq9LDG
---
🔗リンク
◎Claude 3.7 Sonnet / Anthoropic公式
---
「耳で学ぶAI」ではChatGPTやGemini、Claudeなど生成AIを初心者・中級者向けに分かりやすく解説します。
---
👨💻パーソナリティ: 矢野哲平
「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。
---
📩番組の感想や要望はこちら
サマリー
今回のエピソードでは、GPT-4.5とClaude 3.7 Sonnet🔥という二つの最新AIモデルの比較について議論されます。特に、性能やコスト面、使用可能なプランなど、さまざまな視点から両者の特徴が掘り下げられています。エピソードでは、GPT-4.5とClaude 3.7 Sonnetの性能比較が行われ、文章構成、メール作成、アイデア出し、プログラミングの各タスクについて詳しく検討されています。Claude 3.7はコストパフォーマンスの面でも優れていると評価されており、GPT-4.5の高い利用料金にも触れられています。
モデルの発表と背景
みなさんこんにちは、矢野 哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けに、AIをわかりやすく解説する番組です。
今回のテーマは、GPT-4.5 preview vs Claude 3.7 Sonnet🔥について話していきます。
はい、ということで今日は、GPT-4.5 previewと、あとは、Claude 3.7 Sonnet🔥について話していきます。
みなさん、こちらのモデルは使ってみましたでしょうか?
先週、立て続けに発表されたモデルとなります。
アンソロピックから、Claude 3.7 Sonnet🔥が発表されました。
そして、その後に、OpenAIから、GPT-4.5 previewというモデルが発表されました。
各社、新しいモデルを発表した形となります。
元々、どちらか一方を、このポッドキャストで話そうと思っていました。
どっちを話そうかなと、Xでポストしたところ、リスナーの方からですね、
どっちも話してみたらどうですかと。
GPT-4.5 previewと、あとは、Claude 3.7 Sonnet🔥の比較も聞きたいという風にリプライがありました。
それ聞いて、あ、それいいですねっていうことで、
今日はGPT-4.5 previewと、あとは、Claude 3.7 Sonnet🔥について話したいと思います。
GPT-4.5とClaude 3.7の特徴
ちょっとですね、名前が長いので、以降はGPT-4.5と、あとは、Claude 3.7という風に話していきます。
実際に私がこのGPT-4.5と、Claude 3.7 Sonnet🔥を触ってみた感想なんかも交えて紹介したいと思います。
今日話すポイントは主に3つとなります。
1つ目に、まず先に結論から話したいと思います。
GPT-4.5と、Claude 3.7を使ってみた結論というのを先に話します。
そして2つ目に、事実関係ですね。
GPT-4.5と、Claude 3.7について、公式から発表されている事実ベースの数字について話したいと思います。
APIの価格がいくらなのかとか、どういったユーザーが使えるのかという点を話していきます。
そして最後3点目に、どのようなタスクで実際に私がGPT-4.5と、Claude 3.7を使ったのかということを話していきます。
この時にですね、具体的な比較内容なんかも話したいと思います。
では早速話していきましょう。
まず先に結論からちょっとお話ししたいと思います。
どちらも性能は上がっています。
実際にですね、GPT-4.0からGPT-4.5に、そしてClaude 3.5からClaude 3.7にバージョンがアップしているので、性能が上がっているということは間違いないです。
ただ実際に触ってみた感想として、かなりの衝撃があるような印象であったりとか、あとはゲームチェンジャーのようなモデルが登場してきたぞというところまでは言ってないかなというのが正直な感想です。
なぜこういうことを言うかというとですね、GPT-4.5かなり値段が高いんですよね。
チャットGPTにはプラスプランという月額3000円ぐらいのプランがあります。
そしてもう一つプロプランという、こちらがだいたい月額3万円ぐらいの高額なプランがあるんです。
で、このGPT-4.5はこのプロプラン、月額3万円のプランでないと利用ができないんですね。
つまり現時点においてGPT-4.5を使うには月額3万円支払う必要があります。
なので月額3万円を払ってまでこのGPT-4.5を使うかどうかと言われると、ちょっと私はですね払わなくていいのかなというのが正直な感想です。
ちなみにOpenAIの公式によると近いうちにこのGPT-4.5はプラスプランのユーザーも使えるようになるというふうに言われています。
おそらく近いうちにプラスプラン、つまり月額3000円のプランのユーザーであれば使えるようになると思います。
なのでより一層ですねGPT-4.5を目当てに3万円のプロプランに加入する必要は現時点ではないのかなと思いました。
一方でクロード3.7は無料ユーザーも使うことができます。普通にクロードのサイトにアクセスをするとクロード3.7を使うことができます。
後で話すんですけど、実際に複数のタスクをGPT-4.5とクロード3.7で比較をしてみました。
場合によってはGPT-4.5がいいなという場合もあれば、このタスクにおいてはクロード3.7の方がいいのかなと思う場面もありました。
ただ忘れてはいけないのはクロード3.7は無料ユーザーも使うことができるんですね。
一方でGPT-4.5は月額3万円を支払う必要があるというわけです。
そういったことを考えるとどちらのモデルも非常に性能がいいと感じます。
ただ金額面で見るとクロード3.7の方がコスパがいいのかなというのが私が感じた感想となります。
実際の使用感
はいまず先に結論はこんな感じでした。
ここからはまず前半で公式が出している数字ベースの話をします。
そしてその後後半では実際に私がGPT-4.5とクロード3.7を使ってみたタスクの結果、比較結果について話していきたいと思います。
実際に行ったタスクとしては文章構成、メールの作成、あとはアイデア出し、そしてプログラミングですね。
これらのタスクの比較結果なんかも話していきます。
はいでは先にまずGPT-4.5の話からしていきます。
公式サイトではGPT-4.5について次のように説明がされていました。
ちょっと引用しますね。
初期テストではGPT-4.5との対話がより自然に感じられることが示されています。
より広い知識ベース、ユーザーの意図を汲み取る能力の向上、そして進化したEQ、これは心の知能指数と呼ばれているものですね。
そして進化したEQにより文章作成、プログラミングの向上、実用的な問題解決など多様なタスクに役立つことが期待されています。
また誤った情報を生成するハルシネーションの頻度が低減することも期待されています。
引用は以上となります。
つまりですね、現在私たちが使っているGPT-4.0という汎用的なモデルがあります。
それよりもさらに1段階上に進んだモデルというのがこのGPT-4.5というわけです。
特にその人間との対話が自然に感じられるような、人間らしい応答をするようなモデルというのがGPT-4.5というように説明されています。
実際に触ってみた感想としても、この公式の発表と同じような感想を抱きました。
何と言ったらいいんですかね。
これちょっとやっぱり主観的な感想になってくるので、なかなか説明が難しいんですけど、
ChatGPTとの会話が、よりこう人間としているような会話のような自然なものになったっていう印象はあります。
で、あとはハルシネーションについても低減されているとのことですね。
これ実際にオープンAIの公式がデータを出しているんですけども、
GPT-4.0や、あとはO1、あとO3ミニの推論モデルがありますよね。
それの比較が掲載されているんですけども、そういった他のモデルよりもGPT-4.5の方がハルシネーションのレートは低くなっているというふうに報告されています。
補足すると、このハルシネーションというのは、AIが間違った回答をしてしまうという現象ですね。
これですね、ちょっと余談になるんですけど、これだけAIのモデルが進化していても、ハルシネーションが起こる確率っていうのはまだゼロになっていないんですよね。
今回GPT-4.5が出てきましたけども、そのGPT-4.5でもハルシネーションの割合っていうのはゼロにまだできていません。
なので、AIを運用する時、業務で活用する時っていうのは、AIはもうハルシネーションを起こすものなんだと。
AIは誤った回答を出すことが間もあるということを認識して、それも含めた上で運用することをお勧めします。
すいません、ちょっと脱線しました。公式の説明をさらに引用すると、GPT-4.5は人間の意図をより正確に理解し、微妙なニュアンスや暗黙の期待を高度なEQで、
EQというのは心の知能指数ですね。高度なEQで読み取ることができます。また、美的感覚や創造性にも優れ、特に文章作成やデザインの支援において高い能力を発揮します。
と説明されています。つまり、GPT-4.5はこれまでのモデルに比べて、人間の意図をより正確に理解してくれると。
そして、その言葉の中に含まれる微妙なニュアンスであったりとか、暗黙の期待、空気を読むと言えばいいんですかね。そういったものも以前のモデルに比べて、より正確に読み取ることができるようになりましたというふうに説明されています。
ここまでGPT-4.5の特徴について説明をしてきました。ここからはですね、以降はGPT-4.5をProPlan以外で使う方法についてちょっと言及したいと思います。
冒頭で触れたようにGPT-4.5を使うには、現状ProPlanに加入する必要があります。月額3万円のProPlanですね。
で、これはちょっと金額的にも高いので、このProPlanに入らなくても別のルートでGPT-4.5を使うことができます。それについてちょっと話したいと思います。
まず一つがAPI経由で使う方法になります。で、このAPIっていうのはプログラムからチャットGPTを操作するようなものになります。
API、OpenAIのAPIっていうのは使った分だけ重量課金されるわけなんですけど、このAPIからもGPT-4.5を使うことができます。
つまり月額3万円支払う必要というのはなくて、使った分だけ支払えばOKというものになります。
なので小さなタスクであれば数百円程度で使えるというようになります。
で、試しにですねGPT-4.5を使ってみたいっていう人はこちらの方がおすすめとなります。
で、やり方としてはまずOpenAIのサイトにアクセスをしてAPIキーっていうのを発行します。
で、あとはプログラムを書いてGPT-4.5を呼び出すわけですけど、
コードを書きたくないという人はですね、OpenAIのプレイグラウンドというお試し環境がおすすめとなります。
このプレイグラウンド、直訳すると遊び場っていう意味になるんですけど、
APIキーを発行した人ならプログラムを書かなくてもプレイグラウンドからGPT-4.5を呼び出して使うことができます。
変な話、ChatGPTのようなチャット画面、あれに似たような画面からGPT-4.5を呼び出していつもの操作のように使うことができます。
これがですね一番手っ取り早くて安くGPT-4.5を試す方法だと思います。
APIキーの発行の仕方はノートで記事を書いたので、こちらのリンクを概要欄に載せておきます。
興味のある方はチェックしてみてください。
1点だけ注意点があります。
GPT-4.5のAPIの価格って非常に高いんですよね。
100万トークンあたりのインプット価格が75ドル、そしてアウトプットが150ドルになります。
かなり高いんですよね。
これどれだけ高いかっていうとですね、GPT-4.0だとインプットが2.5ドルになります。
そしてアウトプットが10ドルになります。
なのでGPT-4.5とGPT-4.0を比較した時、価格が15倍、あとは30倍もするような価格となります。
かなり高いです。
なので先ほど私がAPIを使えば使った分だけ課金されるので、
3万円を使わなくてもGPT-4.5を使えますよと説明をしました。
ただ、APIの価格がかなり高いので、実際に使う場合はですね、
トークンの量、どれだけAIとやり取りするかっていうのは気をつけながら試してみた方がいいと思います。
GPT-4.5を使うもう一つの方法がパープレキシティになります。
パープレキシティが最近発表した内容だと、プロプラン、有料プランで月額20ドルのプランですね。
なので3,000円くらいのプランですかね。
このパープレキシティのプロプランになるとGPT-4.5を1日10回まで使用できますよという機能を実装しています。
パープレキシティ、検索AIなんですけど対応が早いですよね。
はい、以上がGPT-4.5の特徴となります。
では次にCloud 3.7について話していきたいと思います。
今まではCloud 3.5 SONNETというモデルを使っていました。
Cloud 3.7 SONNETの概要
それが新しくCloud 3.7 SONNETに変わったというわけになります。
このCloud 3.7は冒頭でも少し紹介しましたけど、無料ユーザーとあとは有料ユーザー、すべてのユーザーが使うことができます。
あとは有料ユーザーになると拡張試行モードって言って、より高性能なモードを使うことができるようになります。
これはチャットGPTでいう、O1やO3 miniなどの推論モデルに相当するモードですね。
そういった使い方もできると。
公式の説明をちょっと引用しますね。
Cloud 3.7 SONNETは、市場の他の推論モデルとは異なる哲学で開発されました。
人間が一つの脳で素早い反応と深い思考の両方を行うのと同じように、
推論は完全に独立したモデルではなくて、フロンティアモデルの統合された機能であるべきだと私たちは考えています。
この統合されたアプローチにより、ユーザーにとってよりシームレスなエクスペリエンスも実現されます。
以上が引用となります。
つまり、ChatGPTのように、推論モデルと推論でないモデルというのを分けることはせず、
Cloud 3.7 SONNETの中で使えるようにしていると。
推論を使いたいときは推論モードを使うというようなアプローチにしています。
このCloudなんですけど、もともとプログラミング関連のタスクで非常に高い評価というのを得ています。
Cloud 3.7の前のモデルというのも評価は高いですし、これに関しては私も同じ意見です。
アンソロピックが発表したベンチマークにはなるんですけど、
Cloud 3.5 SONNET、前のモデルや他社のOpenAIのO1、O3 mini、そしてDeepSeek R1、中国のAIモデルですね。
そういったモデルよりもプログラミング関連のベンチマークテストの結果が良かったと、
アンソロピックの発表ではですね。以上がCloud 3.7 SONNETの概要となります。
タスク別モデル比較
ここからは実際に私がいくつかのタスクでモデルの比較というのを行ってみました。
その結果というのを紹介したいと思います。
GPT 4.5と、あとはGPT 4.0と、そしてCloud 3.7 SONNET、これらの3つのモデルを1つのタスクで比較をしてみました。
具体的には文章構成とメール作成、アイデア出し、プログラミング、これらの4つのタスクで比較を行いました。
その結果というのをですね、ちょっと共有したいと思います。
まずは文章構成ですね。間違いが含まれた文章をより正確に修正してくれるかというタスクになります。
結果としては良い順番から言いますね。
GPT 4.5、その次がGPT 4.0、そしてCloud 3.7 SONNETの順番でした。
これちょっと意外な結果でしたね。
Cloud 3.7 SONNET、文章構成はちょっと苦手かなというように感じました。
もともと文章構成のタスクでGPT 4.0が一番性能が良かったんですね。
今回新しいモデルが出てきたわけですけど、それよりもGPT 4.5が上回る形になりました。
ただCloud 3.7 SONNETに関してはGPT 4.0よりも下という結果になりました。
ちなみにこのタスクは日本語の文章構成となります。
はい、では次がメール作成ですね。
メール作成の結果は上からCloud 3.7 SONNET、GPT 4.5、そしてGPT 4.0という順番になりました。
やっぱりCloud 3.7、まあCloud、メール作成とか文章作成のタスク強いですね。
より自然なメール作成であったりとか文章を作成してくれます。
特にですね、プロンプトに背景情報とか、あとはメールに含めて欲しいニュアンスなんかを盛り込むと結構いい感じの文章を作成してくれます。
はい、そして次がアイデア出しですね。
これはGPT 4.5とCloud 3.7 SONNETが同順位で、その下にGPT 4.0という結果になりました。
GPT 4.5とCloud 3.7はちょっと高圧がつけがたいというような感じでしたね。
でこのアイデア出しなんですけど、具体的にはですね、上場してからずっと赤字のとある企業、そのとある企業についてディープリサーチでアナリストのレポートを作成させて、
その結果っていうのを各AIに渡しました。
あなたはシリコンバレーで活躍する連続企業家ですと、ユーザーが添付した企業の赤字の原因っていうのを分析して、
もしあなたが経営者ならどう立て直すか、具体的な戦略を提示しながら理由とセットで説明してください、というようなニュアンスのプロンプトにしました。
その結果がですね、GPT 4.5とCloud 3.7が同じような感じの結果となりました。
なんと言ったらいいんですかね、GPT 4.5とあとCloud 3.7は結構説得力のある回答が生成された印象があります。
はい、そして最後にプログラミングですね。
具体的にはある機能を持ったChrome拡張機能っていうのを少ない指示で作成してみました。
結論言うとGPT 4.5もCloud 3.7も作成はできませんでした。
ちょっと私の指示の出し方も悪かったかと思うんですけど、
先に要件定義を作ってもらって、その要件定義をもとに、
じゃあこのChrome拡張機能を作ってくださいというふうに指示を出したんですけど、
ちょっとやっぱり1回の指示じゃできなかったですね。
そこから会話を掘り下げていけばですね、いつか実装できるんですけど、
最初の少ない指示だけで一発出しで、Chrome拡張機能はどのモデルでもできませんでした。
ただやっぱりCloud 3.7の方が作業はしやすかったかなという印象があります。
やっぱりCloudはプログラミング関連のタスク強いですね。
あのChatbot ArenaっていうAIモデルの比較ランキングサイトがあるんですけど、
その中にWebDev Arenaっていうランキングがありまして、
その最新ランキングを見ると、1位がCloud 3.7、そして2位がCloud 3.5、
そして3位がDeepSeek R1、こういった感じでですね、
プログラミング関連のタスクはやっぱりCloudが強いのかなという印象があります。
ここまでの結果を一旦まとめると、文章構成はGPT 4.5が良かったです。
そしてメール作成はCloud 3.7、アイデア出しはGPT 4.5もCloud 3.7も同点同順位でした。
そしてプログラミング関連のタスクはCloud 3.7の方が良かったかなという結果でした。
価格比較と総評
モデルを比較してかなりの性能差があるというよりも、タスクによってバラツキがあるのかなと、
ただですね、忘れちゃいけないのが価格ですね。
GPT 4.5は月額3万円のプロプランでないと利用できません。
一方でCloud 3.7は無料ユーザーでも利用できます。
これは重要なポイントだと思います。
APN料金に関してもGPT 4.5とCloud 3.7で比較してもですね、
だいたい10倍から25倍ぐらい違いがあります。
GPT 4.5の方が何十倍も性能が良いというわけではないと思います。
そう考えるとCloud 3.7はコスパが良いモデルかなという見方もできます。
ただ先ほども話したようにGPT 4.5は月額約3000円の有料プランに開放予定です。
おそらくGPT 4.5のこの高いAPI価格っていうのも修正が入ると思います。
もしかすると同じタイミングかもしれないですね。
GPT 4.5がプラスユーザーにも開放されるタイミングでAPIの価格も修正されるかもしれません。
ただ現時点で言うとやっぱりCloud 3.7の方がコスパが良いのかなというふうに感じました。
それでは今日のポイントをまとめます。
1つ目にOpenAIとAnthropicから新しいモデルGPT 4.5プレビューとCloud 3.7ソネットがリリースされました。
2つ目にGPT 4.5は現状月額約3万円のプランでないと利用できません。
開票方法としてはAPI経由で使うか、もしくはパープレキシティの有料プランで使うことができます。
こちらは月額3000円ぐらいのプランとなります。
GPT 4.5をAPI経由で使う場合は価格が高いのでご注意ください。
そして最後3点目に価格の面を含めてみるとCloud 3.7ソネットの方が使いやすいモデルだと感じました。
はい今日はこのへんということで本日も聞いていただきありがとうございました。
あのちょっと人を探しています。
先日ポッドキャストでお便りをいただきまして福岡在住の方で自治体関連のお仕事をされている方になります。
で私返信をしようと思ったんですけど連絡先が書かれてなかったので
心当たりがある方お手数なんですけどもう一度感想フォームからご連絡いただいてもよろしいでしょうか。
私が感想フォームにですね連絡先の入力欄を含めていないのでちょっと二度手間をかけて申し訳ないです。よろしくお願いします。
番組ではこのように耳で学べるAIを毎週発信しています。
通勤中や家事の合間にAI情報キャッチアップできます。
毎週水曜朝に更新していますのでぜひフォローお願いします。
おすすめの生成AIツールをまとめた資料も配布しています。興味のある方はこちらもぜひ概要欄にリンクを貼っておきます。
お相手は耳で学ぶAIの矢野てっぺいでした。また次の配信でお会いしましょう。
24:22
コメント
スクロール