Composer 2.5が切り拓くCursorの新時代：速い・安い・高性能の実力 #デブログfm #016

Composer 2.5の性能とコスト効率

直近、Cursorの新しいモデルが出たり、料金待機が変わったりした話があって、やっぱりCursorって最強じゃないかと思ったので、今日はその話をしてみたいと思います。

まずはじめに、Composer 2.5というのが出ました。これは、前回ポードキャストでデブログfm第9回頃でお話ししたと思うんですが、

Composer 2というCursorの独自のモデルが出ました。まずこのComposer 2.5の性能を見てみたいんですけれども、

比較として見てみたいのはCursorベンチ。これはCursorがやっているベンチマークですが、これをもとにComposer 2.5がどれぐらい性能があるのかというのを見てみたいと思います。

このベンチマークを動かすときに、ベンチマークの1タスクを動かすにどれぐらいコストがかかるのかに対してスコアが何パーセントあるのかという評価軸で、2軸で見ているものですが、

Composer 2.5はコストが0.55ドルでスコアが63.2%ですね。

1個前のモデルComposer 2はコストはほとんど同じで0.56ドルでパフォーマンスは52.2%でした。

なので52.2%に対して63.2%なのでかなり上がってきてますよね。

じゃあ他のフロンティアモデルと比較してどうなんだというところなんですが、まずはじめにGPD 5.5ですね。

デフォルトのエフォートはミディアムなので、それで見ていくとコストは2.22ドルでスコアは59.2%ですね。

これはComposer 2.5よりも下の数字でComposer 2よりも上の値と、だいたい真ん中ぐらいのところにスコアが来ております。

コストはですね、かなり高いというところですね。4倍ぐらい高いですというところです。

じゃあGPD 5.5でComposer 2.5を超える性能を出すにはどうしたらいいかというと、

エフォートレベルをXハイにしてあげると64.3%になり、ここで初めてComposer 2.5の63.2%を超える。

約1%ぐらい超えてくるというところですが、コストは1回タスクあたり4.37ドルというところで、ものすごく高くなってしまってますね。

次に見ていくのはオーパス4.8ですね。アンソロピックの一番新しいモデルですが、こちらのデフォルトのエフォートはハイなので、ハイで見てみるとコストは4.41ドル。

スコアは58.4%とComposer 2.5よりも下ということになっております。

じゃあComposer 2.5よりも超えるパフォーマンスを出そうとすると、MAXのエフォートにすると63.8%となって、

Composer 2.5の63.2%を若干超えられるというようなスカーになっていて、新しいコストが7.59ドルとなっておりますので、

15倍くらいコストの差があるということで、同じくらいの性能を出そうと思ってコストが15倍だったらComposer 2.5を取りますよねというところですね。

もちろんこのスコアはカーサーがやっているベンチマークスコアなので、当然このスコアを上げるためにComposer 2.5を作っているので高くなるよねというところではあるんですが、

実際に私がこのComposer 2.5を使ってみて感じている体感と結構遜色がないというか、別にオーパスとかGPT使わなくても十分だなというふうな性能があるので、

体感とそんなに相違がないというところは私の体感として付け加えておきたいと思います。

コンテキストウィンドウの制限と対策

ただ1点だけデメリットを挙げるとすれば、コンテキストウィンドウが20万トークなのでちょっと短いと感じることはあります。

最近のオープンAIのGPT 5.5とかアンソロピックのオーパスモデルというのは100万トークンあるので、Composer 2.5と比べると5倍ぐらいコンテキストウィンドウが違います。

この5倍というのは結構大きくて、割と中規模なタスクをComposer 2.5でやろうとするとコンテキストウィンドウの上限に来てしまうことがたまにあるので、

この辺はちょっとデメリットというか工夫してやる必要があるなと思っております。

この工夫の点として一つ挙げられるのは最近オーケストレートというプラグインが出たんですね。

これはタスクを与えるゴール設定をするとCursorのSDKを使ってワーカーに分解してタスクを各個別にやってもらったものを最後まとめてやるみたいなやつですね。

これはクロードコードで最近出たダイナミックワークフロー、ウルトラコードみたいなものに近いと思うんですが、

非常に大規模なタスクをたくさんのワーカーに分けて同時に実行するみたいなやつですけど、これと同じような仕組みで動かせるものですが、

こういったものを使うとタスクを一個のコンテキストでやるのではなくて、各タスクごとにサブエージェントを分けて実行することができるので、

この少ないコンテキストウィンドウの中でもうまく実行できるというところで、

なのでこういったちょっとした工夫が必要かなというところではありますが、日々使う用途においてはそんなに大規模な開発ってやらないので、

そんなに工夫することもなくコンテキストウィンドウが短いということを気にすることもなく、

かつコストも非常に安いのでコストもあまり気にすることなく使うことができると気軽に高性能なモデルということで非常に気に入って使っております。

最後にもう一個大事なことを言うと、コンポーザー2.5ってものすごく早いんですよね。

トークンパーミニッツがすごく高いので、なので早い安いうまいじゃないですけれども、トークンパーミニッツが高いと。

なのでレスポンスが早い。

かつコストはもうオーパスとかGPTに比べて5分の1とか10分の1の世界ですというところ。

パフォーマンスはもうなんならGPTとかオーパスと同じぐらい、もしくはそれを超えるという性能があるというところがあるので、とても気に入って使っております。

BugBotの新料金体系と機能

次はバグボットという機能なんですが、これはGitHubのプロリクエストとかに常駐していて、プロリクエストを実際に上げると、

母さんのバグボットという仕組みでレビューをして問題がないか確認をして、指摘事項があればこういう指摘事項がありますよというのをやってくれる機能ですね。

例えば最近出ているCode RabbitみたいなNexusのツールがありますけれども、そういったものですね。

今までこのバグボットを私も使いたかった会社の中でも導入したかったんですけれども、

一つ課題があって、これはバグボットはまた別シート課金になっているんですよね。

なのでカーサーを使っていたとしても、していなかったとしても、1人当たり必ず40ドルのコストがかかってきていました。

なのですごく使う人はいいんですけれども、あんまり使わない、ちょっと試してみたいっていう人に対して、じゃあ1人当たり40ドルかってなってくると、

そもそもカーサーのシート課金が40ドルですよね。それと同じだけかかるんですかというところを考えるとちょっと高すぎるなというふうに思っていました。

ただですね、2026年の5月の11日にアナウンスがありまして、これがシート課金から完全な重量課金に変わりました。

だいたいですね、1回のレビューあたり1ドルから1.5ドルぐらいのコストがかかりますというところなので、

大量にプルリクのレビューをバグボットでやってしまうと、今の元々のバグボットのシート課金よりも超えてしまうんですけれども、

ちょっと試したいとか、小規模に試したいみたいなとき、そういったときにはすごく便利かなというふうに思って導入がしやすい料金体系になりました。

このバグボットのいいところは、もちろんCursorにインテグレーションされているので、Cursorの画面から離れることなくいろんな設定ができます。

いろんな画面の操作もCursorのWebUIとかCursorの画面上からできますというところもそうなんですが、

メモリー機能というのがあってですね、このプルリクエスト上で何かAIが気づかなかったレビューポイントがあったとして、

それをアットマーク、Cursor、Remember、何とら何とかって書いておくと、それをCursorのクラウド上にメモリーとして保存しておく機能があります。

なので次、もう1回同じようなプルリクが上がったら、そのメモリーから出してきて、前ってこういう指摘があったから同じ指摘をして、

こういうふうに改善するといいですよというサジェッションまで出してくれるという機能があって、これが非常に便利ですね。

最後に加えて言うと、このCursorはクラウド環境を持っていますよね。Cursorのクラウドエージェントという機能があって、

クラウド環境でCursorが動くという、ローカル環境でCursorを動かすのではなくて、クラウドで実際に開発環境を立てて、

そこでコードを生成してプルリクエストを作るみたいな機能があるんですけれども、このバグボットにもその同じ機能がインテグレーションされていて、

それをオートフィックス機能と呼んでいます。このオートフィックス機能は何がいいかというと、単にこういうふうに改善したらいいですよという

サジェッションコードの差分を出しているだけではなくて、実際にクラウドエージェントの環境でテストをして、

CIをしてテストがパスしたものを提案してくれるという機能なので、これが非常に便利でバグボットというのを気に入って使っております。

チームプランの新オプション「プレミアムシート」

最後ですね、これも料金系のアナウンスメントですが、チームプランのプレミアムシートという枠組みが出てきました。

今まではカーサーを会社で使おうと思ったら、基本的にはチームプランですね。

SSOができるとか、管理者が一括で請求管理ができるとか、誰がどれくらい使っているか、ログが取れるみたいな機能があるので、

基本的にはチームプランを選択する必要があるんですが、これが40ドルのシート課金、それを超えた分が重量課金で支払わなければいけないという機能でした。

なので、すごく使うヘビーユーザーが結構この重量課金をめちゃめちゃいっぱい使ってしまうということがよく起きています。

例えば200ドルとか300ドルとか400ドルとか使ってしまう。

使うこと自体は悪くはないというか、その分パフォーマンスを出していれば問題はないんですが、

この管理する側に立って考えるとこれが一体いくらになるのかというのがわからないというのが非常に怖さがありました。

このプレミアムシートというのは料金が3倍になります。

もともとスタンダードプランが40ドルなんですが、3倍の120ドルになります。

この120ドルで使えるトークンの量っていうのはスタンダードの5倍使えます。

料金は3倍なので非常にコストパフォーマンスが良いということですね。

なので重量課金が200ドルとか言っている人とかだとしても、この120ドルの支払いに収まるんじゃないかなというふうに思っていて、

この公式アナウンスによるとカーサーのヘビーユーザーの99%がこのプレミアムプランの料金プールの中だけでカバーできるというふうに書いているので、

もしかしたらほとんどの人がこのプレミアムプランの120ドルだけで済んでこの重量課金が発生しないということが起きそうだなというふうに感じております。

ただこのプレミアム機能のスタートというのが7月1日の次の支払期限のスタートからというところなので、

もうちょっと先にならないと使えない状況ではあるんですが、

もしくは新しいユーザーもこのプレミアムシートもしくはスタンダードプランを選ぶというモードでスタートするらしいので、

新しく今からチームプランを使うという方はすぐに使えるので、

このスタンダードとプレミアムと切り分けた上で予算設定をして使ってみるといいんじゃないかなというふうに思います。

今までこのプレミアムプランがないのがちょっと不便でして、

重量課金がすごく多い人というのが出てくると全体のコストを非常に圧迫してしまう。

AIの利用料金の予算をかなり圧迫してしまうということがあったので、

重量課金が多い人というのは一旦チームプランから出て行ってもらって、

個別に個人でウルトラプランに入ってもらうみたいなことをやっていたんですね。

そうするとこのチームの機能であったSSOであるとかログが取れるみたいなことができなくなってしまうというリスクもあるので、

ちょっと致し返しだなというふうに思っていたんですが、それをやらなくてよくなったというところがあるので非常に大きいと、

このチームプランでもいけるじゃんということが分かってきたというところですね。

CursorとClaudeの使い分け

こんな感じでモデルの性能もクラウドを超えてきているし、

バグボットというそれ以外のインテグレーションの機能もあるし、

クラウド環境のエージェント機能もあるし、

今までチームのスタンダードプラン1個しか料金待機がなかったのがプレミアム機能も出てきたというところがあるので、

クラウドとカーサーの差がほとんどなくなってきたというところがある中で、

私個人的にはカーサーだけでいいかなというところではあるんですが、

クラウドとカーサーと2大共闘だと思うんですが、

どういった場合にクラウドを使うべきで、どういった場合にカーサーを使うべきでという話をしていきたいんですが、

今までカーサーはIDEでいろんなGPTも使えるし、クラウドも使えるし、

ジェミニーのモデルも使えますし、みたいなモデルの選択の優位性があったとか、

あとはクラウドに関してはデファクトスタンダードで情報がいっぱい溢れていて、

オーパスという非常に強いモデルがあって、ソネットというコストパフォーマンスがいいモデルがあってという世界線ではあったんですが、

今ではほとんど差がなくなってきていて、

物によってはカーサーの方がかなり上回っているという状況になってきているので、

もうどっちかだけ選べばいいんじゃないかなという時代になってきています。

今の段階ではですね、もちろんこの明日、あさってにクラウドが今までにない革新的な機能を出してきて、

やっぱりクラウドだよねってなる可能性はあるんですが、

今の段階ではもうどっちでもいいかなという状況になってきているかなという個人的な体感です。

ではですね、どういうふうに使い分けかというと、

まずカーサーの強みというと、IDに統合されているというところですね。

Visual Studioをベースの画面上になっているので、コードを画面上で見ながら操作するみたいな、

今までの開発体系に近いUIでやれるというところもありますし、

カーサーのCLIもあるので、クラウドのようにも使えるし、

クラウドエージェント機能もあるし、バグボットもあるしというところで、

開発に必要なものが一通り揃っているというところですね。

加えて最近はコンポーザーっていうカーサーが作っている独自モデルがめちゃめちゃいいというところがありました。

あとですね、とはいえオーバース使いたいとかGPT使いたいという場合はあると思うんですが、

そういった場合でもカーサーであれば、もちろんコンポーザー2.5を使うのが一番私もお勧めだと思うんですが、

使いたくなったら別にモデル選択ができるので、それを選んでもらってやればいいだけなので、

それで例えばオーバースが使いたい、GPTが使いたいという場合に、

わざわざそれぞれのクラウドとかオープンAIに課金する必要がないというところがあるので、

非常に便利かなというふうに思っています。

でも一方でですね、クラウドを抜け出せないパターンというのはいくつかあるかなと思っていて、

例えばですけどクラウドデザインとかクラウドコワークなどを使いたい、どうしても使いたいという場合は、

今のところ他にあんまり選択肢がない。

もちろん似たようなこともカーサーでもできるんですけれども、

UIの使い勝手とか、あとは世の中一般的にクラウドの使い方の情報が圧倒的に多いので、

ディープに調べればカーサーでも同じことができるんだけれども、

一般にジェネラルに多くの人が使う場合においては情報の豊富さとか、

ベストプラクティスの共有みたいな観点で、

まだまだクラウドの方が有利性があるなというところがあるので、

ここは使い分けが必要ではあるんですが、

例えばですけど私みたいにマニアックでいろんな情報を調べていて、

カーサーにはこういう機能があって、クラウドにはこういう機能があって、

クラウドのこの機能はカーサーのこの機能だよねとか、

カーサーのこの機能はクラウドのこの機能で大体大体できるよねということが、

なんとなく分かっている人であれば、

カーサーを選んだ方がコストパフォーマンスもいいし、

いろんな機能もインテグレーションして使えるしってところがあるので、

カーサーを選べばいいんじゃないかなというふうに思っているところです。

まとめと今後の展望

ということで今回はクラウドじゃなくてカーサーだけで生きていける時代になったな、

考え深いなという話をしてみました。

コンポーザー2.5が出て、利用枠が増えて、チームのプレミアムシートも出て、

いよいよクラウドを解約してカーサーだけでいくっていう選択肢が取れるようになってきたので、

社内のAI推進担当、つまりAIのコストを管理している人にとっても、

例えばクラウドとカーサーとどっちも使いたいですっていう人に対して、

どっちかでよくないですかって言いやすくなった、

管理しやすくなったっていう点でも嬉しいのかなというふうに思っています。

ということで最後に番組を紹介させてください。

この番組Develop FMはYouTube、Apple Podcast、Spotifyなどで配信しております。

ぜひお好きなプラットフォームからサブスクライブをお願いします。

データを見ると90%の方はフォローせずに視聴していただいているようでございまして、

最後まで今聞いてくださっている方、ぜひフォローまでしていただけると大変嬉しく思います。

それでは次回の配信でお会いしましょう。

ご視聴ありがとうございました。

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

inady

感想

サマリー

目次

総スター数

コメント

感想を書く