1. AI駆動開発部の日常
  2. 41【触れ込みは本物か?】Mini..
41【触れ込みは本物か?】MiniMax M3を4モデル横並び比較
2026-06-05 15:48

41【触れ込みは本物か?】MiniMax M3を4モデル横並び比較

今回は、僕がずっと心待ちにしていたMiniMax M3がついに登場したので、無料でも試せるOpenCodeにそのまま載せて、手元のバグ調査で使い倒した感触をお話ししています。
比較対象はClaude Code経由のClaude Opus 4.8、そしてOpenCode経由のGPT-5.5とDeepSeek V4 Pro。同じお題を横並びで追わせました。僕がMiniMaxに惚れ込んでいた理由は、速さと安さ、コーディング以外にも使えるトークンプランの自由さ、100万トークンでも失速しないという触れ込みに加え、動画のネイティブ理解です。期待値だけなら誰よりも高かったはず。対する阿部さんはDeepSeek V4 Proにすっかり満足していて、まずは僕のレビュー次第、という温度差からの幕開けでした。
結論そのものは番組に譲りますが、ベンチマークの数字と実際の手触りはどうしてもズレる、という地点へ何度も引き戻されます。白黒つけたというより、次に確かめたい宿題がくっきり残った回になりました。
ちなみに今回から試験的に映像も回しているのは、編集をAIに委ねたいから。だからこそM3が前面に掲げる動画理解はまだ試しきれておらず、ここは改めて続報としてお届けします。
▼MiniMax M3
https://www.minimax.io/blog/minimax-m3
▼DeepSeek V4 Pro
https://www.deepseek.com/
▼OpenCode
https://opencode.ai/
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/68dc82a9036795923c400b4f

感想

まだ感想はありません。最初の1件を書きましょう!

00:01
こんにちは、AI駆動開発部の日常へようこそ。 このポッドキャストは、日々AI駆動開発を行う
伊予金山元とエンジニアの阿部が AI駆動開発について緩く語り合う番組です。
はい、じゃあよろしくお願いします。 よろしくお願いします。
はい、じゃあ今日は、ちょっとね、多分配信するときは 音声で配信するんですけど、ちょっと試しにね
ビデオポッドキャストを試そうと思って、動画でも撮ってます。 これは多分、この映像が出ることはないんですけれども。
若干ね、いつもと違う感じで話してるんですけども。 いつもね、ベンキャスターを使って、別トラックで撮れるようにっていうところで
やってるんですけれども、ビデオポッドキャストでも撮れたらいいなと思って ちょっと試しにやってます。なんか音声の感じとかもいつもと違うかもしれないんですけれども
まあまあその辺は、問題あったら文句、コメントでいただけると嬉しいです。
はい、じゃあちょっと今日ね、話したいなって思ってるのが、ミニマックスM3、ついに出ましたね、機体の。
ね、僕がミニマックスにすごく期待していたこと、2.7の時からね。 結局ちょっと使えないなーみたいな感じだったんですけど
期待してたことっていうのが、速さと、あとGNMとかのモデルと比べて割りかし安かったんですよね。
あー結構あれですよね、ミニマックス推しな印象が。 そうそうそうそう、期待を持って。まあ安いし、速いし、で、あとトークンプランっていうのがサブスクリプションプランがあるんですけど
ミニマックスについては、ほとんどのコーディングプランというか、サブスクリプションってコーディングにしか使えないんですよ、規約上。
うんうんうん。 なんですけどミニマックスは公式に何でも使っていいよって言ってくれてるっていう、これも結構大きいところなんですよね。
うんうんうん。 まあ実際はオープンクローでGNMが使えるようにしたりとか、それってもうコーディングじゃないよねみたいなことがあったりするんですけれども
まあとはいえその辺ののが結構期待していたみたいなのがありますと。で、ついに出たんで、ちょっと早速ね僕は買ってみました。使ってみました?
僕はまだ使ってないんですよ。山ちゃんが使うって言ったんで、まあその評価聞いてからかな。なんか僕の中で結構DeepSeek V4 Pro満足してるんで
うんうんうん。 すごいなんか変えたいっていう欲求もなく、本当に良さそうだったら使ってみようかなぐらいの度感だったから、ちょっとまずは山ちゃんのレビュー聞こうかなっていう気持ちで言いました。
なるほどなるほど。 じゃあ僕の早速の。
どうでしたか? そうですね、僕の評価としてはちょっと使えませんでした。
03:04
はい、使えない。安定性とかで言うと結構いい感じ。前提として何で使ったかっていうと、オープンコード全でね、今無料で使えるようになっているんで、なんでちょっとそれで試してみました。
ちょうどミニマックスになって結構性能も良くて、その上でしかも100万トップコンテキストが使えるよと、でさらに安いし、速さとかがどうなんかなみたいなところもあって、ちょっと触ってみたんですけれども、
試したことで言うと、オープンコード全でオープンコード上で使ったんですけど、1個ちょうどね、そんなに大したことないというか、バグがあったんで、それをちょっと調査させてみようと。
クロードのOPAS 4.8と、あとGPT 5.5と、クロードに関してはクロードコードベース経由で使っています。他はオープンコードでGPT 5.5、あとDeepSeqのV4 ProとミニマックスM3。この4体、クロード以外は全部オープンコードで使っているという前提なんですけど、ちょっとバグの調査をしてもらいました。
で、一番悪かった、一番悪かったミニマックスが一番悪かったですね。悪かったというか、一人だけ答えにたどり着けなかった。
あー、だいぶじゃあ。
だいぶですね。
はいはいはい。
そして、DeepSeq V4 Proより遅い。だから、もともと僕が期待していた速さも、良くない。答えにたどり着けない。
それなんかシンキングレベル?まあ、リーズニングみたいなのも。
一応、エクストラハイにした。
あー、そうなんだ。
まあ、そこそこリーズニングやってる感じだった。エクストラハイが効くのかどうかはちょっとわかんないけど、とりあえずやってて。
あと、オープンコード全ベースで使うと、20万トークンでコンパクトが走ってたんで、これはオープンコード上の問題かなーって思ってるけど。
はいはい。
そう、なんかその辺もあり。ただ、遅いし、なんか微妙だなーって感じも。
それはだいぶ微妙で。まあ、遅いのが結構きついかもね。
そう。極端に遅いわけじゃないですけど、ディープシークV4 Proより遅いっていうのは、僕の中でディープシークV4 Proかミニマックスどっちかみたいな感じのところがある中で、コスパとかいろいろ考えると。
でも、遅さに関して言うと、インフラの問題はあるかもしれない。
06:03
あー、うん。
なんかオープンルーターに切り替えた時に、もしかしたらなんか速くなるとかは。
オープンルーターのベースのTPSでもディープシークの方が速い感じになってて、だから、これって本当なのかな、ミニマックス速いはずなのにな、みたいな感じで思ってたんですけど、実際に遅かったっていうのが一応あるんですね。
で、あと、とはいえね、良くなったこともありまして、ミニマックスのM3について簡単に話すと、100万トークンコンテキスト使える。オープンコード上だと今使えないって問題あるんですけども、となってます。
で、あと、長文コンテキスト、普通ってリーズニングする量が、トークンが圧迫していくほど遅くなっていくんですけど、どうやら作り的にミニマックスは遅くならないらしい。そういうものらしいです。
おそらく、スパースアテンションっていう技術使ってて、これはディープシークV4 Proと同じなのかもしれない。そういう系統?全く同じかどうかはちょっと分からないけど、そういう系統で、ディープシークV4Proはその中で圧縮作業をしてるらしいんですけど、圧縮しながら読み込みみたいな感じで、長文コンテキストやりやすいみたいな感じでやってるけど、
ミニマックスは非圧縮であるから、より多くのコンテキストをやっても削減しないけど、速さも維持できてみたいな感じで、すごい良さそうに聞こえてる。で、100万トークンコンテキスト。あと、動画認識をネイティブでサポートしてると。
マルチモモダルサポートは結構ありがたいよね。
そう。で、しかもそれがトークンプランでコーディング以外で使えるから、結構動画の解釈みたいなところはかなり良いんじゃないかなって思ってるっていう。
結構業務向けに使えそうだなっていう感覚はなんだろうな。社内の普通の通常業務とかの改善とかにも使えそうには感じるけどって感じだよね。
そう。だから多分ワークフロー、マストラムワークフローとか載せる一部のことだったらやってのけれるんだろうな。コーディングみたいな複雑なことをやるとかになると。
あとちなみにバグの調査以外でも、ちょっと仕様を一緒に固めてやっていくみたいなことを軽いやつをね。そんななんかコアなところじゃないところをやってみたら、容易に認識の速度を起こしておりまして。
ああ、そうなんだ。
なので、ちょっと動作するみたいなところが弱いのかなって。まだチューニング中なのかもしれないけど。っていう感じです。
指示の追従性能というか、いったことをやるみたいなことはできそうなのか?
09:02
いったことをやるはやるんですけど、そこの認識がそもそも底があるっていうなんか、なんとも言えない。
けどちゃんとやる感はあるから、なんか全く使えないわけじゃないんだろうな、みたいな。
なんかワークフローに組み込むエージェントとしては意外と機能するかも。
そう。だからOMO、オーマイオープンエージェント的にはCPUPOSとかは貼れないな、みたいな。AtlusとかCPUPOSは貼れないけど、なんかカテゴリーの中のジュニアとかそういうのはいける。
ジュニア的なレベルの軽い処理とかそういうのとかはやってもらえるのかな、みたいな感じの。
で、そうなった時に別にそれだったらFlash、DeepSeek V4 Flashでいいよねってなるし、そっちのが圧倒的に安いし、みたいな感じになるんで、なんかちょっとあんまり出所がない。
だから唯一いいとこって動画ですよね。動画認識がしかもどのレベルでできるのか試してないんで。
ちなみにOPAS 4.8とGPT 5.5とDeepSeek V4 Pro、これらの比較で言うとGPT5.5が一番良かった。
一番やってほしい振る舞いというか、ちゃんとスキルを読み込んで、その上で事実ベースで確認して、一番早くたどり着いたのと、あとサブエージェントもうまく活用してみたいな。
そこはオープンコードとオーマイオープンエージェントっていうハーネス的な違いもあると思うけど、クロードコードのOPAS 4.8は一人でしっかり考え切って分析してちゃんと取り出す。
DeepSeek V4 Proも同じく一人でなんですけど、スキルとか読み込んでとか、一番ちゃんとした振る舞いをしてたのは5.5でした。
最近僕クロードコードまたハマりだして、ここ数日間ずっとクロードコードばっかり使ってたんですけど、5.5のほうがやっぱり良い動きはするんだなって。
バグとかそういう分析みたいなところに立つと、やっぱりしっかり動いてくれるっていう印象はあります。
次の回でクロードのOPAS 4.8と5.5の使い分けみたいなとか、実際どうかみたいな話できたらなって思うので、そこでまた話していけたらと思うんですけど。
振る舞いも決まっていることというか、事実ベースで動かないといけないときの振る舞いはやっぱGPTのほうが硬いな、やっぱ硬いなっていう感じがあるんで、ここは使い分けの問題かなっていうふうに思ってます。
で、DeepSeek V4 Proはなかなか良い動きをしてるんで、やっぱ。
ヤマウチ すごいね。ベンチマークね、結構低めの評価出てるけど、そこの中ではかなりOPAS 4.5とか6に匹敵するぐらいなんじゃないかって、過剰評価かもしれないけども。
ヤマウチ たぶん、なんかそれってさ、もう前回のさ、開放型段階志向みたいなのと一緒でさ、IQとか偏差値とかそういう話じゃなくて、せっかく的な、なんかより良いアウトプットをもたらす性格っていうのがあって、DeepSeek V4 Proがその性格だったっていうだけな気もするけど。
12:21
ヤマウチ かもしれないよ。それはありそうだ。
ヤマウチ ベンチマークってやっぱ測れる、あれは決まってるからね。
ヤマウチ 尺度がね、決まってるから。
ヤマウチ そうそう、低下するから。そう、やっぱ手触り感とはちょっとやっぱずれるじゃん。
ヤマウチ ずれてる。
ヤマウチ そういう意味でそうなのかなーって思ってますね。
ヤマウチ ということで、ミニマックスM3はちょっと動画をね、ちょっと今ビデオポッドキャストを試験的に撮ってますって言ったんですけど、それがやってる理由としては、動画の編集をAIでどうにかしたいなみたいな感じで、その兼ね合いもあるので、ということはミニマックスに動画理解をしてもらって、推論をしてもらって、っていうことをやっぱりやりたい。
そこはちょっとまたね、追って共有できればなと思ってるんですけれども、今のところちょっと使える感覚は、使える感覚というよりは僕たちのザグミの中で入り込める感覚はない。ディープシークでいいよね。
ヤマウチ 開発のシーンにおいては、あんまり使わなそうだなって感じだよね。
ヤマウチ そうはね。だから動画とかそういう独自の機能のところで、ワークフローに組み込みたいみたいなニーズが出たときにやるのかなって感じですね。
ヤマウチ まあちょっと以上になります。
ヤマウチ ミニマックスM3期待でしたが。
ヤマウチ なんでこんなにミニマックスを期待してんだ。やっぱ名前かな。
ヤマウチ なんかずっとそんなテンションだよな。結構ミニマックス推しな。すごい感じる。
ヤマウチ 期待の星?
ヤマウチ だけどやっぱトークンプランのいろいろこうできる感じと。
ヤマウチ あとコーディング以外にも使えるっていう、その業務へ行かせそうなところの期待感もあるのかな。
ヤマウチ そうだね。エレジェンティックなのみたいな。
ヤマウチ 僕的にはマルチモーダルすごい大きいかな。あのDeepSeek V4 Proがマルチモーダルじゃないので。
ヤマウチ そうだね。テキストだけはマルチモーダル。
ヤマウチ そうで100万コンテキストをできてかつマルチモーダルでそれなりに頭がいいっていうモデルとしてM3が結構期待だったっていうのはなんとなくわかるけどって感じだよね。
ヤマウチ という感じで、ミニマックスの初感としては変わらなかったということの共有でした。
ヤマウチ またね、動画をやってみたときにどうかは続報として気になります。
ヤマウチ そうですね。そこはまた共有できればなと思っておりますので、今日は以上にできればと思います。
15:00
ヤマウチ じゃあありがとうございました。
ヤマウチ ありがとうございました。
ヤマウチ ありがとうございます。
ヤマウチ 本日もAI駆動開発部の日常をお聞きいただきありがとうございました。
ヤマウチ いかがでしたでしょうか。
ヤマウチ 今回はミニマックスM3の実際の使用をしてみた感じの感想を共有できればと思ったんですけれども、
ヤマウチ ちょっとなかなかね、まだディープシーク、全く使えない感じはないんですけれども、ディープシークV4 Proのほうがちょっと上手だなみたいな感覚を得ました。
ヤマウチ こんな感じでいろいろモデルであったりとかAIサービスとか使ってみてシェアしていってるので、
ヤマウチ もしこのPodcastが気に入ってくれた方は、いいねやフォロー、高評価お願いいたします。
ヤマウチ それではまた次回もお楽しみください。バイバイ。
15:48

コメント

スクロール