41【触れ込みは本物か？】MiniMax M3を4モデル横並び比較

00:01

こんにちは、AI駆動開発部の日常へようこそ。このポッドキャストは、日々AI駆動開発を行う

伊予金山元とエンジニアの阿部が AI駆動開発について緩く語り合う番組です。

はい、じゃあよろしくお願いします。よろしくお願いします。

はい、じゃあ今日は、ちょっとね、多分配信するときは音声で配信するんですけど、ちょっと試しにね

ビデオポッドキャストを試そうと思って、動画でも撮ってます。これは多分、この映像が出ることはないんですけれども。

若干ね、いつもと違う感じで話してるんですけども。いつもね、ベンキャスターを使って、別トラックで撮れるようにっていうところで

やってるんですけれども、ビデオポッドキャストでも撮れたらいいなと思ってちょっと試しにやってます。なんか音声の感じとかもいつもと違うかもしれないんですけれども

まあまあその辺は、問題あったら文句、コメントでいただけると嬉しいです。

はい、じゃあちょっと今日ね、話したいなって思ってるのが、ミニマックスM3、ついに出ましたね、機体の。

ね、僕がミニマックスにすごく期待していたこと、2.7の時からね。結局ちょっと使えないなーみたいな感じだったんですけど

期待してたことっていうのが、速さと、あとGNMとかのモデルと比べて割りかし安かったんですよね。

あー結構あれですよね、ミニマックス推しな印象が。そうそうそうそう、期待を持って。まあ安いし、速いし、で、あとトークンプランっていうのがサブスクリプションプランがあるんですけど

ミニマックスについては、ほとんどのコーディングプランというか、サブスクリプションってコーディングにしか使えないんですよ、規約上。

うんうんうん。なんですけどミニマックスは公式に何でも使っていいよって言ってくれてるっていう、これも結構大きいところなんですよね。

うんうんうん。まあ実際はオープンクローでGNMが使えるようにしたりとか、それってもうコーディングじゃないよねみたいなことがあったりするんですけれども

まあとはいえその辺ののが結構期待していたみたいなのがありますと。で、ついに出たんで、ちょっと早速ね僕は買ってみました。使ってみました?

僕はまだ使ってないんですよ。山ちゃんが使うって言ったんで、まあその評価聞いてからかな。なんか僕の中で結構DeepSeek V4 Pro満足してるんで

うんうんうん。すごいなんか変えたいっていう欲求もなく、本当に良さそうだったら使ってみようかなぐらいの度感だったから、ちょっとまずは山ちゃんのレビュー聞こうかなっていう気持ちで言いました。

なるほどなるほど。じゃあ僕の早速の。

どうでしたか? そうですね、僕の評価としてはちょっと使えませんでした。

03:04

はい、使えない。安定性とかで言うと結構いい感じ。前提として何で使ったかっていうと、オープンコード全でね、今無料で使えるようになっているんで、なんでちょっとそれで試してみました。

ちょうどミニマックスになって結構性能も良くて、その上でしかも100万トップコンテキストが使えるよと、でさらに安いし、速さとかがどうなんかなみたいなところもあって、ちょっと触ってみたんですけれども、

試したことで言うと、オープンコード全でオープンコード上で使ったんですけど、1個ちょうどね、そんなに大したことないというか、バグがあったんで、それをちょっと調査させてみようと。

クロードのOPAS 4.8と、あとGPT 5.5と、クロードに関してはクロードコードベース経由で使っています。他はオープンコードでGPT 5.5、あとDeepSeqのV4 ProとミニマックスM3。この4体、クロード以外は全部オープンコードで使っているという前提なんですけど、ちょっとバグの調査をしてもらいました。

で、一番悪かった、一番悪かったミニマックスが一番悪かったですね。悪かったというか、一人だけ答えにたどり着けなかった。

あー、だいぶじゃあ。

だいぶですね。

はいはいはい。

そして、DeepSeq V4 Proより遅い。だから、もともと僕が期待していた速さも、良くない。答えにたどり着けない。

それなんかシンキングレベル?まあ、リーズニングみたいなのも。

一応、エクストラハイにした。

あー、そうなんだ。

まあ、そこそこリーズニングやってる感じだった。エクストラハイが効くのかどうかはちょっとわかんないけど、とりあえずやってて。

あと、オープンコード全ベースで使うと、20万トークンでコンパクトが走ってたんで、これはオープンコード上の問題かなーって思ってるけど。

はいはい。

そう、なんかその辺もあり。ただ、遅いし、なんか微妙だなーって感じも。

それはだいぶ微妙で。まあ、遅いのが結構きついかもね。

そう。極端に遅いわけじゃないですけど、ディープシークV4 Proより遅いっていうのは、僕の中でディープシークV4 Proかミニマックスどっちかみたいな感じのところがある中で、コスパとかいろいろ考えると。

でも、遅さに関して言うと、インフラの問題はあるかもしれない。

06:03

あー、うん。

なんかオープンルーターに切り替えた時に、もしかしたらなんか速くなるとかは。

オープンルーターのベースのTPSでもディープシークの方が速い感じになってて、だから、これって本当なのかな、ミニマックス速いはずなのにな、みたいな感じで思ってたんですけど、実際に遅かったっていうのが一応あるんですね。

で、あと、とはいえね、良くなったこともありまして、ミニマックスのM3について簡単に話すと、100万トークンコンテキスト使える。オープンコード上だと今使えないって問題あるんですけども、となってます。

で、あと、長文コンテキスト、普通ってリーズニングする量が、トークンが圧迫していくほど遅くなっていくんですけど、どうやら作り的にミニマックスは遅くならないらしい。そういうものらしいです。

おそらく、スパースアテンションっていう技術使ってて、これはディープシークV4 Proと同じなのかもしれない。そういう系統?全く同じかどうかはちょっと分からないけど、そういう系統で、ディープシークV4Proはその中で圧縮作業をしてるらしいんですけど、圧縮しながら読み込みみたいな感じで、長文コンテキストやりやすいみたいな感じでやってるけど、

ミニマックスは非圧縮であるから、より多くのコンテキストをやっても削減しないけど、速さも維持できてみたいな感じで、すごい良さそうに聞こえてる。で、100万トークンコンテキスト。あと、動画認識をネイティブでサポートしてると。

マルチモモダルサポートは結構ありがたいよね。

そう。で、しかもそれがトークンプランでコーディング以外で使えるから、結構動画の解釈みたいなところはかなり良いんじゃないかなって思ってるっていう。

結構業務向けに使えそうだなっていう感覚はなんだろうな。社内の普通の通常業務とかの改善とかにも使えそうには感じるけどって感じだよね。

そう。だから多分ワークフロー、マストラムワークフローとか載せる一部のことだったらやってのけれるんだろうな。コーディングみたいな複雑なことをやるとかになると。

あとちなみにバグの調査以外でも、ちょっと仕様を一緒に固めてやっていくみたいなことを軽いやつをね。そんななんかコアなところじゃないところをやってみたら、容易に認識の速度を起こしておりまして。

ああ、そうなんだ。

なので、ちょっと動作するみたいなところが弱いのかなって。まだチューニング中なのかもしれないけど。っていう感じです。

指示の追従性能というか、いったことをやるみたいなことはできそうなのか?

09:02

いったことをやるはやるんですけど、そこの認識がそもそも底があるっていうなんか、なんとも言えない。

けどちゃんとやる感はあるから、なんか全く使えないわけじゃないんだろうな、みたいな。

なんかワークフローに組み込むエージェントとしては意外と機能するかも。

そう。だからOMO、オーマイオープンエージェント的にはCPUPOSとかは貼れないな、みたいな。AtlusとかCPUPOSは貼れないけど、なんかカテゴリーの中のジュニアとかそういうのはいける。

ジュニア的なレベルの軽い処理とかそういうのとかはやってもらえるのかな、みたいな感じの。

で、そうなった時に別にそれだったらFlash、DeepSeek V4 Flashでいいよねってなるし、そっちのが圧倒的に安いし、みたいな感じになるんで、なんかちょっとあんまり出所がない。

だから唯一いいとこって動画ですよね。動画認識がしかもどのレベルでできるのか試してないんで。

ちなみにOPAS 4.8とGPT 5.5とDeepSeek V4 Pro、これらの比較で言うとGPT5.5が一番良かった。

一番やってほしい振る舞いというか、ちゃんとスキルを読み込んで、その上で事実ベースで確認して、一番早くたどり着いたのと、あとサブエージェントもうまく活用してみたいな。

そこはオープンコードとオーマイオープンエージェントっていうハーネス的な違いもあると思うけど、クロードコードのOPAS 4.8は一人でしっかり考え切って分析してちゃんと取り出す。

DeepSeek V4 Proも同じく一人でなんですけど、スキルとか読み込んでとか、一番ちゃんとした振る舞いをしてたのは5.5でした。

最近僕クロードコードまたハマりだして、ここ数日間ずっとクロードコードばっかり使ってたんですけど、5.5のほうがやっぱり良い動きはするんだなって。

バグとかそういう分析みたいなところに立つと、やっぱりしっかり動いてくれるっていう印象はあります。

次の回でクロードのOPAS 4.8と5.5の使い分けみたいなとか、実際どうかみたいな話できたらなって思うので、そこでまた話していけたらと思うんですけど。

振る舞いも決まっていることというか、事実ベースで動かないといけないときの振る舞いはやっぱGPTのほうが硬いな、やっぱ硬いなっていう感じがあるんで、ここは使い分けの問題かなっていうふうに思ってます。

で、DeepSeek V4 Proはなかなか良い動きをしてるんで、やっぱ。

ヤマウチすごいね。ベンチマークね、結構低めの評価出てるけど、そこの中ではかなりOPAS 4.5とか6に匹敵するぐらいなんじゃないかって、過剰評価かもしれないけども。

ヤマウチたぶん、なんかそれってさ、もう前回のさ、開放型段階志向みたいなのと一緒でさ、IQとか偏差値とかそういう話じゃなくて、せっかく的な、なんかより良いアウトプットをもたらす性格っていうのがあって、DeepSeek V4 Proがその性格だったっていうだけな気もするけど。

12:21

ヤマウチかもしれないよ。それはありそうだ。

ヤマウチベンチマークってやっぱ測れる、あれは決まってるからね。

ヤマウチ尺度がね、決まってるから。

ヤマウチそうそう、低下するから。そう、やっぱ手触り感とはちょっとやっぱずれるじゃん。

ヤマウチずれてる。

ヤマウチそういう意味でそうなのかなーって思ってますね。

ヤマウチということで、ミニマックスM3はちょっと動画をね、ちょっと今ビデオポッドキャストを試験的に撮ってますって言ったんですけど、それがやってる理由としては、動画の編集をAIでどうにかしたいなみたいな感じで、その兼ね合いもあるので、ということはミニマックスに動画理解をしてもらって、推論をしてもらって、っていうことをやっぱりやりたい。

そこはちょっとまたね、追って共有できればなと思ってるんですけれども、今のところちょっと使える感覚は、使える感覚というよりは僕たちのザグミの中で入り込める感覚はない。ディープシークでいいよね。

ヤマウチ開発のシーンにおいては、あんまり使わなそうだなって感じだよね。

ヤマウチそうはね。だから動画とかそういう独自の機能のところで、ワークフローに組み込みたいみたいなニーズが出たときにやるのかなって感じですね。

ヤマウチまあちょっと以上になります。

ヤマウチミニマックスM3期待でしたが。

ヤマウチなんでこんなにミニマックスを期待してんだ。やっぱ名前かな。

ヤマウチなんかずっとそんなテンションだよな。結構ミニマックス推しな。すごい感じる。

ヤマウチ期待の星?

ヤマウチだけどやっぱトークンプランのいろいろこうできる感じと。

ヤマウチあとコーディング以外にも使えるっていう、その業務へ行かせそうなところの期待感もあるのかな。

ヤマウチそうだね。エレジェンティックなのみたいな。

ヤマウチ僕的にはマルチモーダルすごい大きいかな。あのDeepSeek V4 Proがマルチモーダルじゃないので。

ヤマウチそうだね。テキストだけはマルチモーダル。

ヤマウチそうで100万コンテキストをできてかつマルチモーダルでそれなりに頭がいいっていうモデルとしてM3が結構期待だったっていうのはなんとなくわかるけどって感じだよね。

ヤマウチという感じで、ミニマックスの初感としては変わらなかったということの共有でした。

ヤマウチまたね、動画をやってみたときにどうかは続報として気になります。

ヤマウチそうですね。そこはまた共有できればなと思っておりますので、今日は以上にできればと思います。

15:00

ヤマウチじゃあありがとうございました。

ヤマウチありがとうございました。

ヤマウチありがとうございます。

ヤマウチ本日もAI駆動開発部の日常をお聞きいただきありがとうございました。

ヤマウチいかがでしたでしょうか。

ヤマウチ今回はミニマックスM3の実際の使用をしてみた感じの感想を共有できればと思ったんですけれども、

ヤマウチちょっとなかなかね、まだディープシーク、全く使えない感じはないんですけれども、ディープシークV4 Proのほうがちょっと上手だなみたいな感覚を得ました。

ヤマウチこんな感じでいろいろモデルであったりとかAIサービスとか使ってみてシェアしていってるので、

ヤマウチもしこのPodcastが気に入ってくれた方は、いいねやフォロー、高評価お願いいたします。

ヤマウチそれではまた次回もお楽しみください。バイバイ。

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

AI駆動開発部の日常

感想

総スター数

コメント

感想を書く