1. マヂカル.fm
  2. 247: MCPすらないAI Agent、Pi..
247: MCPすらないAI Agent、Pi ~意思のないプロダクトは要らない~
2026-05-07 24:02

247: MCPすらないAI Agent、Pi ~意思のないプロダクトは要らない~

spotify apple_podcasts

今回は「Pi」について話しました。

コーディングエージェント/エージェントハーネス/プラグイン豊富/MCP/OpenClawbの裏側/AutoResearch/4機能しかない/僕の考えた最強エージェントを作れる

▼ 名言ステッカーやアクリルキーホルダーなどのグッズが増えました🙌
https://suzuri.jp/magicalfm

 

▼ マヂカル.fmとは
関西人のプロダクトマネージャー@michiru_daと関西人(?)のソフトウェアエンジニアの@upamuneが週2で配信する雑談Podcast。

 

▼ お便りや感想はこちらからおまちしています。

X(旧Twitter): #magicalfm 
おたよりフォーム: https://magical.fm/hello
マシュマロ:https://marshmallow-qa.com/xno94s1ortkw63w?t=e1P9wQ

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

このエピソードでは、最近注目を集めているコーディングエージェント「Pi」について掘り下げています。Piは、ファイルを読み書きし、コマンドを実行するという4つの基本的な機能に特化しており、そのシンプルさが最大の特徴です。しかし、そのシンプルさゆえに、ユーザーはPiの機能をほぼ全てカスタマイズ・拡張できるという点が革新的です。ユーザーは独自のプラグインを作成し、既存の機能を変更したり、全く新しい機能を追加したりすることが可能です。例えば、ゲーム「Doom」をPi上で動かすことさえ理論上は可能であり、これはPiが「真っ白なキャンバス」のような存在であることを示しています。 Piは、コーディングエージェントとしての側面だけでなく、エージェントハーネスとしても機能します。多くの最新エージェントが多機能化する中で、Piは意図的に機能を絞り、拡張性を重視しています。これにより、ユーザーは自身のニーズに合わせて、組織固有のルールやセキュリティ要件に適合した、あるいは特定のタスクに特化した「自分だけの最強エージェント」を構築できます。例えば、社内向けの便利ツールを開発する際に、Piをベースにすることで、不要な機能を排除し、必要な機能だけを組み込むことが可能です。また、OpenClawのような有名なプロジェクトもPiで構築されていることが紹介されました。 さらに、Piのプラグイン機構の強力さが強調されています。特に「AutoResearch」プラグインは、コードの最適化を自動で行い、大幅なパフォーマンス向上を実現する例として挙げられています。このプラグインは、遅い機能を特定し、修正を繰り返し、安定した高速化を達成する能力を持っています。Piは、このような高度なカスタマイズや最適化を、従来の多機能エージェントよりもシンプルに実現できる点が魅力です。一方で、日本語入力の弱さなど、現時点での課題も指摘されており、開発者はより汎用的なオープンコードに移行したという話も紹介されました。Piは、エンジニアの「描きたい放題」という心をくすぐる、カスタマイズ性の高いエージェントとして、その可能性を示しています。

Pi(パイ)とは何か?その登場と基本機能
michiru_da
マヂカル.fmは関西人のプロダクトマネージャーのみちるだと、関西人のソフトウェアエンジニアのうぱみゅんが、週2で配信する雑談ポッドキャストです。
お願いします。
うぱ / upamune
お願いします。
michiru_da
今日のテーマは、
うん。
P.I.
P.I.
P.I.って何?
うぱ / upamune
はい?
michiru_da
なんかツイッターにまたこの週末ぐらいから、なんかP.I.はめっちゃいいぞみたいな。
うぱ / upamune
え?それ、みちるださんどこのツイッターのクラスタに?
michiru_da
2人ぐらい出現してた。
本当はPとI、アルファベットの。
うぱ / upamune
はい、ラズベリーパイのパイね。
michiru_da
あ、パイなんだ。
そうで、それ見たときに、なんかそういえばうぱさんも、なんかパイ、なんかこれめっちゃいいみたいな、ポジティブなツイートしてたなと思って、これは何だと思ったよ。
うぱ / upamune
ちなみにパイはもう100年前からあるツイートだよ。
michiru_da
去年の11月ぐらい。
え、本当に100年前?え、めっちゃ4ヶ月ぐらい。
うぱ / upamune
いや、もうLLM時代だともう4ヶ月前も100年前ぐらい。
じゃ、半年?半年ぐらいの。
うん。
michiru_da
え、でも全然見たことなかったわ。
うぱ / upamune
あ、そうなんだ。
michiru_da
タイムラインでは。
エンジニアタイムラインでは、常識?
うぱ / upamune
ま、常識じゃないですかね。
えー。
うぱ / upamune
私が2月にパイのクローンみたいなやつを作ってますね。XIっていう。
michiru_da
どういうこと?
うぱ / upamune
え、そのパイの思想を引き継いだ、もうめちゃくちゃにセキュアな、もう一から作ったエージェントですね。
そもそもパイってコーディング?
michiru_da
そう、何?
うぱ / upamune
いや、パイはそうですね、エージェントハーネスですね。
その一つとしてパイ、コーディングエージェントみたいなやつが提供されている。
ほう。
うぱ / upamune
で、パイって何だろうな、もうマジでシンプルみたいなやつなんですよ。
michiru_da
コーディングエージェントなの?コーディングエージェントではないの?
え?
その、コーディングエージェントなの?
うぱ / upamune
はい、コーディングエージェント。
michiru_da
そうなんだ。エージェントハーネスでもあるの?
うん。
うぱ / upamune
これが何だろう、最近のコーディングエージェントとかってめっちゃファットになってくる。
例えば、めっちゃこんな色んな機能も使えるし、MCP機能もあるし、
あとはToDoを管理する機能だったりとか、プランがどうのこうのとか。
michiru_da
はいはい、プランモードとかね、あるね。
うぱ / upamune
あとはなんか、サブエージェントがあって、なんかバックグラウンドなんか実行できるよ、みたいな。
全部ないです。多分あなたが思いつくもの全て全部ないです。
4つの機能しかない。
michiru_da
へー。もうリリースされてずっとその4つで頑張ってる?
うぱ / upamune
はい。
そう、ファイルを無リード。
Piの革新性:究極の拡張性とカスタマイズ性
うぱ / upamune
ファイルを新たに書くライト。
ファイルを編集するエディット。
最後はその、コマンドを実行するバッシュ。
それだけ。
michiru_da
じゃあ本当に、1系統でファイルの読み書きをするやつ。
うぱ / upamune
ファイルの読み書きとコマンドの実行、that's allっていう感じなんですね。
michiru_da
でもめっちゃいいの?
うぱ / upamune
めっちゃいい。何でいいかっていうと、プラグイン、拡張機能をかけるんですけど、
上辺の拡張機能じゃないんですよ。
見た目を変更できるよとか、何かツールを実行する時に何かを差し込むってフックみたいな感じで言うやつがあるんですけど、
フックをかけるよみたいなのじゃなくて、本当に全てをいじれます。
michiru_da
どういうこと?すべて?パイのすべて?
うぱ / upamune
パイのすべてをいじれます。
michiru_da
4つの機能しかないけど、そんな構成要素はたくさんあるって感じ?
うぱ / upamune
なんで別に自分で4つの機能しかないけど、5つ目の機能を生やすこともできます。
例えば、Read, Write, Edit, Bash, Notify, Mitildaみたいな、
みちるだに連絡するツール、5つ目のツールを作ることもできます。
かなり優先度が高い。
なんで極端な話をすると、よく古代のFPSのDoomってやつがあるんですけど、
うぱ / upamune
パイ上にプラグインを実装して、Doomっていうゲームをパイの画面で動かすみたいな、
そこら辺までできちゃうっていう。
だからもう最高の拡張できる機能が。
michiru_da
真っ白いキャンバスみたいな感じ?
うぱ / upamune
そうそう。なんで、例えば会社独自のプラグインだったりとか、
あるいはすっげー細かい制御をしたいプラグインとかも自由に作れるっていう感じですね。
今のエージェントってコマンドを実行する、バッシュとかあるんですけど、
そのバッシュを自由に操れる能力とか、あとはコードを書く能力めっちゃ高い。
だから自分に足りない、その人の環境に足りない何かを実装するには、
パイ自身に拡張機能を書かせて拡張すりゃいいじゃんっていうのが根本の思想。
真っ白なキャンバス、ほぼ何もないところから、
君だけの最強エージェントを作ろうみたいな。
君だけ君の組織のための最強機能を作ろうみたいな。
みんなパイなんぼのもんやねんみたいな思ってるかもしれないですけど、
皆さんが一度は聞いたことあるかもしれない、OpenClaw。
OpenClawはパイでできてますね。
michiru_da
パイはコーディングエージェントってことは、
生成合いのモデルはまた別にいるってこと?
うぱ / upamune
そうです。それは自由な。
michiru_da
それを使ってコーディングしてくれるやつがパイなのか。
うぱ / upamune
そうです。
どこまでコーディングエージェントっていうやつ言うか、
基本的に普通のAIエージェントとして動くっていう感じですね。
みんな何でも好きな機能を作れるんで、
多分これ聞いてる人がびっくりするので言うと、
例えばMCPのサポートがないですね、デフォルトだと。
michiru_da
MCP使えないコーディングエージェント。
うぱ / upamune
そうです。
だけど自分が欲しかったらMCPの拡張機能を書いてもらえばいいんで、
実際MCPプラグインも出てるんで、
MCP使いたいっていう人はそれをインストールすればいいっていう感じですね。
だから何かのエージェントの石杖というか、
それにするにはめっちゃ便利で、
例えば私も会社のみんなが使うような社内の便利エージェントを開発するのに、
パイをベースにして、
MCPは特につながらずに自分が決めたこの一つだけのMCPにつながるようにするみたいな、
他のMCPは接続できないようにしたり、
あとは例えば前に紹介したHermes Agentみたいな、
あるタスクを実行するときに10回以上何かの通路を使ったら、
そのナッジっていう仕組みがあって、
ナッジの説明とかでしたっけ?
michiru_da
してはない、ナッジって言葉ではしてない気がします。
うぱ / upamune
頭の方に10回以上何かツールを使うことがあったら、
君のスキルにしてね、キラーンみたいなプロンプトを書いたとして、
そのとき聞いたら多分皆さん、
確かにそれ頭いいなみたいな、めっちゃいいじゃんってなると思いますけど、
多分よくAI使われてる方は、
うぱ / upamune
それ10個使ったときには下の方だとそんなこと忘れてるくね?みたいな、
あいつらさっていう、ずっと手楽になってると思いますけど、
ナッジっていうのは別に技術的用語があるわけじゃないんですけど、
10回通路を使ったとします。
本来なら人間が10回使ったな、
スキルにしろよって本当は入れるところを、
もう勝手にプログラムが10回ツール使ったね、
うぱ / upamune
プロンプトピュッって挿入みたいな感じで入れられたりする。
そういう細かい制御もプラグインでできるっていう感じなんで、
うちの会社に合わせた組織的にこういうのがあればいいよな、
みたいなのも全部プラグインでできるっていう。
michiru_da
そこ決定論的な仕組みでコントロールしやすいっていう。
うちの組織に合わせたってどういう方向性なんですか?
安全みたいな感じとか、
あんま高機能にしたくないから使える機能を制限したりとか、
どういうカスタマイズとかあるんですか?
うぱ / upamune
システムプロンプトとかも完全に変えられる。
それはほとんどのコーディングエッジだとそうですけど、
例えば、そうだな。
例えばNotionのリンクを渡したりすると、
ほとんどのコーディングエージェントは、
いい感じのツールが使えないときに普通にフェッチしたりして、
Piの応用例と企業での活用
うぱ / upamune
ログインしてないのに、いや、そんなの読めるわけねえだろみたいな、
そんな意味わかんないことをしようとしますけど、
それをうちではこれが常識だよみたいな、
うちでは別にフェッチとか使わないでNotionやMCP使ってやるんだよみたいなのを
教えられたりするっていう感じですね。
michiru_da
なるほど。
それはなんか、もうわかりきってる余計なトークンを使わないみたいな、
michiru_da
それが嬉しさっていう感じなんでしょうか?
うぱ / upamune
もうその組織のためのエージェントを作れる。
クロードコードとかだったらすごい賢いけど一般化されてる。
誰が使ってもまあまあ動くようにできてる。
それをある会社の人しか嬉しくない機能とかに尖らせられる。
例えばクロードコードにね、みちるだって誰って聞いたら、
なんかいろんなツールを使ってグーグル検索とかして、
うぱ / upamune
みちるだ、みちるだってなるけど、
このバイト会議システムプロンプとね、
みちるだはこういう人だよみたいな感じだとしたらもうみちるだはもう知ってるものとして
勧められる便利な。
michiru_da
いらない機能。そうなんだ。
うぱ / upamune
そうっすね。
michiru_da
うばさんも日常で使ってるんでしたっけ?
うぱ / upamune
Piは基本的に会社でコーディングするときは私はクロードコードとコーデックスを使ってるので使ってないんですけど、
なんだろう、さっきもなんかちらっと話しましたけど、
本当にシンプルなんで、
こういうエージェントどうだろうみたいな試すときにすごい便利ですね。
うぱ / upamune
なんで私が前作ったのは、クロシー、XIっていう、
Piと同じリード、ライト、エディト、バッシュしかないやつなんだけど、
もうめちゃくちゃセキュアみたいなやつですね。
なんかそういうのを試すのに。
うーん。
うぱ / upamune
けど面白いのは、ショピファイって会社があると思うんですけど、
michiru_da
ECのプラットフォームの新生の会社?
うぱ / upamune
あそこのCEOが、あそこのCEO、エンジニアでめちゃくちゃコード書いてて、
そうなんだ。
ツールもめっちゃ作ってて、私もそのツールめっちゃ使ってるんですけど、
現役の。
そう。前になんか、うちのコードのエンジニアの半分以上がPi使ってるぜみたいな。
michiru_da
へー。
オンなんだ。
何のオン?
うぱ / upamune
今ってなんかそのモデルがめっちゃ賢いから、
なんか前にチラッと見たら、クロードコードのシステムプロンプト全部なくした方が、
なくしてオパス4.7にした方が賢いみたいな。
へー。
なんでこうハーネスが邪魔になるみたいな。
michiru_da
へー面白。
でもあって、やっぱその会社の特性に合わせたコーディングエージェントを、
うぱ / upamune
本来はちゃんと作った方がいいんだろうなっていう感じ。
確かにそれこそ、なんか海外のテック企業だと、もう自分たちのためのコーディングエージェントも作ってますみたいな。
うぱ / upamune
そうですね。
michiru_da
結構事例がちょいちょい出てますよね。
うぱ / upamune
なんでそれをちょっと、クロードコードとコーデックスを手放して、
ちょっとPiで僕が考えた最強のうち用のコーディングエージェントを作ろうかなと。
michiru_da
すごい。
うぱ / upamune
思ってます。
michiru_da
それみんなが使ったら生産性が。
うぱ / upamune
どうなんだろうね。
スラッシュみちるだとかね。
みちるださんにSlackをくれるっていう。
michiru_da
いらない。
うぱ / upamune
水買ってきて。
michiru_da
いらないっていうのが。
うぱ / upamune
結構なんだろう、さっきも言ったんですけど、プラグインがみんな作れるんで、
結構プラグインをみんな、
これめっちゃいいよみたいな感じで書いて使ってるっていう感じですね。
そのまま使ってる人はあんまりいないんじゃないですかね。
だからさっき言ったこれできない、これできない、これできないみたいなやつは全部プラグインでカバーできるんで、
例えばサブエージェントみたいなやつもプラグインがありますし、
MCBもプラグインがあるっていう感じですね。
なんかすごい、ショピファーの例で言うと、オートリサーチっていうやつがあって、
michiru_da
機能?
うぱ / upamune
オートリサーチって聞くと、何かを言ったら自動で調べてくれるみたいなのを想像すると、
全然違ってですね、
ループを回しまくって最適化してくれるやつなんですよ。
例えば自分ところの、このオートリサーチっていうのもプラグインなんですけど、
うぱ / upamune
例えばそうだな、システムのこの機能がめっちゃ遅いみたいな、
10秒かかるんだけどみたいな感じであるとしたら、
オートリサーチって使って丸々機能が10秒かかるみたいな感じで書いたら、
このオートリサーチ機能はそれを計測可能にするんですよね。
計測可能なスクリプトを書いて、実行して本当は10秒かかるみたいな。
で、修正すべきところに当たりをつけて修正する、何回か回してみる、
それでマジでこれ10秒かな、安定した8秒になってんじゃんみたいな、
そしたらそれを取り込む、でもう一回回す、でもう8秒だねと、
でもう一回当たりつける、編集する、そしたらあれ1秒になった、
でも1秒8秒、1秒8秒みたいな、ちょっとランダムだみたいな、
そしたら変更はしないみたいな、でそれループをずっと回していくんですよ、
そしたら回していったら最終的に安定して3秒になりましたみたいなのが結果として返っていくみたいなやつで、
こういうのがめちゃイージーに実現できる、なんかある仕組みというか、
なんで私もこれを実際にやったんですけど、
会社の全然システムの部分とは関係ないコードを生成するみたいな機能があるんですけど、
それが遅いなーっていうのは思ってたんですよね。
なんでそれを遅いなーと思ったんですけど、やるのめんどくさかったんですけど、
そういえばPiオートリサーチあるじゃんと思ってやってみて、これ高速化してほしいなって書いただけですよね。
CLIのツールなんですけど、それがやっただけで6.3倍に安定して高速化されました。
michiru_da
じゃあ別にこの数字を達成してくださいとかは明瞭に渡さなくてもやってくれるんですか。
恐ろしいね。人間より優秀かも。
うぱ / upamune
これマジで便利。
だからめっちゃ速くなるけど不安定な処理とか入れちゃった時も、
Piのプラグイン機構とAutoResearchの実力
うぱ / upamune
判断してよしこれは入れないみたいな。
michiru_da
それもプラグインなんですか。
うぱ / upamune
プラグインです。
michiru_da
それってPiだからいいんですか。
プラグインがめっちゃイケてるってこと?
うぱ / upamune
プラグイン機構がめっちゃイケてますね。
UIとかも完全にカスタマイズできるんですよ。
みんながよく見てるクロードコードの画面って下のところだけだけど、
さっきも言ったけど、あそこの上でゲームを走らせられるぐらい自由にできるんで、
うぱ / upamune
やりたい放題っていう感じですね。
同じことをクロードコードでやろうと思ったらできるけど、
michiru_da
さっきのオートリサーチの話ね。
できるけどPiの方がシンプルにできるとかそういう感じなんですか。
良さ的には。
うぱ / upamune
クロードコードでできない気がしますね。
michiru_da
そうなんですね。
うぱ / upamune
どうやるんだろう。例えばスキルを使うとか。
michiru_da
コミットはできない気がする。
うぱ / upamune
これはわかりやすい例で言うと、オートリサーチを回してやってる時もUIも変わっていくんですよね。
コーディングエージェントに表示されている。
今まで何回の試行をしてどれだけ取り込んだかとか、どれだけ速くなったかとかが下に表みたいなUIがレンダリングされて、
ずっとループが回ってるみたいな感じで、すごいやりやすいというか。
なんで、そうですね。
うぱ / upamune
例えばクロードコードってMCP経由でツールは渡せるけど、MCP以外でツールを生やせないはずなんですよね。
それも生やせますね、Piなら。
てかツールを生やせるやついるのかな。
多分オープンコードはいけますけど。
なんで前に書いたクロードコードのエージェント入門の本でもクロードエージェントSDKか、あれはMCPに一旦してツールを渡すみたいなことをしてたっていう感じですね。
なんで誰におすすめなんだろう。
多分おすすめされるような人はもうPiの存在知ってるんですよ。
michiru_da
そうね、そういう世界があるんだと思いました。
うぱ / upamune
そうですね。
いろんな便利ツールを最初から提供してあげるより、モデルが賢くなっていって、
しかもモデルがコード書くのめっちゃ得意だから、そいつ自身拡張機能を書かせればいいやんっていうのはめちゃ頭いいですね。
例えばプランとかトゥードゥ機能とかって、今の賢さだと必要だけど、
もうちょっとモデルが賢くなったら、人間が考えるプランとかより全然賢いやつを一発で出す可能性はあるから、別にそれいらんやんみたいな話になってくるし、
ツールは少なければ少ないほうがいいかな。
結構MCPさえデフォルトではサポートしないっていうのは結構すごい意思のある。
michiru_da
尖った意思決定。
うぱ / upamune
結局はね、意思あるプロダクトがもう意思のないプロダクトはいらない。
なんだゴリラ。
michiru_da
怖い話になった。
うぱ / upamune
でもそっちのほうがユーザーとしても使ってて楽しいんですよね。意思のあるやつのほうが。
michiru_da
言いたいこと伝わる。
うぱ / upamune
ちょっとね、うちの会社のみんなが使ってもらうエージェントをPiベースで書いてて、
いいやんと思って結構動いてたんですけど、今はちょっとPiを捨てて。
ちょっとPiはね、みんなに入力してもらうクロードコード開いた画面、あそこTUIって言うんですけど日本語入力。
日本語入力部分がちょっと弱すぎて。
毎回同じ文章2回入力されるみたいな。
michiru_da
ありそう。
うぱ / upamune
クロードコードとかたまにあるけど、それが常に起こるみたいな。厳しいなっていう。
michiru_da
厳しい。
うぱ / upamune
感じで諦めて今はオープンコードで頑張ってます。
なのでPiはちょっとあれですね、
Vim的なこういう感じのプラグインで構成して、
僕の考えた最強のPiこれだぜみたいなのができる。
最適化されたコーディングエージェントですね、その人、その環境に。
michiru_da
エンジニア心くすぐるやつですね。
間違いない。だって今はね、書きたい放題だから。
自分は最初からいい感じにしといてよって思っちゃうから。
パンピーはそっちでいいんだけど。
うぱ / upamune
やっぱこの時代難しいですよね。
みんなの環境に満遍なくいいエージェントって、
その中間の性能は出せるけど、
もう最適化された性能は出せないじゃないですか。
けどそれを突き詰めるとめんどくさくなるから。
michiru_da
フェラーリ乗れるやつちょっとしかいないみたいな。
260キロ出して怖くないやつちょっとしかいないみたいな。
プリウスとかでいいなみたいな。
うぱ / upamune
オールラウンドに。
michiru_da
全部ぼちぼちいい感じにできるみたいな。
パンピーはそれでいいみたいな。
うぱ / upamune
でも誰かがフェラーリを作って置いといてくれるようになったら、
フェラーリフェラーリでいいなって感じでしょ。
michiru_da
まあ、そうね。上げて乗っていいよって。
うぱ / upamune
車庫にガレージにフェラーリを入れて、
フェラーリかプリウスのあるんだったらフェラーリ。
けど1からフェラーリを作るというか、買いに行くのはちょっとめんどくさいっていう。
出来上がるのがフェラーリかわからない問題ですよね。
michiru_da
そうね、確かに。
うぱ / upamune
三輪車の感じでもある。
michiru_da
言われた通りにやってて、全部アローしてたらとんでもないものができちゃう。
うぱ / upamune
確かに。
それは誰にでもある。
Piの哲学とターゲットユーザー、そして課題
うぱ / upamune
しかもこの時代怖いのは、1ヶ月後にフェラーリが馬車になってる可能性もあるっていう恐ろしい時代だよ。
michiru_da
恐ろしいだよ。みんな気を確かに生きた方がいい。
うぱ / upamune
その点、全部がプラグインになってて、もうコアは4つしかないから、
michiru_da
プラグインこれはもうこの時代いらないなみたいなやつはすぐ捨てれるっていうのもメリットですね。
うぱ / upamune
プラン機能とかドゥードゥ機能作れるけど、プラグインでこれもういらないっていうのがピッて捨てれる。
michiru_da
それは便利かも。
うぱ / upamune
なので、ちょっとPiユーザーの方はこのプラグインオススメとかあったら知りたいな。
michiru_da
送ってください。
感想・質問・フィードバックは、Xのハッシュタグ、MagicalFame、全部小文字。
または概要欄のお便りフォームまで教えてください。
Spotifyのベルマークを押すと更新通知が届きますので、そちらもお願いします。
ありがとうございます。
うぱ / upamune
ありがとうございました。
24:02

コメント

スクロール