-
-
michiru_da
今日のテーマは、エージェントスキルズって何?
うぱ / upamune
何?
いやー、100年ぶりのテック会か?
michiru_da
そうやね。そうでもない。
うぱ / upamune
あ、そうだっけ?
michiru_da
最近あれやりましたよ。ワンパスワードとかのメールアドレス買ってそう話やったから。
うぱ / upamune
あー、確かに確かに。忘れてた。
michiru_da
うん。でもAI系のはめっちゃ久しぶりかもですね。
なんか、エージェントスキルズとかスキルが、なんか12月入ってからとかめっちゃTwitterのタイムラインを逃げ合わせている気がしますね。
うぱ / upamune
うんうん。
michiru_da
で、ちょっと何なのかっていうのをうばさんに教えてもらう回です。
うぱ / upamune
はい。なんか、実際この、どっから話そうかね。
エージェントスキルっていうのは何なのかっていう話なんですけど、そんな大したもんじゃないですと。
michiru_da
あんなみんな大詐欺してる?
うぱ / upamune
大したものではないというか、仕組み的には大したものではないですと。仕組みが大層なものと、得られる効果が大層なものが別の話なんで、仕組みはめっちゃ単純な話ですと。
何ができる、どういう話なのかっていうと、ほんとその名の通り、エージェントに対してスキル、何かしらの能力を授けるみたいな話なんですけど、
それをやり方を教えてあげると、エージェントに対して。
うちの会社にはホゲっていう仕事のプロセスがありまして、これはいつこれを使うのかとか、これは何なのかとか、
この仕事を進めるにはどうすればいいのかみたいなのを、ただのマークダウンファイルにやり方を書きますと。
それが基本的にスキルなんで、例えば一般的なことはAIわかってるけど、ある会社のホゲっていう仕事については、
いやホゲって何ですかってなるから、それの手順書というか、やり方とかコンテキストを書いてくれてるのが基本的にはスキルです。
michiru_da
今言ってるスキルを使えるようになるAIエージェントっていうのは、それは何ですか?
クロードコードとかなのか、普通のChatGPTにもそういう機能があるよみたいなことなのか、
どの範囲に対して使えるもの?
うぱ / upamune
基本的には手元で動くようなコーディングエージェントとかいうやつですかね。
でもあれですよね、ChatGPTにもスキル図が入ってるみたいな。
michiru_da
そうなんだ。
うぱ / upamune
なんかChatGPTのスキル図どれ入ってるって言ったら、ZIPで返してくれるみたいな。
michiru_da
なんか教えてくれるみたいなのありましたね。
うぱ / upamune
だからユーザーは今入れられないのかもしれないですけど、裏側では使ってるかもしれないですね。
michiru_da
コーディングエージェントに対して特定の業務の手順を教えるみたいなことって、
これまでも似た概念がある理解でして、
スラッシュコマンドとかってそういうものとして私は理解していたんですが、また全然違うものなんでしょうか。
うぱ / upamune
スラッシュコマンドは自分で人間が発動タイミングを決めるんですよね。
スラッシュなんとかみたいな。
サークルだったら、ホゲっていう業務フローをやりたいなという時にスラッシュホゲって打つ。
michiru_da
打って発動させる動作が必要だが、スキルは勝手に発動させてくれるってこと?
うぱ / upamune
そうです。
スキル図にはスキルの名前とスキルのディスクリプション、説明が必要なんですけど、
まずコーディングエージェントは起動立ち上がった時に、
自分のあるスキルの説明を全部自分コンテキストとして理解しますと。
なんで人間がなんとかやっといてくださいみたいな感じでやったら、
ホゲっていうのはこのスキルを使ってやればいけるんだみたいな感じで理解してやってくれるって感じですね。
michiru_da
みんながめっちゃすごいってなってるのって、
その吉野にこの時にはこのスキルを使うといいなっていうのを、
うぱ / upamune
エージェント側が判断してくれるのがめっちゃいいみたいなことなんですか?
めっちゃいいのはまず、
一つはポータビリティが高いんですよ。
スキルっていうのはさっき話したようにめっちゃ簡単な仕組みなんですね。
このあるスキルの名前と説明を決めます。
基本的にはもうそれで必要な設定は終わってます。
その下に普通に別にJSONとかYAMLの設定ファイルじゃなくて、
michiru_da
自然言語でそのスキルに対しての詳しい手順を書くんですね。
うぱ / upamune
もしそのリファレンスとか何かのスクリプトを走らせるのが必要だったら、
あるスキルと同じディレクトリに困ったらこのヘルプを参照してくださいっていうのが別のマークダウンとか、
これを実行してくださいみたいなスクリプトを置きますと。
基本的にもうそれだけなんで、
何がいいかというと、
究極的にはただのマークダウンファイルなんで、他のやつでも動きますと。
クロードコードだけじゃなくて、他のパイロットとかコーディックスとかもいけるのかな。
それが標準化されて、最初クロードコードが読むんだったんですけど、
それがAgent Skillsっていう普遍的な仕組みになったんで、
なんで一個Skillsっていうやつをどっかに作っておけば、
それを持って配置しておけば、どれを使っても読めるし、
何なら対応してないコーディングAgentとかでも、
設定ファイルに対してあなたができるのはこのディレクトリのスキル配下にあるから、
基本的にはスキルMDを読んでくださいみたいな感じでやればできなくはないっていう感じなんで、
すごいポータビリティが高い。
michiru_da
使ってるコーディングAgent問わず、同じ会社の中で実装するときに、
これはちゃんと守ってくれみたいなやつとかをスキルで作っておいたら、
誰でもその恩恵を受けやすいよみたいな感じなんですね。
そうですね。
うぱ / upamune
みんなそれぞれこれまでも書いてきたと思うんですけど、
それが標準化されて、
クラウドコードでは先駆けて、
それをここにこういうフォーマットで書いてくれたら、
起動時に勝手に読み込みようっていうのが実装された。
これが10月とかですね。
michiru_da
結構前なんですね。
タイムラインにめっちゃ流れてくるようになったのはめっちゃ最近の、
うぱ / upamune
確かにSkillsって聞いたことあったけど、最近盛り上がってる印象でした。
なんで?そうですね。
最近盛り上がってたのは多分、
michiru_da
すごい。
うぱ / upamune
なのでそれオススメです。
michiru_da
それって、
1スキルに全部全MCPまとめてるみたいな感じなんですか?
MCPサーバーごとにスキルを作っているみたいな。
うぱ / upamune
そうですね。
今回はある業務単位というよりは、
あるMCPサーバー、
自作のやつをスキルにとにかく1ツール1対応で
変換したいという感じだったんで、
これも自動生成ですね。
なるほど。
MCPのサーバーは今までツールを提供するんだけど、
そのツールの名前とディスクリプションから
michiru_da
skills.mdを自動生成して、
うぱ / upamune
その中にそのMCPのこれを叩くっていうやつを
自動で書き出すみたいな。
それが、そういうスキル作ったら
私も使いたいんだけど、みたいな人がもちろん現れるじゃないですか。
そうですね。
それを解決するのが、
クロードコードのマーケットプレイスっていう概念で、
これはApp Storeみたいな、
Google Play Storeみたいなのが、
いろんなみんな自分の
みちるだ商店みたいなのがあったら、
私はそこのみちるだ商店に
マーケットプレイスを自分のとこに追加しますと。
追加したうち、
じゃあみちるだマーケットプレイスのスキルはもらおうみたいな感じで
ポチポチってインストールできるので、
michiru_da
私も誰でも使えるようにしてます。
今回のやつは、外部で誰でも使える、
有名MCPへの接続を好きにしたやつだから、
誰でも使えてもいいっていう。
うぱ / upamune
あれなんですよ。
うちの会社の専用MCPのディスクトップなんですけど、
そのマーケットプレイスを会社のプライベートGitHubリポジトリにできるんですよ。
だから、うちの会社の人しかアクセスできないマーケットプレイスができるっていう感じです。
michiru_da
そうなんですね。
GitHubにスキルを上げるより、マーケットプレイスの方が便利なんですか?
うぱ / upamune
GitHubがマーケットプレイスになります。
GitHubをマーケットプレイスとして認識してくれる。
michiru_da
GitHubのままだといけてないんですか?
うぱ / upamune
マーケットプレイスの裏側はもうGitHubなんで、
同じです。
普通にGitHub以外にもマーケットプレイスできるよって話で、
今回はマーケットプレイスとしてGitHubっていう感じですね。
なので、例えば自分の個人でプライベートリポジトリ作ってGitHubで、
そこにどんなカーソルとかクロードコードとか、
いつものように使っているやつをそこに貯めていけば、
クロードコードだったらマーケットプレイス経由でポチポチってインストールできるし、
カーソルだったらGitのサブモジュールで持ってきてスキル配置すれば、
みんな同じスキルが使えてポータビリティ高くてハッピーみたいな感じ。
なので普通は多分MCPみたいなツールに一対一対応するより、
自分がよくやっているプロセス単位でスキルを使って作って、
これはまずGoogleカレンダーの今日の予定をまず取ってきて、
次にSlackに昨日の発言を持ってきて、
自分の今日のタスクリストを持ってきて優先順位付けてくださいみたいな、
一つのスキルにするみたいな感じですね。
michiru_da
スキルは結構大きくていいっていう感じなんですね。
業務フロー単位でいいものにあると思うんですけど、
業務フロー単位で作るのか、なんかもうちょっと細かい、
その業務ステップ単位で作った方がいいとかあるんでしょうか。
うぱ / upamune
そのスキルがどれくらい再利用できるかじゃないですかね。
他のスキルでも同じようなことが使い回せるんだったら、
それを一つ切り出して、例えばSlack検索できるスキルとか、
毎回Slack検索方法をスキルに書くのがだるいんで、
そこは一般的なものを切り出してみたいな。
michiru_da
このスキルを使ってやってくれスキルを。
うぱ / upamune
そうですね。
公式も結構いろんなスキルが、
フロントエンドデザイナーみたいなスキルとか、
もちろんコードレビュースキルとかいろいろあるんで、
それらを見てポーンってなったり、
エージェントスキルを作れるスキルとかも公式からクリエイターがあるんで、
それを使えばいい感じになる。
みちるだスキルズを使って自分がやってることを、
とにかくマークダウンに書き出していけば、
最強人材、誕生、自分が2人分になる。
年末年始でやるか。
これ言われて何のスキル作るかなって難しくないですか。
michiru_da
そうね。
めっちゃ毎日やるんだ。
うぱ / upamune
でもねそれもなんかその自らの意思による実行だから、
フラッシュコマンドでええやんっていうのは、そりゃそうなんですよ。
michiru_da
だからね、結構難しいんですよね。
そうですね。
自分もなんかそのさっきの何をやろう、好きにしようみたいな話で、
なんかこれ定型行みたいなのあるんだと思ったんですけど、
別に自然とこれもやった方がいいよみたいなのっていうよりか、
結構意思を持って今からこれをやってくれみたいな感じで、
今わりとフラッシュコマンドを何とか作ってるんですけど、
それが多いからちょっとどっちがいいのかしらという感じではありますね。
うぱ / upamune
わりとなんか一般的な話をスキルにするのは結構なんか、
簡単にできそうだなっていう感じはするんですけど、
例えばなんかさっき言ったようなSlack検索してみたいなやつを、
なんかMCP経由にするとか、
あとこのOCRしてっていうのをそのMacのOCRを使わせて、
何かOCRをするとか、
そういうのは何だろうな、
何かをこれしてって言うというよりは、
彼が処理してる間で勝手にそれこれOCRしたいなとか、
これSlack検索したいなみたいな時に、
プリミティブなものは使ってもらえるみたいな感じだけど、
何かのねワークフローを実行したいときは、
スラッシュコマンドでいいかっていう気持ちにはなるのは分かる。
michiru_da
そうですね、なんかその業務全体が分かっている、
なんか大元のスキルみたいなのが必要になっちゃうっていうか、
何の時にそのスキルを発動させていいか分かんないみたいなのがありそうですよね。
ちょっと一個作ってみて、
汎用的なものは作ってみてという感じですね。
うぱ / upamune
なんでスキルはそんななんか行儀惜しいものじゃなくて、
単純な仕組みで実現されているやつですっていう話ですね。
こういうのなんかあれなんだけど、
一番の問題は作るのはそのイージーなんだけど、
その時こういう動きじゃねえんだよなっていう時に、
ちゃんと修正し続けられるかっていう、
そのハードルをどうにかしてやらないといけないんだよな。
michiru_da
相当毎回使うやつじゃないとそんな頑張れないですね。
そうですよね。
そうやって人がやった方が早いわみたいな。
うぱ / upamune
分かるー。
michiru_da
なのでちょっとこのスキルはよく業務で活躍していますみたいなのがある人はぜひ教えてください。
どっかうぱさんがスライドを作ったやつもあったが、
うぱ / upamune
今見た。
michiru_da
何か言い残したことが。
うぱ / upamune
確かにこのよくエンジニアであるのは、
このプロジェクトではこのライブラリのこのバージョン使ってとかいうのがよくAIって。
ありそう。
そうそう。
彼らのナレッジカットオフの最新のバージョンとかを使うとするんで、
2年前のバージョンとかなんですけど、
それを今まではルールで説明してたんですよね。
CloudMDみたいな。
でもその時って別に毎回プロジェクトを初期化してるわけじゃないんで、
その別に使わないのに無駄なコンテキストが消費されたのが、
それがなくなるっていう感じですね。
michiru_da
こう書いてますね。
なんかこのお店の解説ブログみたいなのチラッと見た気がしますね。
うぱ / upamune
毎回なんかまあそうかみたいなタイプCの話もそうだったけど、
MCPUはタイプCですって。
michiru_da
わかりやすい。
しかもなんかレンチみたいな。
身近じゃないなって。
うぱ / upamune
はい。
俺たちも作ろう。
最強のスキルを。
michiru_da
はい。
じゃあそんなところでしょうか。
うぱ / upamune
はい。
michiru_da
はい。
感想・質問・フィードバックは、
Xのハッシュタグ、間近で読む全部小文字、または概要欄のお便りフォームまでお寄せください。
Spotifyのベルマークを押すと更新通知が届きますので、そちらもお願いします。
ありがとうございます。
うぱ / upamune
ありがとうございました。