クロードスキルズの概要
皆さんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けに、AIを分かりやすく解説する番組です。
今回のテーマは、クロードスキルズって何ですかについて話していきます。 昨日ぐらいからちょっと喉の調子が悪くて、あの声がガラガラになってるんですけど、申し訳ないです。
今日は、アンソロピークから新しく発表された、クロードスキルズについて話していきます。 皆さん、こちら使ってみましたでしょうか。
ちょうど先週発表されて、あの早速使ってみたという人もいれば、いやまだちょっと使えてないという人もいるのではないでしょうか。
あの私自身、これ発表されてから公式サイトの説明を見た時に、ちょっとよくわからないなという感想を抱きました。
同じように、クロードスキル発表されたのは知っているけど、ちょっとよくわからないと。 クロードスキルズで何ができるようになるのと。
そこで今回は、このクロードスキルズについて詳しく掘り下げようと思います。 今回のエピソードを聞くことで、あのリスナーの皆さんが、クロードスキルズって
あ、こういうものなんだと、と持ち帰れるようにしたいと思います。 今日話すポイントは主に3つです。
1つ目に、そもそもクロードスキルズって何ですかという話から始めます。 2つ目に、クロードスキルズの使い方とどうやって使うのか。
そして3点目に、クロードスキルズを使うことでできるようになること。 これら3点を中心に話していきます。
はい、では早速話していきましょう。 そもそもクロードスキルズって何ですかという話からです。
ちょうど先週ぐらいに発表されたクロードの新機能となります。 クロードスキルズ。呼び方もちょっと定まってないようなんですよね。
公式サイトでもクロードスキルズと説明しているページもあれば、 あとはエージェントスキルズと説明しているページもあります。
ちょっとここでは言いやすいように、これ以降はスキルと呼びたいと思います。 でこのスキル先にお伝えすると、有料プランからの利用となります。
現時点では。 でこのスキルどういったものかというと、簡単に言うと事前に特定のタスクを実行できる
プロンプトを設定できる機能となります。 イメージ的にはチャットGPTのGPTsとか、あとはGeminiのGEMが近いと思います。
詳しく言うと違うんですけど、イメージ的にはGPTsやGEMが近いかなと思います。 例えば私がクロードを使って毎日メールの下書きを作成しているとします。
日常的にAAを使ってメールの下書きを作成していると。 この時にプロンプトを入力して作成しますよね。
ただ毎日、1日に何回もそうしたメールの下書きを作成するプロンプト、入力する手間って面倒ですよね。
で私はどこかそのメモ帳とかNotionとか、そうしたアプリに保存しているプロンプトをコピーして、それをチャット画面に貼り付けて作業をしていくと。
こうしたよくある作業、日常的に行う作業を事前にスキルに登録しておくことで、クロードのチャット上から簡単に呼び出すことができます。
例えばメールの下書きを作成するスキルを登録しておくと、私がクロードから、チャット画面からそのスキルを呼び出せば、メールの下書きをクロードが勝手に書いてくれると。
メールの下書きこんな風に書いてくださいと、そうした指示をする必要はなく簡単にチャット上でスキルを呼び出すことができます。
このスキルの使い方非常に簡単で、設定画面からスキルをオンにして使うことができます。
クロード側でいくつか公式のスキルが用意されていまして、例えばPDFなどのファイルを作成するスキル、
あとはWebアプリケーション、これを作成するサポートをしてくれるスキルなどです。
自分が使いたいスキルをオンにして、あとはチャット上で明示的に呼び出すだけでOKです。
例えばスキルを使用して、生成AIとはというタイトルでPDFのレポートを作成してください。こんな使い方ができます。
こうしたスキルというのが公式が全部で9つ、現時点では用意しています。
公式が用意したスキルを使ってもいいんですけど、より活用の幅を広げるために自分でスキルを自作することもできます。
こう聞くとちょっとハードル高いように感じますよね。スキルを自作するなんて難しそうと。
ただこれ私実際に自分でスキルを作ってみたんですけど、自分でスキルを作るの非常に簡単です。
多分簡単すぎで驚くと思います。それなぜかっていうと、クロードの公式が用意しているスキルでスキルを作るスキルがあるからです。
ちょっとややこしいんですけど、つまりスキルを作成するための環境をクロードがすでに用意してくれています。
例えば私こんなスキル作ってみました。画像の横幅を600ピクセルにリサイズするスキルを作ってくださいと。
この指示だけでクロードがスキルを作ってくれました。ものすごく簡単ですよね。画像の横幅を600ピクセルにリサイズするスキルを作ってください。
この一文だけでクロードがスキルを作ってくれます。ちょっと複雑なスキルになったり、あとはこちらの人間側の指示が足りない場合はクロードが質問を返してくれます。
横幅を600ピクセルにすると言ってますけど縦幅はどうしますかと。縦と横の比率は維持しますか。こんな感じでAIが不足している情報というのを人間に質問してくれます。
AIの質問に回答していくだけでもスキルが出来上がっていくんですね。 なのでおそらくスキルを作成するのに困ることはあまりないかなと思います。
こんな感じでAIとのやりとりでスキルを作成していくと最終的にZIPファイルが作成されます。 複数のファイルが圧縮された状態のファイルです。
でこれをダウンロードして、あとはそのダウンロードしたもの、これをクロードのスキルの画面のところでアップロードするだけでOKです。
この作業だけで自作のスキルを使うことができます。 スキルを自作する流れ、もう一回確認します。
クロードに作りたいスキルを伝えて作ってもらう。 でクロードが作ったZIPファイルをダウンロードしてまたクロードの画面にアップロードする。
以上です。これだけで自分でスキルを作って使うことができます。 このZIPファイルっていうのは自分だけじゃなくて他の人に渡すこともできます。
生成AIの限界とプログラムの役割
例えば社内のチームでクロードをみんなが使っていると。 そうしたメンバー向けにこのZIPファイルを送信すれば、そのメンバーの環境でも同じようなスキルが使えるようになります。
私先ほどクロードのスキルはChatGPTで言うGPTsや GeminiのGEMと似ていると話しました。
これは身近な例でイメージしやすいために話したんですけど、 クロードのスキルを掘り下げれば掘り下げるほど一見似ているようで似てないなと思うようになりました。
というのがこのスキルのZIPファイルの中身を見てみると、プロンプトとプログラムで構成されているんですね。
例えば文章構成に特化したスキル、あとはメールの下書きに特化したスキル、 こういったシンプルなスキルでは中身はプロンプトのみとなります。
でも画像をリサイズしてくださいとか、 こうしたファイルの操作が伴うようなスキルではその中身はプロンプトとプログラムが混在しています。
これ何が言いたいのかっていうと、AIでできること、 プロンプトだけでできることって限界がありますよね。
例えば以前ポッドキャストでいただいたお便りに、 住所の重複を生成AIにチェックさせると失敗するというお便りをいただきました。
ExcelやCSVファイルなどのテーブルに保存されているユーザーの住所、 この住所に重複がないか生成AIにチェックさせようとしてもハルシネーションが起きたり
うまく処理ができなかったと。 実際私もそれを聞いて手元でテストをしてみたんですけど、
やっぱり住所の数が1000件ぐらい超えるとうまく機能しなかったんですよね。 でそこで私はこういった提案をしました。
生成AIにCSVファイルやExcelのようなファイル、そうした処理をさせるのではなくて AIにプログラムを書いてもらって、そのプログラムでテーブルを処理した方が確実にタスクを
遂行できますよという話をしました。 こんな感じで、生成AIのプロンプト単体だけでは処理できないタスクって
結構あります。 で、クロードのスキルに話を戻すと、クロードのスキルでは
生成AIのプロンプト単体では解決できないタスクでも、プログラムを組み合わせることで処理が可能になります。
例えばこんなスキルも作れます。ユーザーがアップロードした音声ファイルの無音部分をカットする。 こうした処理って通常の生成AIではできないですよね。
なぜなら音声ファイルを処理するような機能は備わってないからです。 でもクロードのスキルでは音声ファイルを処理するプログラム
こうしたものもそのスキルの中に書くことができるので、こうした音声ファイルの無音部分をカットしてください。
このようなタスクも処理することができます。 あとは例えば人物写真の画像をアップロードして、その写っている人の顔の部分だけ
そこだけにモザイクをかけてくださいとか、そういったタスクも実行できます。 これはプログラムでその画像の処理をしているからです。
そう考えると結構いろいろなことができると思うんですよね。 それこそユーザーがアップロードした住所録の csv ファイルから重複を検知するスキルとか
プログラムで処理できる内容をスキルに搭載することができるので、いろいろ活用の幅も広がると思います。
ちょっと専門的な話になるんですけど、どういったプログラムが使えるのかっていうと、私が確認したところでは
Python、あとシェルスクリプト、あとはJavaScript、ノードJSですね。これを動かすことができます。
エンジニアでない人は何の話かなと思うかもしれないんですけど、簡単に言うとPythonを使って様々なことができるようになります。
いやいや私Pythonなんて知りませんよと、Pythonなんて書けませんよ、こういったケースでも大丈夫です。
なぜならクロードに質問をすればクロードがPythonを書いてくれるからです。 Pythonを使って○○を実装したいです。
これできますかと。 こうした会話のスタートからクロードと相談をしながらスキルを一緒に実装することができます。
以前ポッドキャストでいただいたお便りで、医師の方がシフト組AIにさせていたと。
で、ハルシネーションの関係とかでこちらが望むようなシフト組ができなかったというお便りをいただきました。
その方どういった解決方法を採用したのかっていうと、クロードにこんな感じで質問をしたそうです。
プログラムを使ってこれこれこうした課題を解決したいですと。 具体的にはアルゴリズムを使ってシフトを組むようなアプローチを採用したいですと。
そんな感じでクロードとやり取りをして最終的にはクロードがPythonのプログラムを書いて、こちらの要望に沿ったシフト組をしてくれる
プログラムを書いてくれたと。でこうしたこともスキルでできるようになります。 なぜならスキルではプログラムを動かすことができるからです。
アンソロピックの公式も言ってるんですけど、生成AIが苦手とするタスク、 そうしたタスクを一部プログラムに賄ってもらうことでより精度高く
タスクをAIがこなすようになりますと。でそういった面でもスキルはあの活躍してくれますと。 例えばAIにシフト組をお願いするのではなくて
プログラムからアルゴリズムを使ってシフト組を行うとか AIに住所録から重複を検知してもらうのではなくて
プログラムから住所の重複を検知してもらうとか。 タスクによってはAIに任せるよりもプログラムで解決したほうが良いタスクっていうのは
ままあります。でこうしたアプローチをクロードのスキルでは採用できると。 ちなみにこのスキル同士っていうのは連結させることもできます。
例えば画像をリサイズするスキル、画像の拡張子をより軽いものに変換するスキル、画像のファイル名を特定のルールに
クロードスキルの概要
沿ってリネームするスキル、こうした複数のスキルを連携させて AIワークフローのような使い方もできます。
使ってみた感覚としては、クロードコードでサブエージェントを起動させている時のような感覚があります。
クロードコードってサブエージェントといって、特定のタスクに特化したサブエージェントを作成することができます。
その設定したサブエージェントをクロードコードがタスクに応じて判断しながら作業を進めていくという流れです。
AIエージェント的な使い方と言えばいいんでしょうか。 そのクロードコードで作業をしている風景と似たような感じがあります。
クロードのスキルを使うと、クロードのチャット上でAIがスキルを呼び出しながらどんどん作業を進めていく感じ。
結構クロードコードに似ているなと感じました。 ちなみにこのクロードのスキル、クロードのチャット画面上で使えるとお伝えしましたけど、
それ以外でいうと、クロードのAPIとクロードコードからでも使うことができます。
クロードって言うと、MCPが有名ですよね。モデルコンテキストプロトコル。 ちょっと専門的な話になるんですけど、
MCPよりもスキルの方がトークンの消費量が少なくて済むらしいんですね。 MCPはがっつり内容を読み込むんですけど、スキルの場合は名前とそのスキルの説明、
これだけをまずはざっと読み込むと。で、実際に使うようになってスキル全体を読み込むと。 こうした仕組みなので、MCPよりもスキルの方がトークンの消費量が少なくて済むと。
ということはですよ、同じような、似たような機能を実装するのであれば、 MCPよりもスキルの方で実装した方がいいですよね。
なぜなら、スキルの方がトークンの消費量が少なくて済むからです。 クロードの有料プランに加入したと言っても、使えるトークンっていうのは無限ではありません。
もちろん制限があります。 こうしたメリットもスキルの特徴の一つかなと思いました。
で、このスキルの展開について、クロードではこのように述べています。 今後数週間にわたり、スキルの作成、編集、発見、共有、そして利用というライフサイクル全体をサポートする機能を追加していきますと。
で、私はこれを聞いて、発見と共有というキーワードが気になりました。 もしかすると、チャットGPTで言うGPTストアみたいなものが出るのかなと思ったりもしました。
そうなってくると面白いですよね。 世界中のクロードユーザーが開発したあらゆるスキルを自分の環境で使うことができるようになると。
ただGPTの時もそうでしたけど、悪意のあるユーザーのスキルをどう扱うのかという問題も出てきます。 ここらへんは難しいですよね。
ちなみに、悪意のあるユーザー、よく知らないユーザーのスキル使わないようにしてくださいねと クロードの公式でも述べられています。
なので今、クロードのスキル結構インターネット上で転がったりしているんですけど、 よく知らないユーザーのスキル使う場合はご注意ください。
あと公式サイトではこんな説明もされています。 さらに将来的にはエージェントが独自にスキルを作成編集評価して、独自の行動パターンを再利用可能な機能として体系化できるようにしたいと考えています。
つまりAI自体が独自にスキルを作成して、それを編集したり フィードバックを得て、より良いスキルにAI自身が改善していく
そういったものも実装していきたいと。 これ実装されたら面白いですよね。
例えばヤノさんはよくメールの下書きを依頼するので、これをスキルとして作成しておきましたと。 ついでにプロンプトも改善しておきましたと。
こんな感じでAIがスキルを勝手に作成して編集して改善してくれたらありがたいですよね。 スキル自体がまだ出たばかりなので、今後の展開は正直ちょっと読めない部分はあります。
ただ実際に触ってみて面白い機能だなと感じました。 はい、それでは今日のポイントをまとめます。
プロンプト生成とその重要性
一つ目にクロードが公開したスキルという新機能。 これは特定のタスクを実行するプロンプトを設定できる機能となります。
二つ目に公式が9つのスキルを用意していますが、自分でスキルを自作することもできます。 最後3点目、クロードの設定画面で機能を選択してスキルをオンにするだけで使うことができます。
現時点ではクロードの有料ユーザーから利用できます。 クロードのスキルを説明した記事、いつものようにノートに書きましたので興味のある方はこちらも参考にしてみてください。
概要欄にリンクを貼っておきます。 はい、今日はこの辺ということで本日もお付き合いいただきありがとうございました。
なんかこう収録が進んでいくにつれて喉のガラガラ具合もちょっと進行したような感じがします。 すいませんでした。多分風邪じゃないとは思うんですけど、あのなんか風邪流行ってるみたいなんで皆さんもご注意ください。
で今週はえっとお手入れをいただいています。 ありがとうございます。ちょっと紹介しますね。
いつも有益な情報ありがとうございます。ヤノさんのAIモデルの比較をいつも参考にAIを使用しています。
特にコーディングではGitHubコパイロットを使っているので用途に合わせてモデルを選択する指標になっています。
今回このモデル比較について質問があります。 新しいモデルが登場するたびにコードの生成やスライドの作成など様々なパターンを試されていますが、
プロンプトの生成は検証されていませんでしょうか。 最近はプロンプトを自分で考えずにプロンプトすらもAIに考えてもらうことが多くなってきていると思います。
以前プロンプトの最適化についてのエピソードを聞かせていただきましたが、 チャットGPTのみの内容だったので、もし他のモデルでも検証されていればそちらも知りたいです。
よろしくお願いします。 お便りありがとうございました。
そうですね、AIのモデルが出るたびにこのポッドキャストでは比較結果をお伝えしているんですけど、 プロンプトの生成はしたことがなかったですね。
ここでいうプロンプトの生成っていうのは、AIモデルにプロンプトを作成してもらうアプローチです。 メタプロンプティングとか言ったりします。
AIに○○のタスクを行うプロンプトを考えてとか、このプロンプトを修正してくださいとかですね。 お便りにあった
最近はプロンプトを自分で考えずにプロンプトすらもAIに考えてもらうことが多くなってきていると思いますという内容。
これあのまさしくそうで、ちょっと複雑なプロンプトを書くとき、AIに書いてもらったりしています。 ただどのAIモデルが最良のプロンプトを書いてくれるのかっていうのはちょっと今まで
AIモデルの比較で実験したことはなかったので、私の方で漏れていた視点になります。 次回新しいAIモデルが出たら早速プロンプト生成の比較対象に入れたいと思います。
おそらく次にどこの新しいモデルリリースされるかで言うと、 順番的に言うとジェミニでしょうか
ジェミニ3出そうみたいな話ありますよね 出そう出そう言ってちょっとまだ出てないんですけど次新しいモデルが出たらこの
プロンプト生成の項目も比較対象に入れて実験したいと思います。 一応先週クロードのハイク4.5がリリースされましたけど
大型のモデルのリリースは現時点ではまだです。 ちなみにこのプロンプトを評価するツールって色々あるんですけど
プロンプト風なんかおすすめです。 これエンジニアよりのツールなんですけどそこまで操作難しくないので気になる方は是非
プロンプト風、概要欄にリンクを貼っておきます。 番組ではこのように耳で学べるAIを毎週発信しています。
通勤中や家事の合間にAI情報をキャッチアップできます。 毎週水曜朝に更新していますので是非フォローをお願いします。
そしておすすめの生成AIツールをまとめた資料も配布しています。 興味のある方はこちらも是非概要欄にリンクを貼っておきます。
お相手は耳で学ぶAIの矢野てっぺいでした。 また次の配信でお会いしましょう。