MCPの概要と重要性
皆さんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIをわかりやすく解説する番組です。
今回のテーマは、最近よく耳にするMCPって何ですかについて話していきます。
はい、ということで今日は、MCPについて話していきます。
皆さん、MCPは聞いたことありますでしょうか?
MCP、聞いたことあるよと、何なら使ったことあるよという人もいればですね、いや、MCP初めて聞いたという方もいると思います。
今日、MCPを話す理由としては、3月くらいから急速にですね、AI界隈で注目を集めているからです。
背景としては、ChatGPTのOpenAIですね。
OpenAIが、MCPをサポートすると発言したのが、一つの大きなきっかけになったと思います。
そのため、今回このポッドキャストで、MCPを話そうと思いました。
ちょっとですね、少し難しい話になると思います、MCPは。
ただ、リスネーの皆さんには、そもそもMCPって何なのと、あとはMCP、なんで最近騒がれているのという、この2点をですね、持ち帰ってもらえればと思います。
あと先日、あの、OpenAIから新しいモデルが発表されましたね。
GPT4.1、前半でGPT4.1のトピックに軽く触れます。
で、その後に、MCPについて深く掘り下げたいと思います。
今日話すポイントは主に3つです。
1つ目に、OpenAIの新モデル、GPT4.1について。
そして2つ目に、MCPの概要。
そして3点目に、なぜMCPなのか、なぜMCPが注目を集めているのか、という点について話します。
はい、では早速話していきましょう。
まずは、新しく公開されたOpenAIのモデルですね、GPT4.1について軽く紹介したいと思います。
ちょうど4月15日、火曜日の早朝に公開されたモデルとなります。
今までGPT4.5がOpenAIの最新モデルでした。
で、その次に公開されたモデルがGPT4.1ということになります。
先にお伝えすると、このGPT4.1はまだChatGPTのチャット画面では利用できません。
APIからの利用となります。
おそらくですね、近いうちにチャット画面の方でも使えるようになるとは思います。
ただし、現時点ではAPIからの利用となります。
GPT4.1で何が変わったのかっていうと、いくつか挙げるとですね、3つあります。
1つ目が性能の向上、2つ目がコンテキストウィンドウの拡充、そして3つ目がコストの削減になります。
ちょっと1つずつ詳しく説明していきます。
まず性能の向上で言うと、性能としてはですね、GPT4.5に匹敵するぐらいの性能があるというように言われています。
で結構特徴として、今回新しいなと思ったのが、否定形の指示もしっかり理解できるというものになります。
AIって否定形の指示ってあまり得意ではないんですよね。
何々しないでくださいというような、全く通じないわけじゃないんですけど、こうした否定形の指示はAIはあまり得意ではありません。
ただこのGPT4.1は、こういった否定形の指示もうまく聞くようになっているというように説明されています。
あとは単純に回答のスピードも速いですね。なのでサクサク結構作業が進みます。
で2つ目がコンテキストウィンドウの拡充、コンテキストウィンドウっていうのはAIの短期記憶のようなものになります。
より大きなコンテキストウィンドウを持つAIモデルの方が、より長い会話を記憶できると。結構人間でもありますよね。
会話をしていて、最初何を話していたか忘れてしまうみたいな。これと同じようなことがAIでも起こるんですね。
かなり長い会話のやりとりとか、あとは大きなファイルを扱った会話なんかでは、結構前半の会話を忘れてしまうと。
そういったものに影響を及ぼすコンテキストウィンドウの値が、今回のGPT 4.1は100万トークンになっています。
今までオープンAIってコンテキストウィンドウあまり大きくなかったんですよね。GPT 4.0で12.8万トークンぐらいでしたかね。
それが新しいGPT 4.1では100万トークンまで拡充されているというわけです。
コンテキストウィンドウの大きさで言うと、GoogleのGeminiが有名ですけど、それと同じぐらいのコンテキストウィンドウがあるモデルっていうのをオープンAIも出してきたというわけです。
で、あとは3点目。コストの削減。これも改善されています。
GPT 4.5に匹敵するぐらいの性能を持ちながら、GPT 4.0よりも安いと。
安いはもう正義ということで、やっぱり使う側としてはモデルが安いに越したことはないんですよね。
ちなみにこのGPT 4.1はチャット画面では利用できないと先ほどお伝えしました。
でもですね、オープンAIプレイグラウンドという環境では試すことができます。
APIキーの設定が必要になってくるんですけど、興味のある方は試してみてください。
あと、このGPT 4.1に関して、ノートでも記事を書きました。
興味がある方はこちらもぜひ覗いてみてください。概要欄にリンクを貼っておきます。
私、今ですね、マイクロソフトが開発しているVisual Studio Codeというコードエディターがあるんですけど、
そこからエージェントモードっていうのを無料で利用できるんですね。
今まではクロード3.7ソネットをこのエージェントモデルで使っていました。
でも新しくGPT 4.1を設定してちょうど試しています。
ちょっとまだ色々ですね、試せてはいないんですけど、ざっと触った感じ、いい感じですね。
クロード3.7ソネットに比べてレスポンスも早いですし、
あとは単純にAPIの価格もクロード3.7ソネットに比べて安いので、
ちょっとしばらくですね、エージェントモードでこのGPT 4.1を触っていこうと思います。
MCPの利用方法と展望
はい、ではGPT 4.1の話はこれくらいにして本編行きましょう。
MCPです。そもそもMCPって何ですかという話からですね。
MCP、モデルコンテキストプロトコルの略となります。
このMCPはもともとクロードを開発しているアンソロピックという会社が開発したものとなります。
2024年の11月、ちょうど去年ですね、発表されたものとなります。
なのですでに約半年ぐらいは経過しているんですかね。
でこのMCPって何なのかっていうと、簡単に言うとオープンソースの規格となります。
でこれクロード固有の機能ではなくて、オープンソースで使える規格と、
あの規格っていうのはイベント規格とかのこの規格の漢字ではなくて、
USBの規格などの文脈で使われる方ですね。
AIから各種ツールに接続するための規格となります。
MCPはモデルコンテキストプロトコルの略ですけど、
プロトコルっていうのは日本語に直すと、
あのコンピューターがデータなどをやり取りするために決められた規格みたいな意味合いがあります。
ちょっと複雑になってきたので、よりイメージしやすくMCPについて説明すると、
そうですね、頭の中にパソコンをイメージしてください。
でこのパソコンっていうのは単体でももちろん利用できますよね。
でも外部の機器に接続することでいろんなことができるようになりますよね。
そうですね、例えばカメラに接続したらカメラの画像を取り込むこともできます。
外付けのハードディスクに接続をしたらデータを引っ張ってくることもできます。
でこの時にパソコンから外部の機器に接続する時ってすでに規格がもう決まってますよね。
例えばUSB Type-BとかType-Cとかですね。
でこれパソコンが出始めの時ってこういった規格って結構バラバラだったと思うんですよね。
例えばカメラの場合だとカメラのメーカーが独自で決めている規格があって、
うちのカメラはこのケーブルじゃないとパソコンに接続できませんよみたいな。
まあだいぶ前の話になると思うんですけど、
以前はパソコンからいろんな機器に接続する時のこのケーブルと言いますか、
そういったものがバラバラだったと。
これって結構ユーザーも会社側も使いづらいですよね。
これと同じようなイメージがMCPとなります。
今までもAIから他のツールに接続することはできました。
でも接続をする時のこの規格っていうのはまだ定まってなかったんですね。
そこでアンソロピックがMCPという業界の標準になるようなオープンソースの規格を出してきたと。
これによってAIから他のツールに接続するようなことがですね、
非常に簡単にできるようになったと。
じゃあこのMCPどうやって使うのという話になるんですけど、
ちょっとイメージしやすいようにですね、
MCPの使い方や具体例について紹介したいと思います。
まずMCPを簡単に試す方法がですね、
CloudのデスクトップアプリからMCPを試す方法になります。
普段Cloudを使う場合って、Cloudのウェブページにアクセスして使いますよね。
実はウェブページと同じようなことができるCloudのデスクトップアプリというのもあります。
まずはこちらをですね、パソコンにインストールします。
そして設定ファイルにMCPの記載をします。
もうこれだけでですね、CloudのデスクトップアプリからMCPを使うことができます。
どういったことができるかっていうと、
例えばパソコンのフォルダやファイルを新規作成したり、
あとはアクセスをして内容を読み取る、そういったことができるようになります。
MCPを使うと、例えばこういったことができるようになります。
サンプルとしてAIへの指示を言ってみますね。
今日の日付でフォルダを作成してください。
その中にマークダウンファイルを作成してください。
こんな感じで指示すると、Cloudのデスクトップアプリから
パソコンのファイルやフォルダにアクセスができるようになると。
その他にもフォルダの中にあるPDFを読み込んで要約をしてください。
こういった指示もできたりします。
こんな感じでAIの機能をさらに拡充できるようなツールとつなげることができると。
ちなみに以前のポッドキャストでも紹介しましたけど、
AIと音声入力非常に相性が良いというふうに言いました。
で、あのMCPと音声入力も非常に相性がいいんですね。
例えばエンジニアの方であれば音声入力でAIに指示を出してどんどんコードを書いていくと。
で、もちろんエンジニアでない方も音声入力で、
そうですね、例えば資料作りをどんどん作っていくと。
そういった使い方もできます。
で、最近だとエンジニアでない方もカーソルのようなコードエディターを使って
ドキュメントを管理する、そういった使い方をしている人も増えてきていますよね。
次に、なぜ今日MCPを話そうと思ったかについて改めて触れたいと思います。
やっぱり一番大きな出来事は、オープンAIもこのMCPをサポートすると発表したからだと思います。
オープンAIもChatGPTのデスクトップアプリを出していますよね。
で、このデスクトップアプリがMCPをサポートするとなると、
クロードのデスクトップアプリと同じようなことができるようになります。
今、MCPに触れている人ってそんなに多くないと思うんですけど、
ChatGPTも本格的にサポートしてくるってなると、
ChatGPTのユーザーは多いので、MCPを使う人っていうのが爆発的に増えるような気がします。
こんな感じで、オープンAIもオープンAI以外の企業も、
うちもうちもということで、結構いろんな企業がですね、このMCPを開発しているんですね。
例えばマイクロソフトが発表したPlayLite MCPというのは、
AIからブラウザを操作できるものとなります。
それ以外でもNotionとか、あとはLINEもMCPサーバーを公開しています。
こんな感じで、結構多くの企業がMCPに参入してきています。
こんな感じで、MCPの数が増えて、できることが増えると、
こちらとしては結構ありがたいんですよね。
ただですね、逆にできることが多すぎて、何をしたらいいのかわからないっていう状態にもなると思います。
ちょうどAIが出始めの時って、AIすごいみたいな状態だったと思うんですけど、
MCPの流行と利用法
で、AI何ができるのと、AIできることが多すぎて逆に迷っちゃうみたいな状態の方多かったと思います。
それとですね、似たような感覚がMCPにもあります。
MCPすごいと、でもできることが多すぎて、何から手をつければいいのかわからないみたいな、
そういった感じがですね、ちょっと今の状況かなと思います。
あとはいろんな企業がMCPサーバーをどんどん開発しているので、
毎日MCPでできることがどんどん増えているような状況なんですね。
ただ、このMCPのトレンドっていうのはしばらく続いていくと思います。
で、あとはAIモデルの性能が上がれば上がるほど、
MCPも使いやすくなるので、まずは触ってみてですね、
MCPどんなものかっていうのを体験してみることをお勧めします。
このMCPっていうのは難しそうなイメージがあるんですけど、
割と簡単に誰でも利用することができます。
先ほども紹介したように一番簡単なのが、
Cloudのデスクトップアプリから試す方法だと思います。
ノートに詳しい設定方法は書いていますので、
MCP試してみたいという人はですね、こちらも覗いてみてください。
MCPのセキュリティリスク
概要欄にリンクを貼っておきます。
ちなみにCloudの無料ユーザーも利用できます。
ただ、Cloudの無料ユーザーの場合、利用制限があります。
なので、たくさん利用できるわけではないんですね。
たくさん利用すると利用制限がかかります。
また後で使ってくださいねというような感じになります。
もしですね、ちょっとガッツリ利用してみたいっていう人は、
Microsoftが出しているVisual Studio Codeがおすすめです。
これ最近ですね、エージェント機能を無料ユーザーも使えるようにしたんですよ。
なので、APIキーを設定すれば、
そういった制限に関係なく、重量課金制で利用できます。
なので、CloudでもOpenAIでもAPIキーを設定すれば利用できると。
例えば、CloudのデスクトップアプリからMCPを利用しようと思うとですね、
使えるモデルっていうのはCloudのモデルに限定されます。
ただ、Visual Studio Codeの場合だと、
CloudのモデルもChat GPTのモデルも設定することができます。
ちなみに私は、あのVisual Studio Codeに最近出たGPT 4.1を設定して、
MCPを利用しています。
ここら辺はですね、お好みで利用してみてください。
Visual Studio CodeにCloudやOpenAIのAPIキーを設定する方法は、
こちらも概要欄にリンクを貼っておきます。
ここまで、MCPのメリットについていろいろ話してきました。
最後にですね、MCPのデメリットについても話していきたいと思います。
メリットだけではなくて、デメリットも抑えておきましょうということで。
MCPのデメリットはズバリセキュリティリスクです。
MCPはアンソロピックが開発したオープンソースとして公開されているオープンな企画となります。
なので、マイクロソフトとかLINEがですね、
うちMCPサーバーこんなの作ったよと、よかったら使ってみてよと、
こういったことができるわけですね、オープンソースの企画なので。
それとは逆のパターン。
通常の知れない人でもMCPサーバーを作って公開できてしまうんですね。
誰が作ったかよくわからないようなMCPサーバーっていうのを、
自分の環境にインストールして使ったとします。
こういった時に情報漏洩したりとか、悪意のある行動を仕込まれたりとか、
そういったケースも考えられます。
ちょっと海外の事例で怖いなって思った事例がありまして、
MCPサーバーをインストールした直後はお行儀よく振る舞って、
その後にですね、悪意のある振る舞いをするみたいな、そんなMCPサーバーも確認されています。
なので有名な会社と言いますか、公式が出していないようなMCPサーバーを使う時には、
注意する必要があると思います。
GPT-4.1の紹介
ちなみにこのMCPサーバーっていうのは、自分で作ることもできます。
自分のタスクに応じたMCPサーバーを作るっていうのも面白いと思います。
プログラミングの勉強にもなると思いますし、
ちょっと私も先でMCPサーバー自作してみたいと考えています。
はい、それでは今日のポイントをまとめます。
一つ目に、OpenAIから新しいモデルのGPT 4.1がリリースされました。
性能や価格に優れるモデルとなります。
現時点ではAPIからの利用のみとなります。
二つ目に、最近MCPがホットな話題となっています。
AIの機能を拡充できるツールに接続ができるオープンソースな企画です。
三点目に、一方でセキュリティリスクも注意する必要があります。
特にどこの誰が作ったかよくわからないようなMCPサーバーはインストールしないようにしましょう。
はい、今日はこの辺ということで、本日も聞いていただきありがとうございました。
話は変わるんですけど、お便りを複数いただいています。
ちょっと読みますね。
質問です。いつか気が向いた時にでも答えてもらえたら嬉しいです。
ポッドキャストとオーディブルがとにかく好きで、ずっとながら劇をしています。
今や聞き慣れないほど多くのチャンネルやタイトルがあるとはいえ、
自分好みの声や話し方、内容はある程度限られてしまいます。
なので、矢野さんのおすすめをぜひ聞いてみたいと思いメッセージしました。
矢野さんが日頃好きで聞いているポッドキャスト番組や、
面白かったオーディブルのタイトルを教えてもらえると嬉しいです。
ちなみに矢野さんの声はスーッと内容が頭に入りやすいので気に入っています。
ラジオネーム大堀公演大好きさんから。ありがとうございます。
そうですね、私がよく聞いているのはオフトピックという番組と、あとは深堀FMですね。
こちらも概要欄にリンクを貼っておきます。
最近はその他で言うと哲学系のポッドキャストも気になっています。
逆に私こんなの聞いているよみたいな、皆さんのおすすめの番組があればぜひ教えてください。
はい、では次のお便りです。読みますね。
ポッドキャストラボ福岡のご出演で知りまして、1話から最新回まで一気に聞きました。ありがとうございます。
自分はこれまで生成AIを使ったことがなかったのですが、
使ってみないとは使いどころもわからないだろうと思い切ってチャットGPTのプロを使い始めました。
いきなりプロすごいですよね。3万円ですよね。
まだまだAIと付き合い始めて2週間です。
さて64話目で生成AIごとの使い分けの話をされていましたが、
最初の日常の利用というものがよくわかりません。
日常的にはどのような使い方をされているのか。
特にプログラマーエンジニアではないので、日常的な利用具体例などあれば教えてください。
お便りありがとうございました。
これですね、前回の64話のエピソードになるんですけど、すいませんちょっと私の伝え方が良くなかったですね。
日常の利用っていうのは、普段AIを触るときに皆さんそれぞれ愛用しているAIがあると思うんですよね。
チャットGPTとかクロードとかジェミニとか。
そうした普段使いのAIにはやっぱりチャットGPTが総合的に見ておすすめですよっていうことをお伝えしたかったんですよね。
すいませんこれはちょっと私の伝え方が悪かったですね。
日常的にどのような使い方をされているのかという質問にお答えすると、
そうですね、結構溶け込んじゃっていますね普段の業務に。
例えばですね、パソコンで入力作業すると思うんですけど、
そういった時はスーパービスパーというAIツールを使って音声入力をしています。
このスーパービスパーというのは、中でそのオープンAIのウィスパーという音声認識モデルが動いているものなんですね。
以前もポッドキャストでちょっと話したので、興味がある方はそちらも参考にしてください。
あとはコードを書いたり、文章の構成をしたり、資料の要約をしたりとかですね。
あと情報収集系でよく使いますね。
メイクっていうノーコードの自動化のプラットフォームがあるんですけど、
それでチャットGPTのモデルを回して自動で情報収集するような環境を作ったりしています。
要はですね、インプットの効率化を図るためにAIを使っているような感じですね。
あとは耳と口が空いている時間には、オープンAIのアドバンスドボイスモードですかね。
これを使ってインプットやアウトプットの時間に当てたりしています。
これ結構細切れの時間でタスクを行えるのでおすすめです。
あと会話もログとして残りますしね。こんな感じとなります。
お便りありがとうございました。
番組ではこのように耳で学べるAIを毎週発信しています。
通勤中や家事の合間にAI情報をキャッチアップできます。
毎週水曜朝に更新していますので、ぜひフォローお願いします。
おすすめの生成AIツールをまとめた資料も配布しているので、興味のある方はこちらもぜひ概要欄にリンクを貼っておきます。
お相手は耳で学ぶAIの矢野鉄平でした。また次の配信でお会いしましょう。