1. 車中泊しながら「既存のレールを外す」ラジオ
  2. ブラウザ操作に縛られていた!
ブラウザ操作に縛られていた!
2026-05-26 09:31

ブラウザ操作に縛られていた!

ペスハムのメルマガに登録いただくと、毎朝6時にAIニュースが届く自動化ツールをお渡ししています!

👉 https://metamake0601.systeme.io/aa3f000b

イケハヤさんの明鏡はこちら!
👉 https://brmk.io/97jva8
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/5f7e673ff04555115dc868ae

感想

まだ感想はありません。最初の1件を書きましょう!

00:00
はい、6月6日にブラウザ操作自動化の教科書を出すペスハムです。
今日はですね、ブラウザ操作という言葉に縛られていて、 もっと自動化をするにあたって、具体的な手段を見落としていたという話をしていきたいと思います。
ちょっとタイトルが全然定まらないので、後でAIに考えてもらいます。
えっと、今回ブラウザ操作自動化の教科書っていう名前で出すっていうことに今しているんですけど、ちょっと名前変えるかもしれないですね。
っていうのも、今までですね、自動化をどういう風にやるかっていう手段のところで、今ちょっと瞑想しているんですよ。
というか、いたんですけど、だいぶこれで固まったかなっていうのがあります。
っていうのも、本当にですね、やりたい自動化を実現するためには、必ずしもブラウザを操作するっていうことに限定しなくてよかったっていうことに気づいたんですよね。
っていうのも、ちょっとこれ前にお話した内容なので、知っている方がいるかわかんないんですけれども、
いわゆる僕が最初にやろうとしていて、実際自動化を実現できた音声アップロードっていうのがあるんですね。
この今出している音声配信をVoicyとかStandFM、他にもSpotifyとかいろんなところに出すんですけど、
基本的にはVoicyとStandFM両方に出せばありとあらゆる音声配信に出せる。
それがStandFMがSpotifyでもなってもいいし、他の媒体でもいいんですけど。
そのVoicyとStandFMにアップロードするっていう作業を自動化したいということで、
僕が選んだやり方っていうのが、プレイライトっていうツールを使ってVoicyにアップロードする作業、
StandFMにアップロードする作業っていうものを、それぞれブラウザが立ち上がって音声アップロードする、
概要欄にいろいろ書く、予約投稿するみたいな作業をポチポチって、
僕は何も操作しなくてもやってくれると。そういうことを作ったのが一番最初なんですよね。
これはまさに本当ブラウザ操作自動化じゃないですか。
03:03
その後、壁にぶち当たったんですよ。
例えばGoogleのサービスを同じようにプレイライトでやろうとすると、自動化しようとすると、壁にぶち当たるんですね。
それはうまくログインができないっていう壁にぶち当たるんです。
これはプレイライトではどうしようもない。
じゃあどうするということで、これまでいろいろ迷走していったんですが、
ふとしたきっかけで、ちょっと別角度から自動化っていうものを見る機会があって、
それを元に別のクロードコードに調べてもらったところ、
Gmail MCPっていうものがあるというところが出てきたんです。
このMCPっていうものは、いろんなツールにAIがつなぐ橋みたいな感じなんですよね。
Gmailっていう島に対して、クロードコードでそこにたどり着くために橋を架ける。
これがMCPみたいな感じなんですね。
これは必ずしもGmailっていうブラウザを立ち上げて、ブラウザ上でGmailを操作するっていうことではなくて、
ブラウザで見えているものの裏側、プログラムが入っていく部分ですね。
その裏側で操作をして、Gmailから必要なメールを抜き出して、
そのメールに対して、例えば請求書が入っている場合はその請求書を引っ張ってくるみたいな、
そういった操作をすると。別にこれはブラウザを操作しているわけではないけれども、
やっていることは普段やっている作業を自動でプログラムに動かしてもらうという意味では、
同じ作業をやっているということなんですね。
つまり目的は何かというと、ブラウザの操作を自動化することではなく、
あなたの30分をAIに任せて、その時間にもっと人間らしいことをするということなんですよね。
06:00
だから、もともと僕はブラウザ操作というところから入っていって、スタートがそれだったから、
ブラウザ操作ありきでいろいろリサーチをしていった結果、
このGmail MCPという手段にたどり着かなかったんですよ。
それが出てこなかったんですね。
これね、ちょっと僕もびっくりなんですけど、
僕は幕末スキルというのをやってまして、
江戸時代の幕末志士に登場してもらって、
その4人のエージェントに調べさせたり、記事をまとめたりというのをやってもらっているんですね。
コンダクター、全部の指揮官が藤方俊三で、リサーチが吉田松陰で、
その内容を取りまとめてスライドに起こしていくみたいなのが福沢諭吉。
そこに対して反論を投げかけて、本当にそれでいいのかっていうのを繰り返し聞いてくる人が勝つ回収っていうこの4人なんですけれども、
この4人にですね、調べさせてもこのGmail MCPっていうのは出てこなかったんですよ。
そこに対して僕はね、ちょっとショックでだいぶ落ち込んだんですけど、
これは僕が悪いんですが、ブラウザ操作っていうこの括りで調べさせてしまったからこそ、
多分Gmail MCPっていうのが出なかった。
Gmail MCPに限らずですね、他のいろんなスラックにしろ、Googleドライブにしろ、
マイクロソフトツールにしろ、それぞれMCPっていうのがあるんですよ。
そこにアクセスをすれば、別にブラウザ操作をしなくてもそこにアクセスして何かを引っ張ってきたり、
その情報を取りまとめたりするっていう作業が自動化される、自動化することができるっていうことに今まで気づいてなかった。
ということで、まただいぶですね、このブラウザ操作自動化アップデートをしていきます。
でもちゃんとMCPを使えば、いわゆるこのチャットベースでのコーディング操作ツール、
クロードコード、コーデックス、アンチグラビティっていうこのツールで、
あなたの自動化制作ってのをおそらく完結することができるんですよね。
なので、教材としてはさらに質が上がったんじゃないかなというふうに思います。
ちょっとこれからですね、僕もMCPとかをいっぱい触って、
教材の内容にですね、もっと身を持たせていかなきゃいけないんですけど、
ちょっとそのあたりもですね、この後2週間弱っていう中でできるところまでブラッシュアップして、
09:05
さらに教材リリース後もブラッシュアップしていくっていう風にしていきたいと思いますので、
ぜひね、6月6日、お寿司職人さんのロブロックスの教科書と同じ日ですけれども、
500円で販売しますので、負けないように頑張ります。
ということで、最初の50部500円でぜひゲットしてください。
今日もあなたの自動化にお手伝いができたらと思います。いってらっしゃい。
09:31

コメント

スクロール