00:00
リスナーのあなた、今日も一日情報収集お疲れ様です。 ちょっと一息つきながら聞いてくださいね。
あのー、突然なんですけど、新入社員がチームに入ってきた時のことを少し想像してみてほしいんです。
はい、新入社員ですね。
ええ、で、その子がめちゃくちゃ優秀で、どんな難しい質問にも完璧な答えを返してくれるとしますよね。
もう、それはすごく助かるというか、いいですね。
なんですけど、一つだけ致命的な問題があって、お昼休憩から戻ってきたり、作業を翌日に持ち越したりするたびに、
あれ、私さっきまで何してましたっけ?って毎回ゼロから作業をやり直そうとするんです。
ああ、なるほど。
いくら頭が良くても、これじゃちょっと仕事を任せられないじゃないですか。
確かに。それは確実にチームのボトルネックになりますね。現実の仕事って一瞬で終わるものばかりじゃないですから。
そうなんですよ。
数日かかるリサーチとか、いろんな部署をまたぐ調整をしている途中で、記憶がリセットされてしまうんだったら、
結局人間がずっと横に張り付いて見張ってないといけなくなりますからね。
いや、ほんとまさにそれなんです。そしてこれ、実は今のAIが直面している最大の壁なんですよね。
ええ。
ということで、今回はあるITエンジニアの方がまとめた、2026年7月5日版AIエージェント日時速報という資料を読み解いていきます。
はい。
この深掘り探求で見えてくる最大のテーマはですね、AIはいかに止まらないかではなくて、止まったときにどこから再開できるかというパラダイムシフトなんです。
いやー、ここが今日の最大の鍵ですよね。コンピューター科学の世界では、これをステートレスからステートフルへの進化と呼んだりしますね。
ステートレスとステートフル、なんかちょっと難しそうな言葉が出てきましたけど、これってどういうことなんでしょうか?
まあ、単純に言うと状態、つまりステートを保持するかしないかの違いなんですよ。
なるほど、状態ですね。
はい。これまでのAIチャットって基本的にはステートレス、つまり一問一答の自動販売機だったわけです。お金を入れてボタンを押せばジュースが出る。
へー。
でも、次に買うときには前のことは完全に忘れているんですよね。
あー、確かに。毎回リセットされてますよね。
そうなんです。一方、今のトレンドであるステートフルなAIエージェントっていうのは、状態を維持して働き続ける同僚なんですよ。
昨日どこまでやったかとか、今どんな前提で動いているか、そういうのを抱えたまま長期的なタスクをこなすようになっているんです。
なるほど。自動販売機から自分のデスクに座る同僚になったってことですね。
ええ、まさにそうです。
この変化を序述に表しているのが資料にあるジェンスパークとかジェンスパーククローの事例ですよね。
はい、ありましたね。
ジェンスパーククローは、自分専用のクラウドコンピューターを持つAI社員として位置づけられていると。
で、ホッツアップとかLINE、スラック、Teamsみたいなメッセージアプリを通じて、私たち農園から仕事を受け取るんですよね。
03:03
そうですそうです。ここで重要なのは、AIがどこに存在しているかというメカニズムなんですよ。
どこに存在しているか。
ええ、LINEやスラックで返事をしてくれるからといって、AIがLINEのアプリの中に住んでいるわけじゃないですよね。
まあ確かに違いますね。
彼らはクラウド上の自分専用のPC環境でゴリゴリと作業をしていて、私たちとは単にチャットツールをインターフェースとして会話しているだけなんです。
あー、つまり完全に自席のデスクがあるってことですね。自分のデスクで作業をしつつ、チャットであの件どうなったって聞かれたら、今ここまでやってますよって返してくるみたいな。
そうなんですよ。いい例えですね。そして自席を持っているからこそ、Codexの新しいアップデートみたいな機能が必要になってくるんです。
あ、資料にありましたね。Codexのリモート機能が一般提供を開始したっていう。
ここであのドロップレットっていう技術と一対一QRペアリングっていうのが導入されたんです。
その部分ちょっと専門用語が多くて気になってたんですけど、モバイル端末とホストごとにQRでペアリングして、デジタルオーションのプラグインでドロップレットを作成し、そこをリモートワークスペーシにするみたいな。
はいはい。
このドロップレットっていうのはそもそも何なんですか?
あのドロップレットっていうのはですね、クラウド上に数秒で作れる切り出された仮想サーバーのことなんです。
仮想サーバー?
つまりAIのために一瞬で用意できる新しいデスクとパソコンみたいなものですね。
なるほど。じゃあ例えば私が出先からスマホでAIにちょっとこのデータ分析しといてって指示を出したとしますよね。
ええ。その時スマホの中で重い計算をするわけにはいかないじゃないですか。
無理ですね。熱くなっちゃいます。
だからAIはクラウド上にドロップレットっていう自分の作業部屋をパッと立ち上げて、そこで分析を始めるんです。
なるほど。そこで作業するわけだ。
ええ。で、ここでQRペアリングが生きてくるんです。
スマホとクラウドの作業部屋を暗号化されたQRコードでがっちりと安全な一本の糸で結びつけるんですよ。
なんでそんなに強固に結びつける必要があるんでしょうか?IDとパスワードとかじゃダメなんですかね?
それはですね、作業場所がローカルPCの中じゃなくて見知らぬクラウド上にあるからなんです。
ああ、そっか。遠くにあるから。
もし電車に乗っていてスマホの電波が切れたとしましょう。通信が復活したときに、AIがあれ?さっき指示をくれたご主人はどこだって迷子になったら困りますよね?
それはめちゃくちゃ困ります。
だからこそ特定のスマホと特定のドロップレット、つまり作業場を物理的なレベルで一対一に紐付けるんです。通信が途切れても確実に同じ作業場に戻れるようにしているわけですね。
なるほど。リスナーのあなたもスマホで長文のメールを打っている途中に地下鉄に入って電波が切れて、アプリを開き直したら全部消えていて絶望した経験絶対ありますよね?
06:00
ありますね。あれは本当にショックです。
AIの世界でも作業場所が外部に切り離されたことで、そういう通信切れとか一時的な切断からどうやって復旧するかが今の最大の課題になっているわけですね?
はい。泥臭いインフラのトラブルにAIも巻き込まれるフェーズに入ったということなんですよ。ここからが面白いところなんですけど。
はい。資料のクロードコードの2.1.20の事例ですよね?
そうです。
ここに入っていた修正内容が何というかものすごく人間味があるというか、バックグラウンドセッションとか古いロック、デーモンの引き継ぎ、スリープからの復帰時のクラッシュなんかに修正が入ったそうですが。
これらが具体的に何を意味しているかちょっと考えてみましょうか。
例えばデーモンの引き継ぎ、デーモンハンドオフですね。
はい。デーモン、浦形さんみたいなプログラムのことですよね。
バックグラウンドでずっと動き続けているプログラムのことです。これをですね、夜間警備員に例えてみてください。
夜間警備員ですか?
夜間警備員、つまりデーモンが朝のシフトの人、つまり私たちが再開したセッションですね。その人に建物のマスターキーを渡す引き継ぎ作業だとします。
おお、すごく分かりやすいです。
もし作業中のPCがふっとスリープ状態に入ってしまったらどうなるか。夜間警備員はマスターキーを持ったまま突然気絶してしまうようなものなんですよ。
えっと、気絶?
そして朝になってPCが目覚めたとき、新しいシフトの人は鍵を受け取れないので、システムから締め出されてしまってクラッシュするわけです。
うわあ、それは困る。どうしようもないですね。
以前のクロードコードはまさにこのスリープによる気絶からの鍵の受け渡し失敗でつまずいていたんです。
なるほど。
それが今回のパッチで修正されてPCがスリープから復帰しても確実に前の状態を引き継げるようになったんですよ。
はあ、なるほど。スリープ復帰のクラッシュってAI理性が賢くないから起きるわけじゃないんですね。
AIが働いている物理的なPCとかサーバーっていう現実世界のインフラが不安定だからそこで鍵を落としちゃうんだ。
まさにその通りです。そしてもう一つ非常に実践的なのがオープンシーローの事例ですね。
はい、オープンシーロー。
最新版ではGPT 5.6をサポートしただけじゃなくて、オープンシーローアタッチっていうコマンドで既存のセッションに外部から接続できる機能が追加されたんです。
このアタッチってどういう感覚なんでしょうか。
これも同僚のデスクで例えましょうか。
同僚が数時間かかる思い作業をしています。あなたは進捗か知りたい。ちょっと今どうなってるか見せてって声をかけますよね。
はい、かけますね。気になりますから。
この時見せてといったせいで同僚が作業中のソフトを一度全部閉じて最初からやり直してしまったらどう思いますか。
いやいやいや、そのままでいいから今やってる画面を後ろから覗き込ませてって絶対なりますね。
09:00
ですよね。それがまさにアタッチコマンドのメカニズムなんですよ。
あーなるほど。
最初からやり直させるのではなくて、今まさに裏で動いている作業のプロセスに外部からちょっと失礼してって相乗りして状態を確認するんです。
もし途中で止まっていたらそこから新しい指示を与えて再稼働させることもできますし。
それはめちゃくちゃ便利ですね。完全に裏で動かしたなしにできるってことじゃないですか。
ええ。もしこの機能がなければ進捗を確認するために作業がリセットされてしまうか、あるいは完了するまでブラックボックスのまま待つしかなくなりますからね。
確かに。
AIを実務の運用に乗せる上で、この進行中の状態に触れるっていうのは本当に革命的なんですよ。
いやー、システム的に再接続できるメカニズムはよくわかりました。でもちょっと待ってください。
はい、なんでしょう。
ここからが本題というか、一番厄介な部分な気がするんですけど。
と言いますと。
ネットワークが切れても元に戻れる。PCがスリープしても鍵を拾って再開できる。そこまではいいんです。
ええ。
でも、再開した瞬間にAIが、あれ?システムは復旧したけど、私、何のルールで何を目指して作業してましたっけ?って、作業の文脈を忘れてしまったら意味がないですよね。
ああ。
最初の侵入サインの例と同じで。
いやー、非常に鋭い視点ですね。システムの接続が切れないことと、作業の文脈、つまりコンテクストが壊れないことは全く別の問題ですからね。
そうですよね。
そこで重要になるのが、クロードコード2.1.120のちょっとした変更点なんですよ。
あ、資料にありましたね。クロードソネット5のセッションにおいて、会話途中のシステムロールでのハーネスリマインダーを使わなくなったとありますが、これどういう意味なんでしょうか?
AIに複雑なタスクをさせるとき、私たちは最初に、「あなたはプロのプログラマーです。必ずテストコードも書いてください。」といった大前提のルール、いわゆるシステムプロンプトを与えますよね。
はい、与えますね。
これまでのシステムは、AIが長い作業をしている途中で、このルールを忘れないようにリマインダーとして、会話の途中に何度もルールを差し込んでいたんです。
ああ、忘れるなよ。お前はプログラマーだぞ。って途中で何度も囁いていたんですね。それって親切な気がするんですけど、ダメだったんですか?
実はこれが逆効果だったんですよ。
え、そうなんですか?
はい。長いタスクの途中で突然システムからの割り込み指示が入ると、AIの中で、「あれ?今までの前提が変わったのか、別のタスクが始まったのか?」って完了条件や文脈がブレてしまうんです。
なるほど。作業に没頭している同僚に、横から何度も、「君はプログラマーだからね。」って声をかけたら、「分かってるよ。今集中してるのにペースが乱れるじゃないか。」って混乱しちゃうのと同じですか?
そういうことです。だから、再開可能性を高めるためには、途中で余計な割り込みをせず、最初から最後まで同じ前提をピュアに保ち続けることが、文脈維持に直結するっていう判断なんですね。
12:03
面白いなあ。そして、文脈の維持といえば、アンティグラビティというエージェントの事例もありましたよね。これは開発環境を横断して作業するAIだそうですが、ここで一つ素朴な疑問を聞いてもいいですか?
どうぞどうぞ。
いくら環境を横断するからって、そんなに複雑な状態の保存が必要なんでしょうか?人間同士の仕事だったら、退勤するときに、「今日はステップ3のエラー原因の特定まで終わりました。明日はコードの修正からやります。」ってスラックにテキストのメモを残すだけで十分引き継げるじゃないですか?
ええ、そうですね。
AIも、泊まるときに、ここまでのメモを残せばいいだけなんじゃないですか?
ああ、それは多くの人が陥りがちな罠ですね。人間の、「ステップ3まで終わりました。」っていうメモの裏には、実は膨大な暗黙の了解が隠れているんですよ。
暗黙の了解ですか?
ええ。どのファイルを開いていて、ターミナルの状態はどうなっていて、どんな変数がメモリに載っていたか。人間なら翌朝、もう一度ファイルを順番に開いて、「ああ、そうなった。」と脳内の状態を復元できるわけです。
ああ、確かに。無意識に頭の中を昨日の状態に戻してますね。
ですよね。しかし、コンピューターにとっての再開は、それでは不十分なんです。
そうなんですか?
例えば、プログラムのバグを直している途中で止まった場合、ただ直している途中ですっていうメモがあっても、AIからすれば、メモリに読み込まれていたデータは?とか、起動していたローカルサーバーのポート設定は?先行して走らせていたテストスクリプトの結果は?となってしまって。
うわあ、なるほど。
結局、最初から環境構築をやり直す羽目になるんですよ。
テキストのメモだけじゃ、作業途中の一番ごちゃごちゃしたデスクの上を完全には再現できないんですね。
その通りです。だからこそ、工程ごとに環境全体のスナップショットのような明確な再開点をシステムとして保存しておかないと、人間がいざ引き継ごうとした時に、どこから手をつけていいかわからなくなるんです。
完璧に理解しました。途中経過を残すってそういうことなんですね。そして、これは直接目に見える成果物を作るAIでも同じなんですよね?
はい。
資料にあるMANUSというAI、これはスライドやウェブサイトの作成に特化していますが、ここでも途中成果を捨てない設計が重要視されていると。
そうなんです。これまでは完成したスライドだけが成果物だと思われていました。しかし、途中でエラーで止まってしまった時、完成品だけを求めていると手元にはゼロしか残らないんですよね。
それはきついです。AIが裏で何時間も調べてくれたのに、すいません最後のグラフ描画で漕げたんで全部消えちゃいましたってなるのは本当に地獄ですよ。
だから、MANUSのようなシステムは未完成のアウトライン構成案とか、集めてきた画像の広報、ウェブサイトのモックアップの残骸など、途中成果を常に試算として保持する設計になっているんです。
15:00
なるほど。
これがあれば、止まってしまっても人間がそこから引き継いで仕上げられますからね。
失敗作とか未完成品も立派な作業試算なんですね。そしてそれを最も究極の形で実践しているのが、資料の最後にあるハーメスエージェント、バージョン0.180ですね。
ええ、ここが本日の集大成とも言える機能ですね。
自己改善型のコンピューター操作エージェントとありますが、ここで私が気になったのは、learnとかjourneyというコマンドなんです。
はい。自己改善型AIにとって、学習するというのは漠然と賢くなることではないんですよ。
そうなんですか。
彼らにとっての学習コマンドであるlearnが、メカニズムとして何をしているかというと、前回どこでなぜ失敗したのかというエラーログと、次回はどうアプローチを変えて再開するかという手順書の書き換えをセットで行っているんです。
ちょっと待ってください。それってすごいことじゃないですか。ただ止まったところから再開するんじゃなくて、失敗した原因を分析して、次の再開時にはより賢い状態からスタートするってことですか?
まさにその通りです。ハーメスエージェントは完了の条件というものを厳格に持っていて、タスクが完了しなかったとき、その失敗のプロセス、つまりジャーニー自体を資産として保存するんです。
失敗すらもデータに変えてしまうと。
ええ。これができれば途中で止まることは決して無駄ではなくなるんですよ。
いやー鳥肌が立ちました。AIにとって止まることや失敗することはかつてはシステムの欠陥でした。でも今やそれは次の改善のためのセーブポイントに変わったんですね。
はい。一発で完璧な出力が出なくてもいいんです。迷い、通信が綺麗、エラーで止まるという現実世界の泥臭さを正面から受け入れて、そこからいかにスミューズに学習して再開するか。これが今のAIエージェントの最前線ですね。
ありがとうございます。リスナーのあなた、今回の深掘りいかがだったでしょうか。AIを導入するっていうと、どれだけ貸しといモデルを使うかばかりに目が行きがちです。
ええ、そうですね。
でも今日見えてきたのは、AIエージェントにとって今一番大事な運用品質はステートフルであること、つまり止まった後にどうやって文脈と状態を保って戻れるかだということでした。
そうですね。もしリスナーの方が明日職場でAIエージェントに長期的な業務を任せようと考えているなら、最初にこれが途中で止まったらどうやって引き継ぐかを設計することをお勧めします。
二重実行していい処理なのか、途中成果はどう保存するのか、復旧のルールを決めておくだけでAIの運用は劇的に楽になりますから。
AIが失敗した時のルールを決めるのが人間の一番大事な仕事になるわけですね。最後に一つちょっと恐ろしくも面白い想像をしてみましょうか。
はい、何でしょう。
もし近い将来、AIエージェントがさらに進化して、どんなトラブルで強制終了させられても、完璧に文脈を記憶し、失敗から学習して、月曜日の朝に最適な場所から即座に作業を再開できるようになったとしますよね。
18:02
ええ、技術的にはずいぶんあり得る未来ですね。
その時、週末ゆっくり休んで週明けのデスクに座り、「あれ?先週の金曜日私どこまでやったっけ?何の資料作ってたんだっけ?」とコーヒーを飲みながらボケっとしている私たち人間の方が、AIから見て再開可能性が低すぎる、ステートレスでポンコツな同僚として呆れられちゃう日が来るかもしれないですよね。
それは耳が痛いですね。私たち人間も日々の再開可能性、特に金曜日の夕方のメモの残し方を見直した方がいいかもしれません。
リスナーのあなたは、週明け、自分の作業状態をうまくロードできていますか?間違いないですね。というわけで、今回の探究はここまでです。
次回もまた面白い資料の深掘りでお会いしましょう。お疲れ様でした。
お疲れ様でした。