1. AI駆動開発部の日常
  2. 35【GPT-5.5は短文でOKは本当..
35【GPT-5.5は短文でOKは本当?】公式プロンプトガイドを読み込んだ結果
2026-05-02 36:25

35【GPT-5.5は短文でOKは本当?】公式プロンプトガイドを読み込んだ結果

今回は、OpenAIが公開したGPT-5.5の公式プロンプトガイドを起点に、新モデルの使用感とプロンプト設計の本質について語っております。
「アウトカムだけ伝えれば短いプロンプトで動く」というガイドの主張に対して、僕は『結局、踏ませたいステップは書くしかなくないか?』という違和感を抱いていて、プロンプトガイドを読み込んできてくれた阿部さんも近い感触を持っているようでした。一方で、5.5になってから増えた"勝手に作業を始めてしまう"振る舞いには、お互いかなり手を焼いている様子。
そこから話は、AIに余白を残しながら高品質を引き出す"マジックワード"論や、コンテキストをクリーンに保つコツ、Cognition AIが論じる文脈管理の話まで広がり、お互い気づきの多い時間となりました。モデル更新のたびにプロンプトをどう見直すべきか、その判断軸についても踏み込んでいます。
▼GPT-5.5 プロンプトガイド
https://developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5
▼Cognition AI「Don't Build Multi-Agents」
https://cognition.ai/blog/dont-build-multi-agents
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/68dc82a9036795923c400b4f

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

今回のエピソードでは、OpenAIが公開したGPT-5.5のプロンプトガイドを基に、新モデルの使用感とプロンプト設計の本質について深掘りしています。GPT-5.5は以前のモデルと比較して、指示されていない作業を勝手に開始したり、肯定的な表現を多用したりする傾向が見られ、一部ではClaude Opusに似た振る舞いをするという感想も述べられています。特に、意図しない行動を開始してしまう現象は、開発者にとって大きな課題となっているようです。 番組では、GPT-5.5のプロンプトガイドが「結果だけ伝えれば短いプロンプトで動く」と主張している点に対し、実際には踏むべきステップを記述する必要があるのではないかという疑問が呈されています。また、AIに余白を残しつつ高品質な出力を引き出すための「マジックワード」の重要性や、コンテキストをクリーンに保つコツ、Cognition AIが提唱する文脈管理の考え方についても議論が展開されました。モデル更新のたびにプロンプトをどのように見直すべきか、その判断軸についても考察が深められています。

GPT-5.5の初期使用感と懸念点
おだしょー こんにちは、AI駆動開発部の日常
へようこそ。このポッドキャスト は、日々AI駆動開発を行う、企業
家の山本とエンジニアの阿部が AI駆動開発のリアルを緩く語り
合う番組です。よろしくお願いします。
山本 よろしくお願いします。
おだしょー ではでは、今日は前回に引き
続き、Chat GPT-5.5のモデルを使う にあたっての話題にできたらと思
っております。初めに軽く、どんな 感じか、使ってる仕様感みたいな
ところ、あれから少し経ってという ことで、シェアしあえて、その後
今日は阿部ちゃんがプロンプト、 OpenAIが5.5のモデルにこういうプロンプト
を埋め込んだほうがいいよ、みたいな のを読み込んできてくれたんで、
そのあたりのシェアとかしてもら えてたらいいかなというふうに
思っておりますので、よろしくお願いします。 使用感的なところ、どうですか、実際
というところで。
山本 GPT-5.5、前回のお話の中では 結構、僕の中では評価高めな話を
してたと思うんですよ。結構、ツール ユーズもうまくて、今までなかった
動きをしてくれるなというところ で、非常に感触としては良かったん
ですが、なんかどうしても気になる 動きが、振る舞いがあって、結構
質問をしていたり、確認をしている だけなのに、作業を勝手にし出す
とか、行動を書き出したりとか、指示 していないことまでやり出して、
こういう懸念もありそうだった わね、ここもいじっておきました
みたいな。そういう脱線するような ことがかなり増えたなというように
感じてます。あと、非常に肯定的な 表現を多用するようになった。これって
こうじゃないんですかみたいな、 まさにその通りですみたいな。
はいはいはいはい。
忌憚のない意見を言ってくれた ほうが嬉しいのにみたいなね。
そうそうそう。なんかどっちか っていうと、クロードのオーパス
にかなり寄った、クロードっぽい AIになったなみたいな感触をこの
1週間で感じてますね。
あー、なるほど。なるほどなるほど。
僕としては、GPTにはそんなのを 求めてないよっていう感じで、
5.3コーデックスのように、もう 冷酷にいやお前間違ってるぞっていう
のを常に突き返してきたりとか、 言われたことしかやんないみたいな。
もうそれでよかったなっていう、 僕はすごい感じていたんですけど、
どっちかっていうと、汎用的になった のか、なんか仕組みが変わったのか、
内部のプロンプト的に仕組みが 変わったのか、かなりそういった
振る舞いが変わったんだなっていう のをすごく感じました。
うんうんうんうん、なるほどね。 僕はそうですね、同じく結構ね、
今まで絶対になかったのが、お前 オープンエージェントを使って開発
する、オープンコードとお前オープン エージェントを開発してると、レビュー
を計画の一番最後に4体ぐらい立て たりとかしたりとか、レビュー用
のエージェントみたいなのを立て たり、オラクルとかを立てたり
とかするんですけど、そいつが勝手に 計画のレビューをしてもらって
ないのに、その計画を始めちゃった みたいなのがめちゃくちゃ多くて。
きついねそれは。
うんうんうん。
マジできつい、かなりきつい正直。
うんうんうんうん。
そう、っていうのがあって、まさに 阿部ちゃんの言ってるのと合致
してるなっていうような印象を受けて います。で、一方でその肯定的な
意見が増えたみたいなのは、俺は そんなに感じてないかな今のところ
は。
そうなった。
うん。ただ、頭は実際ベンチマーク 的にも良くなったらしいじゃん。5.4
からもだし、5.3コーデックスの時も 明らかに頭はいいじゃん、ずっと。
黒どもなんだけど。けどね、最近 このPodcast編集を効率化しようと思
って、自動編集する仕組みをちょっと 作っていってるんですけど、そこ
でAっていう機能があって、Bっていう 機能があって、Cっていう機能があって、
このAっていう機能が、人間の発話 を検知するのすごい優れている
から、Cを一部取っ替えた方がいい じゃん、なんかシンプルになるじゃん
みたいな。
うんうんうん。
全体にシンプルになるし、高品質 になるし、それが後続のプログラム
とかの品質向上にもつながるよね みたいな、そういう紐づいた関連性
のある良いアイデアみたいなの。 より効率的になるし、品質も上がる
よねみたいな、結構欲しいクリティカル なアイデアみたいなのが、こっち
から出さないと向こうから出てこない なみたいな感覚が、より増えた感覚
はある。もともとそこまで出して くれないなっていう感覚はあった
けど、より建築に愚直にやる感じ が、愚直にやるやつっていうイメージ
なのかな、イメージ的には。
そう、だから指示にちょっと俯瞰 してみてからとか、そういうのとか
をやったりとかする必要は、結構 増えたなっていう感覚を得てる
って感じかな。もともとAIその 機質はあるから、こっちから導いて
あげないといけないっていうのは あるんだけど、かなり今回開発してる
性質上のものかもしれないけど、 最近かなり感じてるなっていう
イメージですね。
なるほどね。
そんな感じで、だいたいけどお互い 共通してるのは、勝手にやっちゃう
みたいなところが一番感じるところ だよね、みたいな感じなのかな
と。次はプロンプト、OpenAIが出した プロンプトの話を、阿部ちゃん
どんな感じかみたいな話してもら えたら。あれよね、AgentMD書いて
くれたりとかしてたよね。
GPT-5.5プロンプトガイドの解釈とプロンプト設計の本質
そうだね。そんなこんなで勝手に 作業始めたりするので、結構作業
上困ることが多かったんで、こういう 時ってOpenAIもそうですし、アンソロピック
も各モデルに対してプロンプトを どうやって書くといいですよっていう
ようなプロンプトガイドを公式的に 出してるんで、困ったらとりあえず
見に行くようにしていて、それで 見に行ったんですけども、あれなんですよ
ね、プロンプトガイドを見に行く と、今回のモデルから変わった点
として、結構成果主義というか、 自立思考性が高くなったりだったり
その成果主義っぽい形に変わった ような印象を受けるような書き方
をしていて、どっちかっていうと これまではワークフロー的に細かく
これをやったらこうやってみたいな やらないとうまく動かないですよ
っていうのがGPTモデルの特性だったん ですけど、それよりもゴールを定
めてあげたりとか、それに対して どういう制約がありますよみたいな
ことを書いてあげて、短いプロンプト で欲しい結果だけ書けば、あとは
GPT 5.5が性能高いから、ある程度 自立してやっていくので、それで
うまくワークしますよみたいな 書き方をしているっていうような
感じでした
おだしょー なるほど なるほど なるほど 実際にFlexも言ってる
人がいて、そういうの
しばやん そうなんだ
おだしょー うん
しばやん 多分みんな思ってるでしょう
ね 結果的にそれが成果に飛びつく ような状況になってしまったかゆえ
に高度に着手しやすいとか、そういう 僕らが困っている問題に遭遇して
いたんかなっていうふうに感じて た
おだしょー なるほどね 確かに計画書を読んだら計画書
が求めている結果だと思われちゃう みたいな
しばやん そう そう だから実装に入るみたい
な 疑問を呈したらその疑問を修正する
方向に走るとか、なんか一昔前の AIモデルっぽい振る舞いだなって
感じちゃうけど
おだしょー そうやね 戻っちゃったなみたいな
感覚はあるよね 頭はいいんだけど 性質が戻っちゃったなみたいな
感じがあるよね あんまり良くないよね これ
しばやん 僕はあんまり良くないと思う
GPTの良さって本当に職人的な感じ が
おだしょー 硬くやってくれるのが良かった
よね
しばやん そう そう そう 何でもかんでも
イエスマンとか とりあえずやります みたいなオーパス
みたいな活気あふれる感じはちょっと 求めてなかったなみたいな感じ
でいました
おだしょー そうやね なるほどな オープンAIのプロンプトガイド
を見てというか Xで投稿してる 人たちの投稿とかを見て ちょっと
物申したいというか 正直あんな 変わってなくないって 欲しい成果
を伝えるのはその通りで ワーク フローをわざわざゼロから書かな
くていいっていうのはそうかもしれない けど 踏んでほしいステップは書
くじゃないですか
しばやん はい はい はい そうですよね
おだしょー 結局 だって やって ほしい振る舞いがこちらにもう
あるんだったら それを書くじゃない ですか もちろん余白を作るっていう
のは 僕 もともと5.4のときから も別に意識してたんですよね 硬
すぎる計画を書くと 余白がなさ すぎて 逆に性能劣化する感覚は
あったんですよ なんで あれを ちょっとパッと見たら 例えば シフト
管理システム作ってっていいと思 っちゃう 誤読しちゃうなと思って
しばやん 確かに
おだしょー いや シフト管理システム 作ってって言って 確かにシフト
管理ツールっぽいものは作れる かもしれないけど 別に それで
ちゃんとプロダクションレベル のものが作れるかと言われると
そうじゃないから そこを誇張表現 してるように見えちゃって すごく
誤解を生む投稿が多いなみたいな
しばやん なるほどね Xでは もう 短いプロンプトで 全部やってくれる
ぜみたいなのが
おだしょー そうみたいな投稿を よく見るんだけど それって 別に
本質的には何も変わってなくて 結局 必要な情報 コンテキスト
は与えて 自分が達成したい目的 が それなりの複雑なものである
ならば 必要十分条件を満たす ような要望は書かないといけない
から そこに対しての道筋を厳格 化する必要はないから その部分
が端折れるとは言っても 別に めっちゃプロンプト変わるわけ
じゃないよねって 具体のステップ論 みたいなのは もちろんいらない
かもしれないけど けど 多分 5.5 になっても 具体のステップ論
を書いたほうがいい場面ってやっぱ あるじゃん 例えば レビューを
回すのを1回やると抜け漏れがある から 3回 5回は回してほしいみたいな
のをプロンプトに入れるとする じゃん 例えば 決定論的なスキル
を書くときに そういうのを書く それって 人間がAIのフルトメモリ
がこうだから より良くするために 3から5回って あえていうことで
AIの品質を担保するみたいなことを やってるわけよね 人間が一等的
に それは絶対 AIではできない ことで だから 欲しいステップ
があるならば書く必要は出てくる から ちょっと意味を吐き違えたら
何も考えないAIを使う人たちが 爆増して 申しバイブコーダー
がクソほどできるだけなんじゃない かなって すごい思って
おだしょー 僕もあれなんですよ プロンプトガイドを読み終えた
結果 感じた感想は 特にプロンプト 変わらなくねって思ったんですよ
おだしょー うん うん でも 一部 変えてくれてたよね
おだしょー そう プロンプトガイド に書かれている こういうふうに
書きましょうみたいなダンスがあって それが大体7項目書きましょう
みたいな話をしてたんですよ それが 役割 ペルソナ 目標 成功基準
制約 出力形式 停止ルールみたいな 話で でも それって今までも書いて
たくないみたいな やまちゃんと 似たような感覚を覚えてて 本質
的にはそんなに変わらなくて あとは 人間がどうして欲しいかって
意図も 結局は含めないと ちゃんと ワークしないよねっていうのも
大前提な話かなっていうのは おだしょー そうなのよな マジで
そうなのよな プロンプトって 単なる指示書と思いきや 言葉って
すごい多くのニュアンスを含む じゃん だから 例えばさっき言った
3回から5回ループしてほしいみたい なのもそうだけど ちょっと今パッ
と例が思い浮かばないけど 1行に すごい凝縮された意図が含まれて
て それによって振る舞いが変わる みたいなことっていうのは結構
あるし 俺はすごく目撃するから よくそれをプロンプトにちゃんと
書いといて それを 例えばAIに このプロンプト ちょっと整理して
って言ったときに それをAIが消して くんのよね だから これは消す
なみたいな すごい重要なマジックワード みたいなのがあって 昔でいう
ステップバイステップで進めて ほしいみたいなとこかもしんない
し コード全体を俯瞰してから 始めてくださいみたいなとこかもしん
ないし これってすごい その行動 によって自然とそういうAIの振る
舞いっていうのが決定されていく みたいな 多分な意味を含んだプロンプト
だと思っていて そういう凝縮された ワードを積み上げていくみたいな
のをしないとうまくAIコーディング とかってできないのかなって思って
確かに 本当にそうで マジックワード というか 一言だけでいろんな解釈
をAIに生ませて 幅広く観察をさせる みたいなこと テクニックみたいな
例えば 10個の懸念点を3つ挙げて ほしかったら 3つだけ挙げてください
っていうより 10個ぐらいリストアップ してから それを3つに絞ってください
みたいな言い方すると より
10個は考えるからね 一旦10個考えて そっから絞り込むから 3個考えて
ポンポンポンはい これでいいや って 順列で出てきたやつ出すん
じゃなくて 10個全体出してきた やつの中から 一番良さそうなもの
を3つ選んでくるから 精度上がる みたいなね そういう行動によって
結構質が変わるってあるよね
中田 なんかでも それってやっぱり Xとか見て 確かにでやると 多分
プロンプトの改善ってなかなか うまくできないから そういうとき
にどういうマインドでプロンプト の改善というか その質差を得て
いくと いいのかなみたいなコツ って やまちゃんなりにあったり
するのかなって 今日 気になったん だけど
おだしょー さっきの10個中3つも 始め ディファインコマンド作った
ときに生まれたマジックワード よね
中田 そうだよね
おだしょー うん なんか けど コツか けど 自然とこう振る舞う
だろうみたいなのを思い浮かべる みたいな 自分がお願いされたら
どう振る舞うかなみたいなのを 自分のコースとか リソースの問題
でとかを AIに対しては気を使わなくて いいじゃん だから
中田 確かに
おだしょー いや 本質的には3つ 最適解出すんだけど 10個考えてから
3つやったほうがいいよなみたいな それってけど 最高効率ではない
よね 10個出して3個って だから そこに結構 AIとのギャップがある
ような気がしてて AIって最適解 を出すじゃん 基本的に だから
10個考えるとかってやんないよね 基本的にとか
コンテキスト管理とAIの振る舞いを最適化するテクニック
中田 まあ 最短ルートを行くみたいな イメージかな
おだしょー そう そう 最短ルート を行くんだよね けど 最短ルート
を行かせなくて 高品質になるもの っていうのが プロンプトに入る
ことで 出力が最大化するような イメージはあるかもしんない AIに
勝手にレビューしといてって言って 勝手にやりそうな動きは プロンプト
には埋め込まないみたいな だから 責務協会とかを気にしてとか 観点
をいくつか挙げてあげて 観点10個 ぐらい挙げて その中で重要な観点
5つを選んで そのままレビュー をサブエージェントに依頼して
くださいっていうと サブエージェント 1人に対して5つの観点のレビュー
をお願いするんやけど そうすると コンテキスト効率悪いから 5つの
観点 それぞれ別のサブエージェント を新しいセッションでさせて レビュー
依頼してくださいっていう ちょっと 冗長なんだけども そう言ってあげる
と 全部の観点ごとのサブエージェント が立ってくれるじゃん それって
AIに普通にお願いしてもやっぱり やんないことで こういう普通に
お願いしてもやんなそうな動き っていうのをプロンプトに埋め
込むと 結構 質的変化があるな みたいな印象があるかもしれない
平岡 基本的にやっぱり振る舞い のところ 普通に頼んだらやらな
そうな振る舞いをAIになった立場 として予想して埋め込んでいく
みたいな
三沢 あと 振る舞いを観察する っていう 例えば オープンコード
とオーマイオープンエージェント でシステムを作ってると 既存
のセッションに関連 AIもそういう 意味では最高効率っていうこと
はイコール対打なんで 例えば サブエージェントAにAっていう
タスクをやってもらってました Aダッシュっていうタスクが新たに
出たときに サブエージェントAに 同じセッションにもう一回再依頼
しすんだよね けども 既にサブエージェント Aはコンテキストが50パーセント
ぐらいいってるから 依頼したところ で一回コンパクションを走るから
あんまり禁止的に良くないみたいな ことがあるから
平岡 そうだね
三沢 そう そうすると プロジェクト を始めるタイミングで このプロジェクト
では基本的にサブエージェント を呼び出すときは 新しいセッション
を立てて呼び出すようにしてください っていうと 全く新しい けど その
分 詳細な指示のもとサブエージェント を立ててくださいみたいな感じ
で言うと 毎回 そこはちゃんと 遵守してくれるような新しいサブエージェント
を 新しいセッションで だから AダッシュもサブエージェントBが
やってくれるみたいな状況になる レビューも同じで レビューして
くれて返したら もう一回できました って言って 同じセッションのところ
にお願いするんだけど それだと もうバイアスが効いてるから そこ
しか見えひんのよね そのレビュー エージェントが だから 全くフラット
に見てもらうみたいな そういう ところが結構あるのかな
三沢 まあ 確かに ちゃんと振り 前を観察するっていうのは 結構
重要だよね 僕とか割とサボっちゃ いがちというか いろんなプロジェクト
で複数走らせてると もう投げたら もう別のプロジェクトのコマンド
を打つのに専念してて 動きを全然 見てないけど やっぱりじっくり
見てると あれっていう振る舞い とか あと 今 山ちゃんが言って
たように サブエージェント呼び 出すときに オープンコードの これ
はハーネスの特性なんだけど 過去に 使ってたサブエージェントのセッション
をそのまま使い回すみたいなのが そもそもあったりするから これは
ハーネスごとによって振る舞い は全然違うし だから 埋め込む
プロンプトもハーネスごとによって 変わる話だと思うんだけど
大平 そう 変わるっていう
山本 ちょっとずつ そこは見て どういう振る舞いで どういうふう
にAIがコンテキストを得てるのか っていうのは 確認しながらプロンプト
チューニングしていかないと やっぱり どうやってもうまくいかない
っていうのはありそうで
大平 基本的にコンテキストはクリーン に保つっていうのが 多分 最大要件
だと思ってて コンテキストはクリーン で かつ 目的に必要十分なもの
だけを渡すっていうのが 多分 絶対条件だから 余分なコンテキスト
が入りそうな振る舞いを見せたら そこはサッと差し込むというか
みたいな感じで だから さっきの 同じセッションは使わないみたい
なとかもそうだし どこだったっけ デビンの開発してるところが文章
出してたけど コグニッションが 文章出してたのかな コンテキスト
の腐敗みたいな話してたけど そういう コンテキストの腐敗をさせない
ような コンテキストの腐敗っていう と あれやけど 人間とかもみんな
思うと変なバイアスがかかってる 状態っていうのが 俺はコンテキスト
の腐敗に近い状態かなと思って いて なんで コンテキストは基本
的にクリーンレスを保つっていう 前提で じゃあ どういうふうに
しようかみたいなところが まず 多分 1個条件としてはあって もう
一つは広く観察させるような仕組み それは10個考えて3つ絞って出して
くれみたいなとか そういう あと その観点を出すときも あえて
新しいセッションのサブエージェント に観点を洗い出してもらうみたいな
それはコンテキストが腐敗していない 超フラットに見てくれるサブエージェント
を立てて レビュー観点を出して もらうことで より広い視差を得られる
みたいな その辺が結構 コンテキスト のクリーンレスを保つっていう
のが結構重要かもしれないね 俺は めっちゃ意識してるかもしれない
少なくとも
しばやん そうだよね
おだしょー うん
おだしょー うん
おだしょー 俺 うるさいもんね 阿部ちゃんに
しばやん そうね コンテキスト管理 ね AIと問答はしていけないっていう
原則もあるよね
おだしょー そうそう AIと問答は するな AIと問答が起きないような
指示をワンショットで完璧に出す のが 一番クオリティが高い
仮にAIが問答になりそうな間違った アウトプットを出したら そのアウトプット
を補正する文章を考えて 一ターン 前に戻って その情報追記した上で
投げるっていうね
おだしょー 投げるっていう そう それが一番高効率 高効率って
か 一番 なんか そうじゃないと 結構クオリティ上がんないんじゃない
かなってなんか
しばやん いや そうだと思う 問答 やっぱりやってると さっき話して
たところに引きずられてしまう ことが AIが間違って認識して これ
がゼだと思ったことを 認識改め ましたとはいえ なんかやっぱ残
ってて
おだしょー ちょっと残ってんの よね そう だからそこが人間っぽい
よね なんかちょっと頭の端でこう 引きずられて 後ろ髪引いてんの
よね あいつ
しばやん さっきいっぱい考えた 結果 こうだったんだけどな みたい
に残っちゃってて
おだしょー そう そう だから 初めから自分が導き出しました
みたいな顔をして こっちの求める 状態になってる状況をいかに作り
出すかみたいなのが結構 人と一緒 かもしんないけどね それで言う
と本当に
しばやん AIはリセットできるのが 一番のいいところであるから
おだしょー そうだよね そう だから
しばやん 間違えそうだった リセット して
おだしょー だから上司 部下の関係 で 上司が理想としてる回をいかに
して部下が自分で考え出しました っていうふうにと整合させるから
結構 重要だったりするじゃん
しばやん 確かに そうだね
おだしょー そういうのは結構 大事かもしんないね
しばやん やっぱり導いてあげる のが フロンプトとしても導いて
あげるっていうのは必要ってこと ですよね
おだしょー 結局 バイアスがかかる からね そんな感じですね けど 頭
が良くなったのは間違いないよね 5.5になって
しばやん 本当に冴えてるなっていう のは日々感じるんで 頭良くなった
のは間違いないと思う
おだしょー そんな感じなのかな とりあえず ちょっと あの適当に
何でもオッケーみたいな雰囲気 はやめたほうがいいっていう
しばやん そうだね 短くすればオッケー でもないし
おだしょー オッケーみたいな ちょっと 十分に皆さん 気を付けて
くださいっていう
しばやん でもなんかあれかな モデル が更新されるたびに プロンプト
を一旦 全体的に見直すみたいな のはあってもいいのかなっていう
のは 短くするとかじゃなくて
おだしょー それはそうだね って か 多分 振る舞いとして そもそも
指示出ししなくて 良くなったよね みたいなのがあったりすると思う
から そこ プロンプトは削れれば 削れるほどいいからさ
しばやん そうだね 僕も結構 今回 カスタムコマンドとか エージェント
MDとかも削ったり 追記したりっていう のを 何回か重ねてたりするので
モデルが更新されたら振る舞い とか 特性を見極めて 更新する
作業は たまにリファクタリング みたいな気持ちでやるといいの
かな
おだしょー 確かに 確かにね ちょうど オーマイオープンエージェント
があれだね 15時間前ぐらいだけど 5.5に合わせたプロンプトチューニング
みたいなし直した
しばやん そうなんだ
おだしょー アップデートしてた
しばやん だから 最近思うのが エンジニア
が結局 求められてくのって 今までは コードの美しさを担保しましょう
みたいな話をよく リファクタリング しようとか みんなそういうのに
目を向けられちゃったんですけど コードのリファクタリングとか
割とどうでもいいって言ったら 怒られるんですけど どうでもいい
から プロンプトのリファクタリング みたいなのに注力してるほうは
やっぱり 全体的なパフォーマンス も
おだしょー その結果 コードもクリーン になるっていうね 結局
しばやん そう そう そう そっちに 目を向いててあげるべきだなって
今回改めて感じた
おだしょー 確かにね 確かに 確かに コードのリファクタリング
そこはあえて冗長なことをして AIの動きを こちらからよりいい
アウトプットを出すようにしてる じゃん 人間側の都合じゃん 基本
的には多分それで 効率とかいう よりは 一個遠回りでもいいから
ちゃんとしたものを出せるように っていうのだから そこはやっぱり
人間がやる仕事としては 今のところ は残るのかもしんないね ちょっと
何度かトライしてんねんけど このマジックワード的な語彙に
含まれる多様なパターンみたい なのっていうのを うまく法則化
して プロンプトクリエイトスキル みたいなのに押し込めないかな
みたいなのは 何度かGPTのプロと 問答してやろうとしてんねんけど
なかなかそこはうまくいかない っていう
おだしょー 不思議だよね こんだけ AIが頭良くなった
に さっきポッドキャストの話で 編集の話もあったけど 結局 人間
がこことここに何か関連がある から こう繋げなきゃみたいな
示唆を与えない限り AIは解を出せない っていうのが 若干 今のAIの頭の
良さとギャップがあるというか
おだしょー 多分 超頭いいんだけど 世界に対する
っていうのかな 世の中 現象に対する 理解度が低いんでしょうね 知識
ばっか詰め込まれてるじゃん 基本的に 今のLLMって だから 現象
とか 世界を観察するっていうことは 別にしてないわけじゃん 基本的に
おだしょー まあ そうだね
しばやん うらーっと渋谷でバー って交差点をずっと行き来する
人たちを見て こういう人たちいるんだな みたいな そういうことはしない
わけじゃん 基本的に
おだしょー そうだね
しばやん そう そういう無駄な プロンプとというか 無駄なトレーニング
をしてないんじゃないかなって 逆に
おだしょー 相互作用を考えない みたいな感じ
じゃんかな
しばやん 世界の見え方がまるで わかってない 頭のいいやつみたいな
感じなのよね 多分 AIって
おだしょー 分かるけどね 文章 だけは覚えてるけど 世界は見えてない
みたいな
しばやん そう そう それによって 人がどう動くかとか 世界がどう
変わっていくのかみたいなところ までは 論理的な説明だけはできるん
だけど もっと複雑な相互作用 みたいなところまでは理解できない
みたいなのがあるのかもしれない 理解っていうか まだ考えてない
というか そこが人間に残された フロンティアなのかもしれない
なのかな
おだしょー 唯一の
しばやん そうだね
研究結果とグローバル知識の活用
おだしょー トレーニングなんか なりそうやけど
しばやん 何かできそうな気はする あとはプロンプとも何かしらで
意外と1個1個説明をさせていく ことによってとか あるかもしれない
けど
しばやん ここにきて結構 今まで 研究されてきたものとかっていう
のの価値が上がっていくよね こういう 法則とかが たまにあったり
するんよね こういうことを考えて るんだけど これって論理的に説明
されてる 証明されてる研究とか あるんですかねとか聞いたりする
と 説明されてたりするから そう すると 例えばムーアの法則やったら
ムーアの法則にのっとってっていう だけでオッケーみたいな 言語レベル
に落とし込まれた研究結果っていう のをうまく使うと AIはすでに学習
済みだからみたいな 研究とかそういう のの価値が上がってるよね
おだしょー めっちゃわかる プロンプ と作るとき 結構それやるもん こういう
こと考えてるんだけど 原理原則 だったり 理論とかありますかっていう
と出てくるから そのワードをとりあえず 使う
おだしょー そうそう それそのもの がもうすでに世界に言語化されて
落とし込まれて 世界の現象を言語化 されて落とし込まれてるものである
っていう論文とかそういうのっていう のは だから その辺の価値はすごい
高いよね
山本 確かに高いね
おだしょー すごい価値が上がってる なっていう感覚
山本 上がってる 上がってる グローバルな知識をどうプロンプト
に差し込むかっていうのは結構 ある意味 一つのテクニックになってる
おだしょー それもあるね 最近 だとクエンのASR文字起こしの導入
したりとかしてるって言うやけど 普通にやっぱ これ前回も言った
かな 普通に検索してって言ったら 日本語でやっぱ検索するから 日本語
で聞いてるから そこを中国で 中国語と英語でも調べてみたいな
それはこういう理由だからです みたいなことを言ってあげると
それも冗長なんだけど 重要な プロンプトだよね そういうのが
結構大事だね どう情報にアクセス させるかみたいなところを どう
行動的に誘導してあげるかみたい なのが大事だね
山本 そうだね あとあれだね 今 言ったグローバルっていうのは
検索的なグローバルっていうより かは 多分 概念とかメンタルモデル
として一般的に知られているみたいな 見合いの
大平 そういうことね
山本 そうそう そういうのを埋め 込んであげたりすると 結構 それは
もうすでにインデックスされてる から 引き出して導いてくれるみたいな
のがあるかなと
大平 そこで面白いのが 俺らの常識 じゃないじゃん 世界の常識っていう
観点を持っていないといけない 例えば 俺らにとっては全然意味
わかんない そんな法則あるんだ 聞いたこともないっていうやつ
でも LLMはすでに学習済みである っていう前提があるから そこも
結構 人間側としては ちょっと 頭の片隅に置いておきたいこと
よね 自分の常識じゃなくて 世界の 常識の中でインデックスされてる
もの何かっていうのをちゃんと 探して
山本 そうだね あと気をつけなきゃ いけないのが それが逆に邪魔を
するパターンもあるなっていう のは感じるので 変に監査ログを
埋め込もうとするとか 世界の常識 に従おうとしすぎちゃうときが
あって 逆にそれがネックになる みたいなパターンがあるから
大平 確かにね やりすぎになる みたいなね ちょっとその監査ログ
のことで 最近すごい気づきがあった から その話もしたいね
大平 ちょっと次
山本 なるほどね この間 ちょっと 話した話か
大平 ああ そう そう そう そう あれ 話したいね
山本 分かりました
大平 そうだね 確かに世の中的に 一番固い方向に行こうとしたり
するからね やりすぎじゃん それみたいな
山本 そう そう 世の中にとって 一番問題にならなそうなところ
まで行こうとするから うまく 歯止めしつつ でも グローバルの
チキンはうまく活用するっていう のを意識すると いいプロンプト
になるのかなと
大平 確かに 確かに じゃあ 今回は そんなもんすかね
まとめと今後の展望
山本 はい なんか
大平 いや なんか思った以上に盛り 上がったな
山本 盛り上がった
大平 思った以上に盛り上がった じゃあ ありがとうございます
山本 はい ありがとうございます
おだしょー 本日もAI駆動開発部 の日常をお聞きいただきありがとうございました
いかがでしたでしょうか 今回の 話題はGPT 5.5のプロンプトガイド
をちょっと見て そこについていろいろ 考察であったりとか 議論をしあった
みたいな回になったんですけれども あと 5.5 実際に使ってみてどう
だったかみたいなところも一定 シェアできたのかなというふう
に思っております このポッドキャスト 気に入ってくれた方は いいね
やフォロー 高評価 ぜひお願いいたします それでは また次回もお楽しみください
バイバイ
36:25

コメント

スクロール