1. London Tech Talk
  2. Software EngineerのAIの使い方
Software EngineerのAIの使い方
2026-07-04 1:07:05

Software EngineerのAIの使い方

spotify apple_podcasts

ホスト二人で具体的に二人がどのようにAIを使っているか具体的に話しました。

ご意見・ご感想など、お便りはこちらの⁠⁠⁠⁠⁠⁠⁠ ⁠⁠⁠Google Form⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ で募集しています。メールアドレス london-tech-talk@proton.me にもお便りを送ってください。

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

本エピソードでは、KazとKenが2026年6月現在のソフトウェア開発におけるAIの具体的な活用方法について、詳細なテクニカルな側面から議論しています。KazはSREとして、インシデント情報の分析や仮説検証にGPT-4.5を活用し、開発環境ではPy Coding Agentをターミナル中心に使用しています。一方、Kenは主にClaude Codeをターミナルで利用し、個人開発でも統一しています。両者は、AIツールの選択(Py vs Claude)、モデルの使い分け、パーミッション管理の煩雑さ、そしてAIネイティブなエディターの必要性について意見を交換しました。さらに、Gitコミットの自動化やプルリクエスト作成におけるAIの活用度合い、セッション管理と知識の構造化、ローカルLLMの限界、そしてAI開発におけるトークン消費への危機感と、AIと人間の協業モデルについても深く掘り下げています。特に、AIが人間のブラインドスポットを照らし、新たな発見を促す協業の可能性について、数学者の例を挙げながら考察しました。最終的に、AI時代においても、AIをどう使いこなし、自身のスキルをアップデートしていくかが重要であるという結論に至りました。

AI開発における具体的なツールの活用法
London Tech Talkリスナーの皆様、こんにちは。Kazです。 Ken、今日もよろしくお願いします。
よろしくお願いします。
今日はAIについて話していく感じ。
早速やっていきましょう。僕の持ち込みネタなんですけど、AIで開発するってよく言うじゃないですか。
具体的にかなり細かい話をしたいなと思ってて、AIで開発っていうのは、WhatとHowのとこですね。
具体的に今日2026年6月下旬だけど、この時点でどんなツールの何のモデルを何で使っているのか?
なるほど。
もう一つは、Kazはバックエンドエンジニアだと、プラットフォームよりのことも今知ってるかと思うけど、
コード使ってプルリアックを上げますって言うけれど、その細かいフロって具体的に何やってるの?みたいな。
かなり細かいところをやっていきたい。それがまずメタじゃないか。
ファクトの部分で、それを踏まえた上で、よくAIの話を軽くするときに、AIのレビュー図からで使われるよねとか、
AIスロップがみたいな話するけど、そっちのメタな議論もできたらなと思ってるんだけど、
個人的にはまずツールとかかなり細かいテクニカルな部分とかが結構気になってる。
はい。
背景としては、僕の会社でもAI結構使ってるし、他の会社の同僚と話してもAI使ってるって言うんだけど、
そのAI使ってるって人によって全然、人と環境によって全然、実は意味が違うなんて最近気づいたんだよね。
はいはいはい、なるほどね。
うちの会社に離れて別の会社に行った同僚と話してて、AI使ってる?使ってる?みたいな。
でも具体的に聞いてみると全然違うこと結構やってて、
それを僕らのサンプルじゃないけど、今日は話す回にしたいなと思ってます。
AI関連でもし数が深振りたいネタがあったら全然そこから派生してもいいかなと思っております。
あ、で、かつ会社と個人の開発環境も気になってるよね。
個人でやってたらだけど、やってなかったら会社にメインでいいんだけど。
ということで。
どこから行こうか。
質問がなければ、じゃあとりあえず僕がこういうのやってるよって言って行こうかな。
はいはい。
はい。ということで、リスナーの皆さんもAI使って開発してますみたいな人はいっぱいいるかもしれないけど、
うちの場合は、じゃあ僕は会社と個人の場合から行こうかな。
まず会社の場合は、基本的にモデルはいろいろ使えるようになってるんだけど、
現時点ではGPTの5.5使ってて、
用途によって結構分けてはいるけれども、
僕の場合はSREなのでコードをそんなに書かないっていう前提もあるので、
インシデントのメタ情報を読ましたり、
あとはメトリクスを読ましたりログを読ましたりして、
そこから意味のある仮説を抜き出したり、
あとは僕が立ってる仮説の検証をさせたりする。
コード書く時の話は後でしようかな。
セットアップとしてはね、
社内で結構いろいろ派閥があって、
こういうのはうちは結構人によってよりきれいなんだけど、
もともとはCursorを使ってましたと。
去年はね。
でも最近、その後にクローデの、
クローデAIのCLIに切り替えてVSCodeと使ってたんだけど、
ここ1ヶ月ぐらいはPyっていうコーディングエージェントを使ってますと。
知ってる?Pyって。
いや、聞いたことない。初めて聞いたことない。
PyっていうのはPyコーディングエージェントっていうのがあって、
それにはすごい理由があるんですけど、
Pyコーディングエージェントを使ってます。
これでモデルは自分で選べるんだよ。
クローデのモデルをOpus使ってもいいし、
ローカルA11使ってもいいし、
基本的にインターフェースとしてはPyをヘビーに使ってて。
自分でPyのエクステンションっていう風に書くと、
結構いろんなことができるんだ。
プラグインみたいな感じで。
社内の人が開発したエクステンションもあるし、
自分が自分のユースケースに特化したエクステンションもあるし、
それをミックスアップさせて使ってて。
でもそれ全部ターミナルで完結してる。
だからターミナル離れることがほぼない。
ターミナル経由でも。
っていう感じで、
一応表装レベルではそんな感じでやってますと。
家の開発はやってることを共通化したいので、
家でももうPy1本でやってて、
側ですね。
UIとかUX、
側は全く一緒。
唯一の会社と家の違いはモデル。
ここが結構悩みポイントでもあって、
会社では本当に高いモデルをバカバカ使えるんだけど、
家ではそんなことにいかないんだよね。
会社で使えるモデルと同じぐらいの量を毎日使うと思って、
本当に破産してしまう。
破産はしないかもしれないけど。
本当に個人のお小遣いが消えてしまうレベルなので。
今はいろいろ試してるモデルをね。
今はローカルでモデルを動かしては見てはいるんだけど、
Hugging Faceっていうところからいろいろ試して持ってきて、
ローカルで動かして、
側としてはPyを使って。
個人開発では結構コーディングする?
ゲームアプリ開発とか、
あと自分のブログを回収したりとか、
あとちょっとしたCLIを書いたりとか、
あとフィナンシャル計算アプリ作ったりとか、
いわゆるスクリプトを書くことが多いね。
っていう感じでやってます。
一旦側はそんな感じ。
どうしようか。
数の紹介に入ってもいいし、
突っ込みたいところを突っ込めてもいいし。
じゃあ自分からやってみようか。
Py Coding AgentとClaude Codeの比較とAIネイティブエディター
自分はほぼCloud一択かな。
CodeXを途中で使ってた時もあるけど、
これ会社の話ね。
CodeXを使ったりCloudを使ったりだったんだけど、
今はほぼCloudコードをターミナルでずっと使ってる。
エディターはVSCodeを使ってるんだけど、
VSCodeでCloudコードを使うこととかはほぼなくて、
同僚でプラグインエクステンションか何かで使ってる人もいるんだけど、
ほぼ自分はターミナルでCloudコード一択かな。
個人開発も合わせたいっていうのが、
前はChatGPTを使ってて、
それでCodeXも個人の開発で使うときはそっち使ってたんだけど、
なんとなくCloudをChatGPTから切り替えて、
個人開発もCloudコードに最近。
統一してるかな。
あとケンが言ったようにモデル。
個人開発だとエディターで自分で書くことも、
もちろん節約のためにあって、
全部AIにやらせてるかっていうと結構違うんだよね。
自分でやれるところはそこは自分で書いて、
クロードコードにレビューしてもらうみたいなことが多いけど、
会社だともう全部クロードコードに任せっきりで、
基本的には。
簡単そうなタスクはオーパスだっけ。
別にそんな高くないやつ使って、
会社では難しいタスクというか、
オーパスがいまいちだなと思ったときは、
モデルを高い方に切り替えてやってもらうみたいなことかな。
最近ちょっとトライし始めたのが、
ほらプランモードってあるじゃん。
クロードコードでさ。
ちょっとプランモード怪異的だったんだよね正直。
これ何がいいんだろうみたいな。
インタラクティブにやった方が自分で、
クロードコードがやってきたことを自分で見て、
ここまでやったんで次はこうねみたいな、
ステップバイステップでやる方が好きだったから、
プランモードの良さっていうのは分からなかったんだけど、
同僚をしてるからプランモード試してみるかみたいな感じで、
ちょっと様子出る。
何だっけな、エクステンションがあったんだよね。
エクステンション?クロード?
クロードコードのプランモードを使った時にフックして、
もうちょいUIビジュアライズで、
なんだっけな、プランモードで出来上がった、
クロードコードがやったことを何て言うんだろうな、
ブラウザーかなんかに見せてくれるのかな。
それに対してインラインでコメントとか書けるわけ。
プラン書いてくるときはMDファイルマークダウンじゃん。
だからいちいちここはこうこうこうって、
ターミナルで書くのは面倒というか、
より良いインターフェースがあるよねっていうことで、
プランクインが解決するのがインラインで、
ここはこうしてほしいみたいな感じで、
GitHubで書いてきたプランに対して、
インラインでコメントが書けたりみたいなんで、
サブミットしてより良いプランを作っていく、
みたいな感じのエクステンションを試そうかな、
みたいな感じだけど、
自分のタスク的にそんなにすごい大規模なことを、
プロダクト開発とかしないから、
あんまりプランモードの良さは分かってないし、
使う用途がないことが多いっていう感じかな。
はいはいはい、なるほどね。
ちなみにプラグインは内製?
それともパブリックの、
マーケットプレイスとかあるみたいだけど。
そうそうそうそう、
マーケットプレイスから入れたような気がするね、
名前なんだっけな、
クイックリチェックはできるんだけど。
なるほどなるほど。
いいね。
お互い一通り表装何使ってるか出たところで、
もう深掘りしたいところいっぱい出てきたんだけど。
はいはいはい。
じゃあまず、
分かりやすいところで言うと、
僕がPiを使って、
カズラ、クローデを使ってるみたいなところに行こうかなと思って、
じゃあプランモードの話してるけどさ、
Piのすごい特徴っていうのはね、
すごいミニマルなんですよ。
設計思想として。
はい。
Pi.devなんだよね、
ホームページがね。
そこに行くと、
もうMCPサーバーも書けません、
プランモードも書けません、
サブエージェントもいませんみたいな。
特定のToDoもありません。
これはもう本当にクローデとか意識してるんじゃないかなと思って。
クローズとかって僕の印象としては、
ネイティブにいろいろ持ってるよ、
それこそプランモードとかToDoモードとか、
なんかいろいろ持ってるけど、
Piエージェントは自分でグリップさせる人向け?
みたいなことしてて。
で、
僕もクローデコードとVSコード使ってた時期があるんだけど、
プランモードはね、
ほぼ使ったこと。
検証としては使ったことがあるけど、
プラクティカルに使ったことはない。
多分理由としては数と一緒で、
SREだったから、
なんかその大規模な開発?
プルリクが何本に渡って、
2,3週間に渡るような機能開発はしないから、
プランモードは使わなかったね。
っていうのがあるんだけど。
だから個人的にユースケースでは、
クローデのプランモードとかいらなくて、
あともう一つの違いは、
クロードってさ、
結構そのパーミッション聞いてきたりしない?
これを実行していいですか?
これを実行していいですか?みたいな。
ボタンポチポチして、
これOK、これOK、これダメみたいな。
あれが結構ウザい。
ほう。
PyCodingAgentはノーパーミッションポップアップなんですよ。
だからもう基本的にバイブコーディング。
全部、じゃあデフォルトで、
ファイルを消すとか、
例えばRMをやって、
自分のパソコンのデータが消えちゃったみたいなのとか、
本番データが消えちゃったみたいなのある?
聞いたことある?
それもデフォルトでONってこと?
そうなの。怖いでしょ。
やろうと思えばできる。
なるほど、なるほど。
ハーネスエンジニアリングのポイントもあるけど、
アウトオブザボックス、
箱から開けて出てくるものは何もない。
自分でハーネスエンジニアリング設定してねっていう。
設計思想が別なんだよね。
クロードはダウンロードして使ったら安全に使えるような。
オピニオネイティッドのフィーチャーも入ってる。
PyCodingAgentのほうは何?
何も付いてないダンボールの箱みたいな。
自分でカスタマイズしてねみたいな。
だからもちろん社内内製のPyのエクステーションがあって、
危険なことはできないようにっていうのはあるけど、
逆に言うと誰かがそれをしないと、
例えば家でPyCodingAgentするときに、
もしかしたらテラフォームデリートしてしまったりとかね、
自分のインフラを。可能性はあるかもね。
そこは大きな違い。
AIツールの利用における不満点とセッション管理
そこは社内で統一のPyのコンフィギュレーションとかある?
ない。統一っていう言い方で言うとない。
社内の人が作ってるレコメンドのエクステーションはいっぱいある。
なるほどね。
うちは基本的にセキュリティチームの認可を得たソフトウェアであれば、
自由に使っていいから。
だからPyをみんな使ってるわけでもない。
なるほどね。
数と同じセットアップの人もいっぱいいるし、
さっき出てきたコーデックス使ってる人もいる。
なんかそれで言うと今のクローでVS Codeの開発で、
なんか不満あるのかなっていうのを聞いてみたい。
細かい不満でもいいし、ストレスポイント。
ストレスポイント?
ポップアップとかがうざいって思ったことはない?
なんか開発の速度が遅くなるなみたいな。
いや開発の速度が遅くなる。
まあまあまあまあ確かに聞いてくるのはうざいけど、
なんかさ、ほら学習してくれるじゃん。
クロードコードもさ、なんか1回このディレクトリでOKすると、
それ以降は同じディレクトリ、
リポジトリであればもう聞かなくなるみたいなね。
アラオリストかな?
そうそうそう、アラオリストとかディナイリストとかさ。
最近非常に困ったのが、
会社のパソコン新しくなったんだよ。
切り替えたら、
そう、いちいちいちいち全部聞いてくるなと思って、
クロードで新しいパソコンに切り替えて、
全部いちいち聞いてくるからすごいなんか、
今までこんな聞いてきたっけ?みたいな風に思ったんだけど、
ああそうだそういえば、
クロードのコードのセッティングファイルを
ちゃんと移行しないんだと思ってさ、
自分の新しいパソコンのセットアップスクリプトあるわけよね。
でもそこに含まれてないわけ。
ああ、それか。
ああ、これをちゃんと自分も移さないといけないんだっていうのが気づきかな。
だから、秘伝のタレがもうなんか積み、
自分の気づかないところで積み上がってて、
ある程度なんか、前のパソコンだったらコンフタブルだったわけ。
もう、これはしてほしくないよね、
これはしてもいいよみたいな感じでさ、
出来上がってたわけ。
そういう意味で言うと、
最近はちょっと、
え、これも効いてくるの?とか思って、
まだパソコン、
レイゼネスでちょっと移行しないだけなんだけど、
それが、まだ新しいパソコンには知識が積み上がってないから、
うざいかなとは思う。
なるほどね、それは面白いね。
なんかJSONファイル作るんだよね、ローカルにね。
レポごととグローバルの空間。
そうそう、グローバルとかね。
メンテしてたわ、コマコマと。
メンテがめんどくさかった。
チェックインってGitにコミットする用のJSONファイルと、
コミットしない用のJSONファイルがあって、
名前忘れちゃったけど、
cloud.local.jsonっていうのは多分、
学習していくって数が表現したやつで、
そのlocal.jsonがどんどん作られるんだよ。
それと別にチェックインするように、
cloud.setting.jsonだったかな?ってのを作って、
2種類のファイルが存在して、
それをマージされたアローレストとディナイレストに沿った開発というか、
プロンプト体験ができるみたいなやつで、
だから僕もクローデ使ってた頃は、
クローデでやり取りすると、
アローレストがどんどん増えてくるじゃん、
僕がクリックするために。
これはいいよ、これはいいよみたいな。
結構面白いのが、
URLの情報を取得するときに、
ドメインごとに効いてくるんじゃない?
僕の場合はそうなのか分かる?
例えば、
openai.comのこのドキュメントの情報をもとに、
いい感じのスキルを作ってくださいとかやったときに、
じゃあopenai.comは見たことがないので、
アクセス権限許しますか?って一回許すと、
ローカルにドメインが記録されて、
でも見たいドメインってもう100個も200個もあるじゃん、開発してると。
ここのドキュメントページ、ここの開発者ページみたいな。
だからドメインリストもどんどん増えてくから、
苦労でのスキルを作って、
1週間に1回実行させて、
ローカル.jsonのものをいい感じにシュッとさせて、
僕のチェックインさせてるjsonファイルに
マージさせるっていう謎メンテスキルがあった。
そうなんだ。
それさえも面倒くさくなったから、倍に。
それなんでメンテしてたの?
ポータビリティというか他のパソコンに使用とかがあったわけ?
それとも癖というか、
綺麗にしときたいなみたいなのがあったわけ?
ビジビリティかな?
ローカル.jsonファイルが無制限に非大化してって、
結局自分は何をアラウしてて、
何をディナイしてるのかよく分かんなくなってきた。
だから週1で、
あれ結構引数ごとに作ったりするから、
アーギュメントね。
アスタリスクでまとめられとかをまとめたりして、
結局ハーネスエンジニアリングのあれだけど、
自分がLLMに何を許してて何を許してないのかっていうのを明示化しようと思って明示化してたんだけど、
途中であんまり効果を感じなかったんで、
辞めましたね。
で、辞めたときに基本的にじゃあもう、
そんなディストラクティブな行為しないから、
最低限のハーネスだけ入れて、
あとは全部もうヨロでやらせようと思ったときに、
クローでは結構あんまりうまく機能しなかった。
僕のユースケースの場合。
なるほどね。
コードもそんな書かないから、やっぱりリーダブルな操作が多いからさ、
メトリクス取ってきて、ログ持ってきてみたいな、
ライタブルな行為ほぼしないから。
で、そのパーミュレーションと別のレイヤーでブロックされてるんだよね、なんか。
だから、そこでブロックしなくてもそんなにディストラクティブなことに起きないっていうのがあって、使ってた。
はい。
そっか、じゃあ今んとこはその学習させる以外の不満は特にないっていうところで。
そうだね。
あとさ、僕もVSコードとクローで、
クローでコードはだからターミナルのCLIとしてだよね。
そう。
それの問題は、僕がやったときの僕の問題は、例えばクロードコードでマークダウン作ってとか、
インデックス.ts作ってとかって作らせて、出してきた結果がありますと。
で、なんかしょうもないところ直したかったりするじゃん。
例えば、ここいらないな、このコメントいらないなとか、
あとは何だろう、このファンクションネーム気に入らないなって時に、
僕は手癖でVSコードもしくはVimからピュッと直しちゃうんだよね。
でもそこで直すと、そのクローでコードのセッションは僕が直したって情報知らないじゃない。
なるほど。
知らないから、例えばクローでコードのセッションに僕が直したということを伝えないで、追加の要件を伝える。
例えば、はい、インデックス.tsを書いて、パーって書きました。
で、僕はそれを見て、なんかここ気に入らないなってちょっとクリーンアップして、クローでセッションに戻りますと。
で、クローでセッションに戻って、はい、じゃあ次のファンクションを書いてくださいって言った時に、
僕が手で入力して、かつクローでに与えてないコンテキストの情報を全部ワイプアウトして、もう1回書いてくることがあったんだよね。
なんかそんな経験ない?
あるあるある。
だからそれを対策するためには、すべての編集をクローで、クロード経由にする。
だから、ただコメント消すだけとかファンクションリネームするだけなのに、わざわざクロードに、自分だったらもう一瞬でできるのにわざわざクロードに書いて、
レスポンス待ってっていうフィードバックループ、すべてのコンテキストをチャットにまとめなきゃいけない。
はいはいはい。
買ったんですよ。もっと上手いやり方だったかもしれないけど、なんかそれがもう本当に面倒くさかったんだけど、
そこのエディターはVSコードで、チャットはクロードコードで分けてるけど、そこはそんなに不満はない?
いや、自分はその絵に関してはね、やっぱりAIネイティブなエディターが今必要なんじゃないかなと思ってる。
おー、AIネイティブ。一緒だね。
それがカラーサーなのかどうか、あんまり使ってないからカラーサーがそれをできるのかどうかわかんないけど、
だってさ、今って基本的にはさっき言ってないけど、基本見る線なわけよね。
AIが書いたコードをほぼ書くっていう作業はなくなってきた。業務の中では。
デビューする側になってるんだよね。さっき言ったように細かいところは修正するようになっていく。
自分で修正したりとかするんだけど、ケンがおっしゃったように、そのコンテキストはAIに渡されないから、小さい細かいところでも。
そこで、個人開発だったら無駄にトークンを消費するわけじゃん。でもコンテキストは渡されない。
トークンはセーブできるけど、コンテキストは渡されないみたいな状態になるわけじゃん。
自分の場合はターミナルで基本的にそういうAIとのコーディングをやってますと。
そしたら、VSコードみたいな、ヘビーウェイトなエディターとかもいらないと個人的には思ってるわけ。
むしろ、でもちょっとした編集もできるといいかも。でも基本ビューワーなんだ。エディターじゃなくてビューワーになりつつあるんだよね。
AIと協調して、ターミナルも色々と制限はあるじゃん。基本的にはチャットなわけじゃん。
チャットだからここを編集してほしいってちょっとやりづらいよね。何個かやってきて、色んな作業やってきて、ここをちょっと周辺してほしいみたいなのがあって、
こことこことここみたいな。複数個ある場合ちょっとチャットでやりたい。
そこを解決する新しいAIネイティブなエディターか分からないけど、そういうのが出てくるんじゃないか。
あるいは出てきてもおかしくないなと個人的に思う。そういうのも。そういうのも。
AIとも喋ってた。
すでにあんのかな、そういうプロダクト。リスナーの方で知ってる人がいたらぜひ教えてほしいんだけど。
カーサー途中で使うのやめたから、もしかしたらカーサーがそういう方向に進化してんのか知らないけど。
そうなんだよ。ビューワーっていう指摘は本当に鋭くて、僕ももうビューワーとしか使ってないから、
結局VSコード最近ほぼ、Piコーディングエージェントへの移行に伴ってVSコードほぼ使わなくなった。
全部VimとGlowっていうターミナルのマークダウンビューワーがあって、GLOWっていうのがあって、もうそれだけだね、ビューワーして。
ファイル検索とかもさ、もうターミナルのFZFっていうやつが、Fuzzy Searchみたいなのがあるんだけど、
もうそれで十分に動くし、あとはGitのDiffとかじゃん、見るのって。
僕の場合は少なくともそうだから。
VSコードいらないね。
そうそうそうそう。
あとGitのDiffとかもさ、もうちょいGitのDiffってもう慣れてるから使ってるけど、もっといい、このAI時代にさ、もっとDiffもさ、
AIがこうやったよみたいな風にできてる。できた方がいいじゃんとか思うから、そこも補完してくれるようなエディターが出てくるんじゃないかなみたいな風にずっと考えてる。
Diffはじゃあ今どういうフローで見てる?
だから僕はパイコーディングエージェントの中でパイのセッション開いて、基本使い勝手とはクローデコードのターミナルと一緒なんだけど、
ターミナルの1パネルがインタラクティブなセッションになってて、そこで変更してって言って変更されたら、別のGシェルに行ってGit Diffって言って、
見慣れたGit Diffの画面でDiffを見て、なるほどここ変えたねって言って、
でまたパイのセッション戻って、ここ気に食わないか直してみたいなやってるんだけど、数も似た感じ?
全く同じ。これさもうなんで。ちょっとね、効率的なのかなみたいな風に。完全にはAIのやった、自分はGitコミットは許してないわけ。
へー。
AIにさせない。
はいはい。
コミットする前に見たいんだよ。自分個人的には。
なるほど。はいはいはい。
まあGit Addぐらいまでは許してるんだけど、コミットまでは許してないわけ。
だから、うーん、そうだね。なんかそこ、それを見、AIがやった、見ます、レビューします、自分で。
で、コミットメッセージも自分で書くことも多いからさ。
うーん。
そこまでもね。まあAIにやらせることもあるんだけどめんどくさい時は。
うんうん。
ここはなんか自分の文章を書く、自分が理解したっていう文章で書きたいから。
だからちょっとAIさ、あれじゃん、情緒な文章書いたりするじゃん。
うーん。
だから、うーん、そうだね。うーん。
まあそのGitDiff、AIがこうしましたよっていう作業を見れるもの、ツールがもっと出てきてもいいなとかって思う。
なるほど。
Gitじゃないもの。
そうだね。
なんかそのコミットする、自分がするかしないかっていうのが面白くて。
僕はもうコミットまでさせてる。
はいはいはい。
なんならプッシュもさせてる。
うんうんうん。
あの、もちろんマスターにプッシュとかそういう意味じゃないけどね。
ブランチ切ってプッシュさせて、プルリクも出させてる。
うんうん。
プルリクのタイトルとディスクリプションも書かしちゃってる。
はいはいはい。
で、ドラフトで出して、で、ドラフトから、まあGitHubの話だけど、GitHubの場合はプルリクにドラフトとパブリッシュドっていう概念があって。
はいはい。
パブリッシュドにすると、CIがフルで走ったりとかレビュアーがついたりとか、まあ他の人が見たときに、あ、これはレビューレディなんだなみたいな。
そこだけ僕やってる。
なるほど。
で、そこでコミットとか気に食わなかったら、なんか勝手にフォースプッシュしてくれるんで、なんかもう、コミットすらしなくなった。
はいはいはい。
レイジー。
そう。だから僕の確認ポイントは、プルリクをパブリッシュするかどうかになってる。
まあ、もしかしてやってるものの流度も違うのかもね。
例えば僕とかだったら、2,30ファイルにまたがる、例えば、ペイメント機能開発とかじゃなくて、なんだろうね。
うん。
なんかBotが来たから、テラフォームのコンフィグファイルいじって新しいレートリミット作ってとか。
はいはいはい。
だからなんかもう、プルリクが3,4コミット以上になることはあんまないことをしているから。
うんうん。
なんかそれでいいのかもしれない。
はいはいはい。確かに。
もうちょっと機能開発だったらそういうことするかもしれないけど。
うんうんうん。
うん。そう、やってる。
なるほどね。
いやなんか、自分の中ではちょっとした脅迫観念じゃないけど、Gitのヒストリーをちょっと綺麗にしようみたいなところがまだあるから、どんだけ気にしてるんだよっていう話にもなるけど、他の人がね。
うん。
なので、いまだに手癖で意味のあるGitのコミットのチャンクを作るっていうか、この機能を入れましたよって。
でもなんかいろいろやってみてそれがうまくいかなかったら、そのGitのコミット自体をちょっと変えてみたいなことをやって、
なんかこう見た目綺麗なプルリクを作ってプッシュするみたいなことをやるんだよね。
だからそこにAIに完全に任せちゃうと多分こう、積み上がった試行錯誤のあれが積み上がったGitのヒストリーになって、プルリクが作られる。
まあ、そこがちょっと嫌だっていうところだけかもしれない。
あー、なるほど。多分、カズと僕に共通してるところが一個あって、このAIが出してきたものから、何その、カズの場合Gitのコミットの綺麗さっていう表現をしたけれども、
このAIが出してきたものを自分の中に落とし込んで学習するプロセスの違いだと思うんだよね。
例えば、カズの場合はコミットを自分の頭で考えたコミットメッセージにするというプロセスを通じて、
AIが出してきたことの差分の本質を理解して、綺麗なコミットメッセージを出すというアウトプットが、
すなわちそのAIが出してきたことを自分の学習として落とし込んでいるプロセスだと思うし、
僕の場合はプルリクまで完結させて、一つの課題をソリューションとして全て落とし込むっていう最終形を見て、
それを読んで、AIが出してきたことを僕の場合はコミット単位で読むというよりは完成形をハイレベルで見て、
ハイレベルでこいつは僕が与えた課題を解いているのかみたいなものを通して、
AIがやってきたことを学習している。それで自分に落とし込むんだけど、
学習プロセスの違いに過ぎなくて、ギットコミットするかどうかっていうのはあくまで表面的な違い。
自分の今までのやり方として、どこでそのAIがやってきたことを自分の中に分解して落とし込むかみたいな違いしかないのかなと聞いてて思った。
なるほど。
だから多分カズもそうじゃない、自分が納得しないコミットメッセージは入れないみたいな感じでやってるわけでしょ。
確かに。
そうだね。
あと、AIを使うことを学習のひとつのプロセスとしてる、自分は。
AIがやったこと、例えばこれを何も見ずに別に作ってプッシュしてできましたよと、成果すべてをAIに任せて出してもいいんだけど、
多分その中でまだプラットフォームでいろんな学びの機会があると思ってるから、
なんでこうしたんだろう、ああしたんだろうっていうのをちゃんと理解したいっていうのが確認の作業の中で入ってるような気がするね。
なるほどね。
そうですね。
トークン消費への危機感とAI開発の未来
それは同じですわ、僕も。
で、例えばその機能を開発するときに、分かんないアルゴリズムを出してきたり、分かんない機能を使って出してきたときに、
こんなやり方があったんだみたいな気づくこともじゃあよくある。
たくさんあるね。
で、なんかそこでやったチャットのLLMのやり取りで、なんかマネージしてる?
なんか質問がよくなかったかな。
例えば、クローデってセッション作ると思うんだけど、
新しくクローデコードを作ったら新しいセッションができて、
セッションがどんどん溜まっていくと思うんだけど、
なんかそのセッションってなんかこう構造的にマネージしてたりする?
例えば僕だと、AIのセッション使ってるとモデルが何であろうとセッションが作れて、
セッションにちゃんと名前をわざわざつけて、
例えばこのセッションはVimのセットアップヘルパー。
このセッションはインシデントナンバーのフォローアップ。
このセッションはスタッフエンジニアだるだるとのワンオンの深掘りみたいな感じでセッションつけて記録してる。
で、かつ例えばそのアドホックに終わるセッション、
インシデントナンバーのラップアップとかだったら、
インシデントの例えば1週間終わったら、
インシデントのラップアップまでしたらもうそのセッションはいらなくなるんだよね。
だからそのセッションを消すんだけど、
消す前になんかそのここで僕が学んだことをメタ的にマークダウンにストラクチャルに出して、
マークダウンに記録するっていうスキルがあって、
ラップアップって呼んでるんだけど、
それは僕が事前に作ったフォーマット、
TLDR、僕が学んだこと、僕がそのチャットのヒストリーでうまくできなかったこと、
とかをマークダウンにしてアーカイブフォルダに入れるっていうのをしてから、
チャット全部書く。
それはなんかそのセッションのチャットとのやりとりの僕の学習のコンプレッスドバージョンみたいなのを
マークダウンに出力させて入れてるんだけど、
これ結構ね個人的に好きなワークフローで、
チャットとのやりとりって結構乱雑になったりするじゃん。
分かる?僕はなるのなんかこう、
質問があっちこっちいったりとか議論があっちこっちいったり。
で、なんか後から見直して、
あのどこのセッションでなんかこのアルゴリズムのことやったなとか、
このインシデントパターンでやったかなって、
探すのがめっちゃめんどくさい。
なんかもうセッションをぐーっとスクロールアップして、
なんか見つけられないことがあったから、
なんかそのセッションのやりとりを構造化された知識みたいな、
マークダウンにファイルとして出力すると、
その個人知識レポジトリのグレップでも検索できるようになるし、
あと別のセッションからそれを参照できたりするんだよね。
例えば、インシデントAのラップアップ終わった時に、
インシデントBのやり始めてたら、
あれ、昔にラップアップしたインシデントと似てるなって言って、
そこでその昔出力させたマークダウンを読み込まして、
こことの類似点を叩き出せっていう、
みたいなそういうクロスセッションのやり方ができるから、
なんかそのセッションマネージは割と今力を入れてやっているんだけれども、
なんかカズの場合はどういうユースケースかなと思って。
それ欲しいね。
いや、やってない。なんも。
もう疲れ捨て。
やってなかったらオススメ。
そうそう、疲れ捨てやったんだよ僕も。
なんか時々さ、ない?
昔このセッションでLMとなんかやり取りしたな、あれなんだっけみたいな。
あるある。
僕はよく会ったから、それをやってる。
うん、そう。
ちょうどオススメです。
まとめておきたいなと思うね。
なんかやっぱプロジェクトもさ、
タスクも結構つながってるようなタスクも結構あったりもするからさ、
過去にこれやったからこれやってみたいなところもあって。
でもその場合だとさ、
多分Gitのヒストリー見てこういうことをやったんだけどみたいな風になって、
そこで聞くとなんかトークンを消費してさ、
AIにとっては思考時間っていうのはこう、
位置から探すわけじゃん彼らは。
でもそこに過去の知識のためてる場所があるとさ、
すごい。
トークンの消費もあれだし、時間的にもそうだし、
自分の知識としてたまっていくんだよ。
それいいね。
おすすめ。
マネしよう。
ぜひぜひ。
あと今言ったけどトークンの消費、
トークンの消費どこまで気にしてますかっていうのをちょっと聞いてみる。
ゼロ。会社はゼロだよ。
いやなんかこれねちょっと危機感持ってるわけ。
危機感持ってるっていうのはなんかやっぱ会社の方針にもよるだろうけど、
会社によってはさ、
必ずしもトークンの消費とプロダクト開発の利益とかそこら辺が相関してないっていうのがニュースとか見るわけじゃん。
だから個人個人のトークン消費というかバジェットを今までよりタイトにしましょうとかってニュースが出てきてる中で、
自分も気にしないといかないのかなとか思うわけさ。
もちろんさ、しかも個人開発するときはさ、気にするわけよそれは。
そこはね。
インターネットで見るときも結構そういうのを議論してるディスカッションとかよく見るわけ。
どうやったらトークン消費があれかとかさ。
でも今のところ自分の会社の会社でやるときは全く気にしてないから。
ナイスタイミングですね。
多分AI開発で一番話したいトピックがあるとしたら実はそこなんですよ。
僕も全く同じ結果を持っていて。
多分僕の会社も現時点によってAIに個個人の開発者に割く予算としてはかなりアフォーダブルというか優しい。
いっぱい使っていいよっていう方だと思うんですよ。
だけどおっしゃる通り危機感がやばい。
だって会社でできる環境を家で整えようと思ったら本当にできない。
あともう一つ危機感を持ったきっかけがあって、この前別の開発者と話してたときに面白いアナロジーを使ってる人がいて、
AIってドラッグっぽいよねみたいな言ってる人がいて、
ほうほう面白いと。
これはどういう意味かっていうとですね、
今って割とAIができたてのところで、
AIができたてってちょっとおかしいか。
AIを普段の開発で使いやすくなって、かつ投資の資金も流れてて、
フレーミアムプランとかも各スタートアップが提供しやすくて、
割と雑に安い値段で使えてるじゃない。
一方でデータセンターの枯渇とか、
あとは電力供給の問題とか、
あとトークン数に対する金額の向上とかが出て、
あと会社によっては例えば1個人開発者あたりのトークンのバジェットが決められたり、
この前Uberもお話になってたかな、Uberテクノロジーとかも出てきたりして、
トークンをどれくらい上手くちゃんと使ってるかっていうのを意識せざるを得ない、
どんどんどんどんタイトになっていくときに、
今まではエントリーレベルはすごい楽だったわけ。
使うと生産性上がりますよみたいな。
使うと痩せますよじゃないけど。
ぴゅーって使い始めて、
どんどんどんどん使えば使うほど日常の開発業務にすごい依存性が高くなってくる。
これがないと生きていけないみたいな状態になったときに、
はいじゃあ値段100倍ですって言われたときにあなた払えますかっていう。
だからトークン数の意識とかトークン数を削減するっていう、
パフォーマンスエンジニアリングっぽいなと思うんだけど、
そういうのもすごい大事だなっていうのは本当感じてます。
トークン数を削減するミドルウェアとかも結構出てるしね、今だとね。
僕もこの前ENOに入れたけど、
多分色々あるけどこういうのって。
僕が入れたのはRTKっていうツールで、
それは確かラストベースかな、
Piのエクステンションとかも提供してるんだけど、
やってることは割とシンプルで、
Gitコマンドとか発行するときに、
よりLLMコンプレッドなトークン数を消費しづらいように空白削減したりとか、
あとは情緒なものをもうちょっと削減したりとかっていうやつだし、
なんならもうちょっとこうLLMコンプレッドバージョン、
バイナリーみたいなところまで議論してるところとかもあったりするし。
なるほどね。
それがスタンダードになっていくのはすごいメイクセンスだし、
今のうちに意識した方がいいなと思って意識してる。
甘えちゃいかんと。
確かに。
そうだね。
多分、自分は制限されるまで気にしないと思う。
このままだと。
会社でやってる潤沢な開発手法が個人開発でできないって、
でも割と深刻じゃない?
まあ確かにね、確かに。
そこで違うノウハウが溜まっていくからさ。
そうだね。
そういう意味では個人開発で使うっていうのもいい練習というか、
意識にはなるかもね。
うまく使うじゃないですか。
そうだね。
そうなんですよ。
なんか、ローカルのLLMを試してるの最近。
自分の自宅パソコンで。
はいはいはい。
全然ダメだね、クオリティ。
使ったことある?
使ったことはないけど、なんか想像はできるかもしれない。
びっくりした。こんな違うの?と思って。
僕のMacBook Proは今24GBのやつだから、
特にアドオンとかしなかったから、
まあ16、7GBぐらいはモデル使ってもいいかな。
それに1GB、1GBのKVキャッシュ乗せて、
20GBいかないぐらいすれば、他のアプリを制限すれば、
開発専用機として使えるかなと思ってやってるんだけどさ、
会社でコンテキストームがほぼ1MBぐらいあるGPD 5.5を使ってるからさ、
なんかもう、何?運命の差すぎて。
だからさ、会社ではレポジトリ渡して、
アーキテクチャのダイアグラム作らせて、
ハイレベルに理解した後でプラン渡して、
これ作ってってやったらもういいものができるんだけど、
自宅ではわざわざ関数ごとにブレイクダウンして、
この関数を作るみたいな。
で、関数を作ったらそれをビームでコピペして、
はいじゃあ次これみたいな。
なんか何こう、びっくりするぐらい開発手法が今違うんすよね。
家と会社で。
でもじゃあ会社でトークン数をかなり意識した、
自宅レベルのものまで落とすかっていうとそれも違う。
なぜかというともうリーダーシップからのメッセージも違うし、
なんかそんなこと言ってたら同僚に置いてきぼりされるだけなので、
会社で求められているレベルの期待値とツールを
潤沢に使って成果出すしかないよね。
でも家じゃそれができないし、
したところでその何、
利益が入ってくるわけでもないから、
なんか全然違うノウハウを学んでる気がして、
なんかこう悶々としてる最近です。
オートリサーチとAIとの協業モデル
最近MLエンジニアの人とも喋ったんだけど、
最近のAIの大統領、
急速な発展で、MLエンジニアとしてもやることが変わったって言ってた。
どう変わったの?
昔、ChatGPTとかそういうのが出てくる前は、
MLエンジニアっていうのは自分たちの会社で、
そういう作る、いわゆるAI、
何かの分野に特化したAIを作るみたいなことをやってましたよと。
でもChatGPTとかフロードコードとか出てきて、
運命の差、まずデータ量も全然違うし、
速さ、どれだけ処理して、
コンテキストもどれだけ消費できて、
すごい良い結果が出てきてくるから、
MLエンジニアとして、
自分たちの会社で作ってたものって、
もう遅すぎるし、自分たちで作ってたもの、遅すぎる。
もうそこに敵わないっていうので、
自分のキャリアをどうしようとか、
MLエンジニアとしてもキャリアは変わってて、
もちろんそういう、作ってる会社はまだあるわけよね。
クロードAIとかChatGPT、オープンAIみたいな、
作ってるところもあるし、専用のところを作ってるところもあるけど、
MLエンジニアとしての仕事っていうのは、
既存にある、例えばChatGPとか、
APIを公開してるわけじゃん。
MLを叩いて、結果が返ってくるかみたいなのとか。
そこにちょっとMLエンジニアとして、
エンハンスするみたいな。
あくまでそれを借りてきて、
そこにアディショナルなものを付けるかみたいな。
2つに変わってきてる。
前は作ること専業だったんだけど、
あまりにもいいものが出すぎて、
巨人の課題に乗るじゃないけどさ。
そういう仕事の方にシフトしていったみたいな話はあってさ。
めっちゃ面白いですよね。
めっちゃ面白いなと思って。
自分たちはソフトエンジニアとして、
めっちゃ仕事のやり方っていうのも変わってきてるけど、
MLエンジニアの世界は自分は知らなかったんだけど、
そんな風に変わったんだっていうのが面白かった。
何かの話につなげようと思ったのか、
忘れちゃったんだけど。
何かつなげようと思ったんだよね、
ケンが言うことしたことに。
言ったくせに。
分かんない。
あれじゃない?
そろそろクロージングも近いし、
じゃあ次MLエンジニアの人に話しましょうっていう風に
締めるのかなと思った時。
本当だ。
でもそうしようよ。
そうか。僕もその世界の中の人じゃないか。
MLは何も使えて、
良くも悪くもツールだから、
距離感あって使ってるからさ。
中の人も大変なんだなっていう。
ちょっと垣間見えましたけど。
統治者を呼んでちょっと話してみたいね。
思い出した。
そうだ、ローカルでMLを作った時、
作っても既存にあるものがすごい良すぎるっていうのがあるよね
っていうのが言いたかったんだ。
そうそう、確かに。
それを本当感じる。
ネットワーク通してどっかのクラウドにある
つよつよのモデルを叩いた方がローカルでピョピョ走らせるより全然早い。
ネットワークのオーバーヘッド払う方が早い。
なるほどね。
っていう学びでした。
やってみて学びましたね。
そうなんですよ。
こういう話がしたかったんです。
満足です。
満足ではない。
話は終わってないけど一旦満足です。
AIで開発してますって言うと一言で終わるけど。
いろいろあるじゃん、現場の。
そうだね、本当にいろいろ。
取捨、選別、取捨。
いろいろある。
そうそう、なんかほら、やっぱりどの世界もそうだけどさ、
中の人じゃないと分かんない
些細なことってあるじゃん。
エンジニアとして働いてますって言うと
大抵エンジニアじゃない人からのフィードバック、インプレッション、印象って今2つで
もうAI開発でウハウハでしょっていうのか
もうAIに仕事奪われて大変でしょ
どっちかしかないって。
なるほど。
でもなんかこう、些細なそういう違いって結構いろいろあるじゃないですか、中のね。
そうだね。
その2026年6月版のスナップショットをちょっと発信したかった感じですね。
これが3ヶ月後どうなってるかまた、多分使ってるツールも全然変わるだろうしね。
そうなんだよね、なんだっけ、最近ループエンジニアリングだっけ、なんかさ。
ずっとループさせて開発をさせる、自分はまあ触んないみたいな。
なんかずっとそのLLMでループさせる、開発とかも聞いたりもするし。
まあハーネスエンジニアリングとかもさ。
ちょっと前コンテキストなんちゃらとか言ってたじゃん。
それがハーネスなんちゃらになってみたいなのが。
まあめっちゃ早いよね。
めっちゃ早いって。
自分はもう追いついてないっていうかもう。
そうだね、ある程度追わないようにはしてるんだけど、
自分はまあクロードコードをシンプルに使ってるっていうだけで。
今のところわかんない、他の人とだいぶ差がついてるかもしんないけど、
まあいいかなみたいに思ってるかな。
やっぱり追わなくていいところと追うべきというか、
抑えておくべきポイントの取捨選択はやっぱり、
まあどこでも求められるよね。
よくフロントエンジニアの世界は毎週のように新しいフレームワークが出るなんて話題になったりするけど、
まあAIの世界もそうじゃん。
毎日のように新しいのが出るじゃん。
そうだね。
ループエンジニアリングに似た話で言うとさ、
あれ知ってる?オートリサーチって知ってる?
知らない。
オートリサーチっていうのはなんだろう。
考え方?開発手法という理解でいいのかな。
ツールとしてもあるんだけど、
オートリサーチで調べると一番最初に出てくるのがGitHubのリポジトリで、
これなんかAIの業界で、
まあ多分ティーチャーとして結構有名な人がいるんですけど、
これなんて読むんだろうね。
アンドレイ、アンドレイ・カーパスィっていう人がいて、
この人はね、もともとYouTube動画とか今すごい出してる人なんだけど、
テスラとかオープンAIにいた人、
アンドレイ・カーパスィって人が、
結構YouTubeでわかりやすい、
AIみたいなLLAモデルどうやって作るのかみたいな動画とかを出している人なんですよ。
カンファレンスとかもよく出てて、
何て言うんだろう、オピニオンリーダーと言えばいいのかな。
違うかな。
インフルエンサーでいいのかな。
この人が多分提唱した概念もしくはコードという理解なんだけど、
AIエージェントに小さなトレーニングデータと目標を与えるんだよね。
その目標に達成するまでにLLMに自動でコードを改変させ続ける。
具体的なユースケースとしては、
例えばシンプルなスクリプトを渡して、
ベンチマークスクリプトを渡して、
このベンチマークでこのラインを切るまでこれをチューニングしてください。
あとは走らせてランチでも食べに行きますと。
なんならランチ食べて昼寝して夕飯食べて戻ってくると。
そうするとベンチマークスクリプトを目標基準を超えたレベルのスクリプトがそこにあるっていうやつなんですよね。
このオートリサーチで前のエクステンションとかもあったりするんだけど、
例えばそれを応用すると、
パーサーエンジンがありますと。
このパーサーエンジンをこのベンチマーク、
データベースのベンチマークスクリプトでここを超えるレベルまで作ってくださいって言って、
2,3日走らせて戻ってくると、
よく分かんないけどすごいものができてるみたいな。
それさ、自分が見た記事だと、
AIはそこをハックしてくると。
テストを通してというと、
テスト自体を消してきたりとか。
おもしろすぎでしょ。
そうそうそうそう。
それをやっぱり途中でどこかで、
人間がレビューするというか、
ところを挟まないと。
勝手な方向に行きますよ。
勝手な方向というか。
その結果を達成するためにハックし始めると。
人間が求めてないやり方でね。
そこがまだ、
全自動の自分的なループエンジニアリングとか、
信頼してないところなんだよね。
それの扱い方じゃない?
例えばうちだとオートリサーチの結果そのままマージするなんてコーハットで、
オートリサーチの結果のプルリクをDraftまで出させた後で、
そこから学んだ結果を抽出して、
もっとエレガントなソリューションで実装しなさい、
みたいなこと言われてるけど、
オートリサーチでそこで出したものを読まずにマージさせたら、
確かにそういうことが起こると思うんだけど、
そこで人間が気づかなかったような最適化手法とか、
アーキテクチャとか、
そういうのが出てきたら、
何かしらの学びがあったと思うんだけど。
そうだね。
そこまでできてるといいね。
全然ディスりたいわけじゃないんだけど、
確かトビーが、
バンドラーかなんかのリポジトリに対して、
パフォーマンスをアップさせるようなプルリクを送ってきましたよ。
10個ぐらいかな?複数個。
一人で書いたやつは、
本人が自分で書いたやつは、
ちゃんとした結果が入ってきて、
ちゃんとしたパフォーマンス結果になってますよ。
でも残りのAIと一緒に書いたやつっていうのは、
他の人がすでにあった、
試したことっていうか、
試して過去に却下された気だかない量かなんかが、
AIがサジェストして書いてきてますよと。
個人的にはAIっていうのは、
今のまだ段階では、
集めてきたデータの中から、
過去あったものからしか何かをできないのかなと個人的に思うんだよね。
まだ完全に新しいものを生み出すところまでって、
まだできないんじゃないかなっていう自分の感覚があるから、
そこまで信頼してない。
もちろん自分が知らないことを、
知らなくて過去誰かがやってきたことを、
AIがサジェストしてくれるのは、
それはまさにいいことなんだけど、
そこからより深みで、
人間が今まで試してきてなかった、
過去誰も試してきてなかったようなことが、
AIが今生み出せるかどうかで言うと、
まだそこまで行ってないんじゃないかなとかって思ってるんですよ。
そこは人間の狂業だと思ってて、
僕も別の記事を読んだんだけど、
数学者の世界で、
いわゆる難関問題と呼ばれてる、
証明されてない問題っていうのがいろいろありますと、
検証金も付いたりしてるような、
コンピティティブなものもあったりしたときに、
AIに解かせてみたときに、
その記事で書いてあったのは、
それまで人間が研究で試したことのない手法を使って、
解こうとした?
うん。
僕数学者じゃないから、
じゃあ具体的にこういう手法で、手法でってのは言えないんだけど、
そこには書いてあって、
一時ソースをもとに話してるわけじゃないんだけど、
前つぶだけど。
でも、そこで面白かったのは、
別にそれは完璧に証明されたわけじゃないと。
でも、そのAIのとんでもない専門外というか、
門外観のように思えた取り組みのアプローチが、
数学者を刺激して、
その数学者がそれをもとに、
再構築というか、
やってみたら解けちゃったみたいな話があるもんね。
そうそう。
だから言った通り、
AIって基本的にはその学習したデータから、
確率論的にその次に出てくるようなものを出してくるから、
ハルシネーションも来るし、
その過去から学んだことじゃないことを出せないというのはそうなんだけど、
なんかそこから、
例えば人間が持っているブラインドスポットを、
スポットライト当てて、
それで人間が学ぶ、
もしくは気づかされて、
それをリファインメントして、
成果まで落とし込むみたいな、
なんか協業ができたら、
うまくつくっていうか、
のがあると思うんだよね。
なんか人間ができないところまで全部AIができちゃうみたいな、
そんなこう、
そういう世界は確かにもう、
全然もう来るか来ないかレベルで先だと思うけど、
そのAIにブラインドスポットを出してもらって、
人間がそれをもっとエレガントなソリューションに落とし込むっていうのは、
なんかエンジニアがやってるからこそすごいなんか納得性の高い、
現時点でのなんかいい協業モデルな気はしている。
SRM結構一緒で、
なんか仮説を、
エラーが跳ねたときに仮説をやるときに、
とりあえずなんか自分のブラインドスポットを、
まあ3つ4つぐらいちゃんと出してくれるわけ。
僕はこれソースコードのバグだと思うんだけどって言ったら、
なんか実はこういう際どいなんかGCPのイベントがあって、
それで、
それは80%ぐらいあってて、
でも残りの20%はなんか下手くそ、
なんか違うこと言ってるんだけど、
そこに20%をちゃんと埋めてあげると、
綺麗な開放が出たみたいなことも何回か経験してるから。
AIで完結させるのもなんかリスクがあるし、
かといって人間だけでやるのもなんかもう限界があるから、
うまく協業していくみたいな感じを模索していく必要があるなと思っている。
なるほどね。
AI時代におけるエンジニアの役割と今後の展望
綺麗にまとまった気がします。
綺麗にまとまった気がする。
無理矢理まとめた気がしますが。
至りないことないですか?
さっきの話を聞くと、
人間とAIが協業してうまくいいものができることを考えると、
AIにリプレイされることはないような気がしてきたというか、
やっぱり使う側の人間がどうAIとうまく、
もちろんソフトエンジニアとしての仕事のやり方っていうのは
AIと一緒に変わっていく可能性はあるけど、
リプレイされる一般的な人が見る両極端なものとまたなんか違うよなっていう感じだね。
役割は変えていくだけだと思うけどね。
そんなこんなで、
今日はソフトウェア開発の現場から2026年6月における
AI開発の細かいスナップショットについて話しました。
そんな感じでよろしいでしょうか。
ありがとうございました。
ありがとうございました。
01:07:05

コメント

スクロール