1. ninjinkunの声日記
  2. AI Agentによる開発の進化に驚く
2025-03-10 17:03

AI Agentによる開発の進化に驚く

サマリー

AI技術の進化により、開発プロセスが劇的に変化しています。特に、ルーコードやクラインといった新しいツールがエディター内でのコード生成や修正を自動化し、開発者の作業効率を向上させています。AIエージェントによる開発の進化についての驚きや体験も語られています。特に、APIリクエストを通じてのコストや様々なLLMの選択肢が、開発環境における挑戦と利点をもたらしていることが強調されています。

リスナーアプリの開発
こんにちは、ninjinkunです。
この前、ピクミンブルームっていうゲームをね、ずっとやってるっていう話をしたら、
NanaさんとMartinさんが、お二人ともプレイされてるというコメントをくれて、
やっぱりまだピクミンブルームやってる人いるんだっていうね、
しかもこのリスン界隈にもね、二人もいるというのが分かって嬉しかったです。
ありがとうございます。
この週末に、結構リスンのアプリの開発をやってたんですけど、
ここで週末にですね、新しいAIでの開発の仕方を試してみたんですけど、
これがですね、かなり自分的にはすごくて、
自分が使ったのはルーコードっていうですね、
ここから多分開発をやってる人にしか伝わらない話をすると思うんですけど、
VSCodeっていうエディターの中の拡張として動く、
もともとはクラインってやつがあって、それのフォークしたやつですね、
それにいくつか機能を加えたものらしいんですけど、
これをですね、自分の知り合いの水地さんっていう人がいて、
フロントエンドのエンジニアなんですけど、
彼がこの前、クラインに全部かけろっていう記事を書いてて、
この水地さんという方は、ごくたまにこの魂が増えたシリーズっていうね、
これがこの技術がゲームチェンジャーになるんじゃないかっていうのをね、
借り捨てるのがうまくて、
そういうこれはすごいぞっていうのをね、
10年前はリアクトってやつをね、紹介してくれたんですけど、
これをですね、今度はこのクラインってやつがすごいというのをですね、
紹介してくれていて、
で、自分もね興味深く読んでほうほうと思って、
一応、チャットGPTとかGitHubコパイロットチャットとか、
そういうチャットベースで行動をね、
いろいろ相談に乗ってくれるツールは使ってはいるんですけど、
このクライン、その発生のルーコードはですね、
それをさらに推し進めたような挙動をして、
使うバックエンドのモデルは、
チャットGPTのオープンエーカーのO3 miniとか、
あとはアンソロピックのCloud 3.5とか3.7とかが、
そういう既存のAPIプロバイダーのLLMモデルを使うのは同じなんですけど、
今まではチャットGPTだとチャットに聞いて、
出てきた答えをエディターにコピペして、
それを動かしてみて、間違ってたらまたチャットに聞くみたいな、
そういうフローに多分なっていて、
コパイロットチャットとかコパイロットエディトっていう、
これはVSコードの拡張として動いていて、
いろいろチャットで聞くと、
コードの変更をサジェストしてくれて、
それをユーザーが適用すると。
ユーザーにまず聞くっていうフローが入っているのが、
このコパイロットエディトとかで、
さらに今流行っているさっき言ったクラインとか、
あとはコパイロットチャットエージェントとか、
いくつか出てきているエージェントモデルというか、
エージェントって呼ばれているAIの応用の一つが、
実際にそのコードをどんどん読んで書き換えて、
その結果をさらに見て、
さらにそれに対して働きかけをするっていう、
自分のループを修正して直して、
修正して直してっていうのを、
自分で回すようになっているっていうのが、
このエージェントだと思うんですけど、
これをGitHubのコパイロットエージェントってやつでも、
ある程度できるらしいんですけど、
このクライン系のやつは、
自動的にどんどん適用してくれるっていうのを、
かなりアグレッシブに決めることができて、
とりあえず何を許可するかっていうところを選べるんですけど、
自分全部許可してるんですけど、
オートアプローブっていう機能ですね。
まずファイルとかディレクトリを読み取るのはOK、
ファイル編集OK、許可されたコマンド実行OK、
ブラウザー使うのOK、
MCPサーバーってこれはまだちゃんと全部使ってないんですけど、
他のアプリと連携する仕組みっぽいですね。
クリエイターのコンプリートサブタスク、
これも全部許可する。
とか自動リトライとかこういうのがあって、
まずは今まではどのファイルを読ませて、
つまりAIがどこまで既存のコードを読むかっていうのを
人間が指定したんですけど、
これでこの拡張を入れて、
まずプロンプトのところにこういう機能を実装したいと書くと、
どんどんファイルが読み取られて、
AIによる開発の変革
ファイルパスとかを勝手に解析していって、
それがどんどんLLMに送られて、
LLMにそのファイルのコンテキストが溜まっていくと。
そこからさらにこういうふうに変えたらいいっていうのを
LLMがバーって出してきて、
それが勝手に適用されて、
それがさらにそこにテストがあるとテストを勝手に実行して、
その結果を見て間違ってたら直すと。
あとブラウザー、
ブラウザーじゃない、エディターに出てくるエラーとか、
シンタックスエラーとかコンパイルエラーとか、
型のチェックのエラーとか、
そういうのはどんどん読み取っていて、
自分で直していくっていう挙動をするんで、
最初一発で動かなかったりするわけなんですけど、
Aが提案してきた変更が、
それをどんどん自分で直していくっていう作業がババババって行われていって、
見てるうちに行動ができていって、
自分はiOSのアプリを作ってますんで、
iOSのシミュレーターで確認してるんですけど、
だから人間が今自分がやってるのは確認する作業だけっていう。
ちょっと違ってたらちょっと違うよっていうと、
また直してくれると。
これがですね、
だから今までは人間が間に入ってコピー&ペーストをしたり、
この変更はオッテー、オッテーじゃないっていうのを判断したんですけど、
全部それをAIに丸投げするっていう。
人間が間からいなくなることで、
めちゃめちゃこのループが早く回って、
人間から見ると自動でコードが全部完成するっていう、
そういうことが起こっていてですね、
この週末にリスナーアプリの、
例えばコメントをつけるとかスターをつけるとか、
そういうのを実装したんですけど、
ほぼほぼ全部自動で作られてますね。
こういうの、自分だったらコメントつけるの、
なんだろう、2,3時間とかかかるかな、かかんないかなって感じですけど、
チャットに行ったら多分30分ぐらいで完成したかな。
これはやばいっていう。
開発これから全然変わるなっていうことを実感しております。
こういうのをSNSでは驚き屋みたいなことを言うんですけど、
つまり新しい技術が出るといちいちなんでも驚いてこれはすごいっていう人たちが、
揶揄されて驚き屋って言われてるんですけど、
これは驚きますね。
これは乗っておかないと自分の仕事のやり方にダイレクトに影響してくるから、
やっぱりこれ今試しておいてよかったなと思いましたし、
これで少なくともとりあえずリストアプリの開発はめちゃくちゃ加速すると思う。
めちゃくちゃって言ってもスピード的には多分2倍とかぐらいかな、
3倍ぐらいかな、10倍までいかないぐらいだと思うんですけど、
特に作るのが明らかにめんどくさそうな機能ってやっぱり気が重いんですけど、
そういうのを全く意図わずに作ってくれるんで、
例えばテキストの書き起こし、
このポトキャストの書き起こしの部分をVTTだっけっていうフォーマットで書いてくれてるんですけど、
これをパースしてUIにマップしていくみたいな、
パースの作業とかテキストパースとかは自分で書くのめんどくさいんであんま好きじゃないんですけど、
これ全部やってくれるんで、いやーすげー楽っていうね。
AIエージェントの機能と体験
あとはたまにテストを書かせて挙動をチェックさせたりとか。
どうもブラウザで実行できるものはブラウザで自分で確認してくれるらしいんで、
最近のモデルはマルチモデルっていって画像とか認識できるから、
そういう自分で能動的にブラウザを操作して自分が実装した結果を確認してスクショを見てチェックしてくれるっていう機能も入ってるらしくて、
自分はブラウザで実行してないんで、
iOSシミュレーターで確認してるんで、
多分そのフローが入ってないんですけど、
確かFlutterはブラウザでも確認できるはずだから、
もしかしたらこの自動でUIをAIが確認して、
自動でレアルトラックスレッドを直すとかやってくれるかもしれないですね。
ちょっとこれも試していかないと。
という感じで、
めちゃめちゃ間から人間がいなくなった時に何が起こるかっていうのを、
これはちょっと一回体験しないとわからないかもなっていう感じがしたんで、
ちょっとテックな仕事をされてる方は、
これは一回試すべき技術かなとは思いますね。
あとコミットログさらに書いてもらうとかね。
今まで指示したことをもちろん覚えてるから、
人間が書くとフィックスとか何とかフィーチャーとか、
結構剃ってないログしか書かないんですけど、
LLMに聞いた通りに実装してもらったら、
じゃあこれコミットしといてっていうと、
綺麗にコミットログを書いてコミットしてくれるんで、
あとからもさらにまた追いやすくなるっていう、
そういう恩恵もあったりして、
これからもどんどん使っていきたいなって思いますね。
あとこれコストはかかるんですけど、
LLMに問い合わせるときにAPIリクエストが発生して、
そこでお金はかかるんですけど、
なんとGitHub Copilot Proとか、
そういうGitHubのコパイロットのプランに入ってると、
VS Code LLM APIっていうのを経由することで、
なんとこのプロプランにたのりして、
モデルが使い放題になるっていう、
すごいハックじゃないけど、
抜け穴を発見して有名らしいんですけど、
なんで今までちょっとお金かかるのやだなと思って、
二の足踏んでたんですけど、
これでめちゃめちゃ使えます。
ただどうもGitHub側が気づいて口を塞いでるのかわからないけど、
モデルに制限があって、
開発環境の挑戦と選択肢
コパイロットチャットとかではクロード3.7とかが使えるんですけど、
3.5枚しか使えなかったりとか、
そういう制限はかかってるんですけど、
何日制度も無料っていうのはありがたいんで、
とりあえずまずこれを優先で使っていて、
ただ使いまくるとレートリミットがかかって、
自分的には20分ぐらい動かすような、
つまりどんどん連続でリクエストを送っていくんで、
結果を見てまたさらにLLMに問い合わせて、
また結果を見て問い合わせてっていうのを自発的に、
このクラインが、ルーコードがやりだすんで、
どんどんAPIを投げていくんで、
そこである程度いくと、
このGitHubコパイロットのVS Code API経由だと、
途中止められますと。
ちょっと長期のタスクは止められるんですけど、
1時間ぐらいで復活するんで、
なんだかんだ使えますね。
自分の場合は、
そこからさらにもうちょっと、
ここで止めたくないっていう、
例えば編集の途中で止まったりするんで、
コードが中途半端な、
動かない状態で止まったりするから困るんですよね。
そういう場合のフォールバックとして、
これはお金を払うところも用意してて、
これAPIプロバイダーいっぱい選べるんですけど、
自分はネットでお勧めされてた、
オープンラウターか、
オープンルーターっていうところに登録すると、
ここ経由で使うと、
ここがいろんなLLM APIのプロキシーをしてくれてて、
ここに1回登録すると、
どのLLMのモデルでも、
ここが仲介してくれることで、
個別にアカウント作らなくても使えると。
モデルもいろいろ試せるし、
ここ経由だと消費税がかからないから、
本家より安いって書いてあって、
本当かって書いてあったと思ったんですけど、
とりあえず良さそうなんで、
とりあえずここを使っていて、
はい、って感じかな。
そんな感じで、
1回レートリミットで止まったら、
こっちのオープンルーターに切り替えて、
そこの時に1月に話題だった中国のDeepSeekとかに
切り替えることもできますね。
DeepSeek、でもR1を試してみたんですけど、
自分的にはだいぶイマイチでしたね。
なんで結局、DeepSeekがすごい安いんですけど、
結局Anthropicのクロードにまた戻して、
自分は3.5で使ったんですけど、
どうも3.7でもコスト変わらないのかな。
だったらちょっと3.7にしようと思うんですけど、
だからレートリミットで止まると、
課金した分を使って通帰をやるという感じのフローにしてますね。
これは自分の時間が取れるときに進めたいっていうのもあるし、
途中で止まると困るから、そこはちょっと課金して。
ただ結構動かしても、
1ドルはあんまりいかないかなぐらいなんで、
これぐらいならいいかなと思って、
10ドルだけ入れてやってますね。
そんなこんなで、
これは自分も驚きあいになってしまいますね。
これはすごいわという。
というので、まだこれからこの分野はどんどん発展していくと思いますけど、
少なくとも自分のコーディングの範囲では、
相当な進化があるなという感じですね。
このコードが、プログラマーじゃない人がこれをどれぐらい活用できるかわからないですけど、
コードは自動で書いてくれるから、できるんじゃないかな、開発とか。
もし何か作りたいものがあるけど、
プログラミング勉強するのもなっていう人は試してみると面白いかもしれないですね。
という感じで、どのようにしてAIのエージェントが開発を変えるかというのを目の当たりにして、
興奮にしていますという話をしました。
ありがとうございました。
17:03

コメント

スクロール