CODEXはいいぞ
感想
まだ感想はありません。最初の1件を書きましょう!
サマリー
メインパーソナリティの高橋氏が最近使い始めたコーディングエージェント「CODEX」について語ります。高橋氏はラズベリーパイにEtherCATを実装し、サーボモーター2軸を動かすという遊び実装を行った際、CODEXの能力に深く感動しました。CODEXは、人間が面倒に感じるエラー解析やログ取得といった作業を、仕様を細かく指示しなくても丁寧かつ漏れなく実行し、動くレベルまで自動でコードを生成します。 特に驚きだったのは、ハード構成とEtherCATのGitHub名を入力するだけで、1時間ほどで実装が完了した点です。リアルタイムパッチの適用など、複雑な環境構築も指示すれば自動で行ってくれるため、開発者は「何をしたいか」に集中でき、「どうやるか」を調べる手間が大幅に削減され、Google検索の頻度も減少したと語ります。この経験から、高橋氏は「無力感」を感じつつも、AIの進化に驚きを隠せません。 CODEXはChatGPTアカウントとVS Codeの拡張機能で利用でき、SSH経由でリモート環境にもアクセス可能です。品質担保の面ではまだ課題があるものの、試行錯誤が許される開発環境では非常に強力なツールであると評価。シミュレーション環境がさらに発達すれば、FAプログラム開発への応用も期待できると述べました。高橋氏は現在3,000円のプランを利用していますが、実質的な利用時間の短さから、より高額な3万円プランへの移行を検討しており、AIエージェントの活用がソフトウェア開発チームの構成や、開発者の学習方法にも大きな変化をもたらす可能性を示唆しました。
CODEXとの出会いと初期の感動
アーシャルファクトリーオートメーションへようこそ、メインパーソナリティの高橋です。
クリスです。
よろしくお願いします。
よろしくお願いします。
クリスさん、最近ですね、僕4週遅れでオープンクローを始めたっていう話をしたじゃないですか。
ザリガニですね。
ザリガニね。
ザリガニを始める前にも、コーディングエージェントにはちょろちょろ触ってたんですよ。
3000円の課金をしてるんで、コーディングエージェントが使える環境にあるんですけど、
一応今までもちょろちょろ使ってたんですよね。
それをこの間、もう少しガッツリ触ってみようかということで、ちょっとガッツリ触ったんですよ。
触ったんですね。何を目標でやったんですか?
その時は、ラズベリーパイの中にイーサキャットの実装をして、サーブモーター2軸を動かすっていう、
そういうことをちょっと遊び実装したんですけど、感動しましたね。
もっと早く触っておけばよかったっていうのを、ひしひしと感じました。
感動ですか?どこが感動したんですか?
CODEXの驚異的な能力と効率性
感動は言い表せないんですけど、雑に言ったら全部やってくれる。雑に表現するなら。
そんなにしっかり仕様みたいなの出さなくても、何度なくやってくれる。
ちゃんと動くまでやってくれるってことですか?
というよりも、自分でやるより逆に丁寧にできるなっていうのはちょっと思いましたね。
やめて。なるほどね。
例えば、通信のプログラムを書いたときに、大体動かないじゃないですか。
大体動かないです。
動かないときって、僕らって適当に当てつけて、大体こうかなといって、最小限の自分の手の手数でクリアしようとしません?
例えば、手動でオン・オープンして、届いた、届かない。
例えば、Ethernetのパケットが100バイトあったとして、どこかが悪いっていうときに、まずはこの辺かなって8バイトだけ取るとかするじゃないですか。
違った、じゃあ隣の8バイトを取るみたいな。
そういうのさ、ちゃんと全部ログを取って、せいぜいAIはやってくれる。
ちょっと待って、高橋さんがやってくれるってどういうことですか?
例えば、じゃあこれちょっとおかしいんで、エラーを計測するプログラムを追加して、エラー計測しますねみたいな。
っていうのをやってくれる。
やってくれる?
やってくれる。で、そこに手間を惜しまない、AIが、全然。
僕らもめんどくさいじゃないですか。
例えば、100やったら絶対分かるっていうやつでも、100書くのめんどくさいから5ぐらいしか書かなくて、当たった、やった、5で済んだって言うじゃないですか、僕らって。
やるわ、自分の影が。
でも、AIってそうじゃなくて、手間を惜しまず、ちゃんと全部見てくれます。
ある意味で、私みたいな中途半端な人よりしっかり実装できそうなイメージですから。
だから、ちゃんとしてるなっていう。
でもさ、これは高橋さん、この間ツイッターに流した言い先だったんですよね。
そうですね、はい。
あれ、どこまでプログラムをやってたんですか?
ハード構成とEtherCATのGitHub名をポンって入れただけです。
じゃあ、例えば、ランニオラスペリパイで、アムロのサーボで使ってます。
GitHubもEtherCATの名前のGitHubの名も入れて、実装までやってください、実装してくださいと。
そうですね、はい。
え、嘘。何時間かかるんですか?
1時間ぐらいですね。
GitHub読むのに1時間でも終わらんな。
終わらんね。
1時間GitHub読むのに終わらんな。
実際さ、読まなくていいっていう感じではないですけどね。
僕はEtherCATを書いたことはないけど、扱ってはいたわけだから、それなりには中身はわかってるわけですけど、
それでも使用書をちゃんと書いたりする必要はなく、そこまでパーッといったのはそこになっちゃって。
それが実用レベルかどうかを置いておいて、とりあえず動くレベルまでも1時間ぐらいまでビューッといきました。
環境構築の自動化とGoogle検索の減少
動くメーター、これはね、ちょっと言い方が悪いんですけど、
そういうソフトを組む人間じゃないから、とりあえず動く系とGitHubレベルまでのギャップ差どれくらいあるのかなと、さっきの話が気になってきて。
まあでもさ、プログラムだけだったら多分そんなやと思うけど、環境構築からやから全然時間が違うと思うな。
例えば、ロッカーじゃなくて、もう普通に今回で言うと、Raspberry Piの中にSOMを入れます。
で、それがLinux上で動いているとジッターの影響されるから、CPUを割り付けて、専用に割り付けて隔離します。
リアルタイムパッチを当てます、みたいな。
そういう下準備から含めて全部やってくれますよね。
でもさ、高谷さんがプロントをやってる時はそこまで指示しなかったんですよね。リアルタイムパッチ入れてとか。
それは言った。途中で言った。
やっぱ、言ったね、だから実はやっぱりダメだからもう一回やり直したって言うんですね。
でも高谷さんさ、あるきりリアルタイムパッチも入れてもう一回やってって言うだけですか。
言うだけですね。リアルタイムパッチ入れてっていう。
その時に自分でやったらもうコマンド調べたりしないといけないじゃないですか。
リアルタイムパッチどうやって入れるのか、雑にしたんですよ。
で、それをもう勝手に入れてくれるし。
えー。だからちょっと無力感がありますね。すごいな、今AI。
品質を担保するっていうと、中身が結構ブラックボックスになってるんで、
今これが世界を変えるみたいなことを、今この時点で言うことはないのかなと思ってますけど、
助けになったりとか、そういうレベルで遊んでいく分には運命の差ですよね。
なるほどね。
俺、でかいな。仕事、今まで、例えばさっきイーサーキャノンマスターを自分で立ち上げて、
すごく遠い話みたいになったんですね。
例えば高田さんのCodeX使ったら一気に近くなっちゃうんですよ、いろいろな話が。
だからもうその後イーサーキャノンマスターやったんじゃないですか。
そうですね、はい。
そういう話すごい近くなりましたね。
だから自分で責任を取れる範囲はものすごいできることが増える気がしますね。
CodeX CLIが出てすげえってなってたじゃないですか。
CLIができるまで、CLIが使えるとここまでコンピューターがやられることが増えるのかっていう。
じゃあ何もやらなくてもいいんだというところですね。
そうですね、ほぼ全てのことができるっていう。
でも高田さんがCodeXを走るのは自分のWindowsパソコン?
Windowsパソコンですね、はい。
で、LANでラスペーパーを繋いで?
LANというか、まあそうですね、SSHで繋いで。
最初にSSH繋いで、あれも勝手にやってくるんですか?
やってくれますね。SSH繋いでって言ったら繋いでくれます。
恐ろしくないですか、こいつ。
これワイナー。すごいね、何でもやってくれるんですね。
やってくれますね。恐怖ですよね。
我々の開発どうなんだ、ほら。
ある程度動くまではやってるんですけど、実装なんてものは全然違うんですけど、
いろいろな腰が、まあ腰で言うか、敷地がすごい低くなってますね。
敷地が。
そうですね、あと、何て言うんですか、覚えなくていいこと多分。
例えば?
だし、例えば今、キッティングとかはだいぶやってもらうようになりましたね。
キッティング?
いや、例えばラズベリーパイを入れた時に日本語フォントの設定をするとか。
いや、これ最悪だよ、毎回もデータケースかけなきゃいけない。
あとはスリップしないようにするとか。
スリップしないようにするとか、何かを自動起動するようにするとか。
やりたいことは決まってるけど、調べなあかんことっていうのはめちゃくちゃ減ったと思います。
そうね、ドッカーを入れてくださいだけでも調べなきゃいけないな。
だからGoogleっていう声がなくなりましたよね。
Googleはだいぶ使わなくなったね、最近。
そう、だからあれじゃないですか、これできるかわからへんなっていうのはGoogleいますけどまだ。
これ調べたらできるんやろうなって、Googleったらやり方乗ってるんやろうなって予測するものはもうGoogleらなくなりましたね。
もう全部せせえあいで。
せせえあいでやってもらうか、せせえあいに聞くかどっちかですよね。
そうですね。だってわしも今日のレシピ、夕飯レシピもどう作るかも全然さちびきでもうここばっか見てないわしも。
夕飯レシピもここばっか見てないですよ。
そうですね。
なんかできるってもう確信のあるものはせせえあいに聞いてしまうっていう感じになってると思いますね、今も。
CODEXの利用方法と実運用上の注意点
例えばできるかできないかわからないものだったらあるんですけど、
特にもう既にあるとかSWM、完全にできるのは一生懸命マスターとかのスタッフもあったりとか、
そういうところはちゃんと聞いてやってたほうが自分で理解してやるよりは何倍もいいっていうですね、バイオでは。
そうですね。やっぱり人は完成物にしか興味がないんだなっていうのはよくわかったな、これやって。
バチンバチンも含めてね。これを使うには何が必要ですか、このCodeXを使うには。
CodeXを使うには、チャットGTPアカウント。
そうすると。
あとはVS Codeを入れて、VS Codeの中の拡張機能でCodeXを入れればもうOKですね。
VS Codeは何のために使うんですか?
VS Codeじゃなくてもいいです。普通にCLIで入れてもいいですけど、VS Codeの方が楽です。
なるほど、なるほど。高谷さん、さっき言われて、私もうちょっとVXをダウンロードしちゃって、もう起動してるんですけど、今。
朝試しようかな。
高谷さん言われたときね、私最初コピペでやってたんですよ、すごくバカなやり方で。
それでもちょっと感動したから、高谷さん、いや、一回これ使った方がいいんですって言われた。
そうですね、僕もコピペでやってましたけど、やっぱりコピペってさっき言った、全部やるってやらないからさ。
そう、でも毎回ダメだって、毎回言わないといけない。何がダメ、何がダメって言わないといけない。
要は人がサボろうとしますよね。何か問題があったときに人がサボろうとするじゃないですか。
全部見るんじゃなくて、最小限の探索で何とかしようとする傾向があるじゃないですか。
なるほどね。
高谷さんコーデックスを自分のパソコンに入れて?
自分のパソコンに入れて、そこからSSHでラズベリーパンに入っているだけです。
なるほど、なるほど。
そう、それも3つあるんだ。でも要はSSH入本、テストコードエリス、あれかな。
自分のパソコン全部アクセスできるって書いてあるんだけどな。大丈夫かな、心配。
どっちでもいいです。僕はもう自分の環境ぶっ壊れてもいいんで、今フルアクセスにしてますけど。
え、でもフルアクセスできるのはラズベリーパンの方ですよね。
いやいや、フルアクセスにするとそのPCの中全部触れるようになります。
パソコンをバックアップしてからやります。大事なものをバックアップしてからやります。
僕はもう壊れてる。
新しいプロジェクトを作って、それで何かやるときに、さっき言ってた高谷さんってやつをタイピングして、それだけでOKだよね。
SSH繋いでやってください、何でもやってくださいって言えばいいんですよね。
そうですね。パスワード分からんとか色々聞かんと分からへん情報があるときはそこで止まりますけど。
実際はTBTのデスクトップみたいにずっと走ってて、分からないときはあなたが聞いて、それまたバーっと事故するイメージですか?
そうもあります。ただ、聞いてくるか、これが分かんないでここで止めときましたって終わるのかは、その時その時ですけど。
止まったときってことですか?
ちょっと止まっちゃうと結構いのくさいんですよね。
テストの中だったらそうなりますよ。
とりあえずここまでやりましたっていうのが返ってきて、パスワードこれですって。それがいいんか悪いんか追い付いて。
ラズベリーパイぐらいだったらいいかと思ったらまたしちゃいますけどね。
FA分野への応用とシミュレーションの可能性
で、こういうCodeXみたいなものでFAのプログラムもいずれ入ってくるんですよね?入ってきてるんですよね?
よく言いますけど、本質は変わらんですからね。
だってこれ同じですよね、延長。
結局プログラムでしかないから。
検証の部分もさらに高さがあるんですけど、シミュレーションも一緒にこのCodeXでつないでもらって、全部検証させて、ある程度プログラムも作れるんですね。
全部本当の自動で作れるというイメージですね。
そりゃ分からん。
分からん。
そりゃ分からんけど、今回CodeXを触って思ったことは、試行錯誤できる環境があればめちゃめちゃ強いなっていうのをすごく感じたってことですね。
失敗がほぼそこまで許されないところだったらちょっと微妙だったり。
微妙だった。だから一撃でいいプログラムを作るっていうのは多分難しい。
結局やってみて、エラーが出てエラーを解析してっていうのをすごく高速で回したりとか、
さっき言ったみたいに原因の調査っていうのを漏れなく組まなくちゃんとめんどくさがらずやれたりとか、そういうので早くやれてるような気がする。
でもじゃあ我々の今のFAのところ、そういう失敗性の良い環境を用意すれば、できれば。
そうですね。だからシミュレーションがすごい発達すれば全然あるんじゃないかと思いますね。
高谷さん、昔のプロゲーマーだったんですけど、シミュレーションはまだ全然追いつかないって言ってたんですよね。
そうですね、当時はね。
でもシミュレーションのめんどくさいところの大半は設定なんで。
設定のところはもう一回言うとCodeXと思うで、全然開いてくれる。
いやそれもそうだし、シミュレーションの設定っていうのは失敗ができる環境じゃないですか。
そうですね。
でさっき言った失敗ができる環境っていうのは強いよねっていう生成愛っていう。
試してもらえばいいか。
だからそっちを進化するのは全然あるんじゃないと思いますよ。
なるほど。面白い。
CODEXの料金プランと他のAIエージェント
じゃあ試しよう。
もうちょっと高谷さんで言われたら課金してるし。
高谷さんはもうバトルヤード3万円の課金のスループも試合に入ってくるって言うんですね。
そうですね。3万円でこれだったら全然ありだなって思いました。
3,000円はどこまでできるんですか?トップのプラントは。
3,000円は5時間制限と1週間制限がサブスクリプションの中にあるんですけど、それの減り量がめっちゃ早いっていう感じですね。
これ超えちゃったらどうなるんですか?
超えちゃったら5時間使えなくなる。
5時間コーデックスが使えない。
GDPのチャットは使えます。
チャット使えるんですけど、コデックスは使えないという。
使えなくなりますよって。
別にこの枠超えてずっと使い続けて、それですごいデカい金額をチャルトされるわけじゃないですか?
それはないですね。
これだったら安心だな。しかもでも3,000円使い切ったってことですね。
そうですね。
スカイパークだと。
3,000円の中でも一通りやりたいことは最初の5時間の枠の中でやれることはないです。
1時間くらいで一通りのやつは一旦できるなみたいな。
そこからこうしたい、こうしたいっていうのを足していくと、1時間半くらいのところでパンと切れる。
基本のところはすぐやってくる。
でもその後の細かい修正とかは多分これが一番ミソなんですよね。
細かいところで。
細かい修正っていうよりは改修というか発展というか。
私も考えたらまだちょっと古いね。
修正というとレベルじゃない。レベルアップですね。
そうそう。レベルアップをちょっとずつ。
こうした方がいいみたいな。ブラッシュアップというか近いかな。
言い方的には。
それをやっていくとちょっと足りなくなるね。
で、5時間待ってもう一回みたいな。
だいたい夜でやって、次朝でもう一回やるみたいな。
それは多分できないな。
途中でたぶん止まると思う。
何かの日からってすごいな。
でもやっぱ3万払ってもいい気はしてきたね今、本当に。
こんなこれくらいの効果が出るんだったら。
払おうかなって今ちょっと思ってます。
3ヶ月くらいちょっと10万くらい予算って。
3ヶ月くらい張ってみようかなっていう。
でも作りたいものがあれば全然いいと思うけどね、味も。
でも3万円のうちにやった方がいいんじゃないっていう。
でもさ、今たぶん3万払える人と払えない人の差がめっちゃ出るよね。
そうだし、でもさ、これどう見ても3万だからそのうち3万じゃないとかあってもおかしくない。
安く使わせてるっていう説はあるんですけど。
まあでもどうなんだろうな、その説もあるやろうけど、極端に値上げってはないとは思うけどな。
そうだね、今3千円のプランで1万円になりますって言ったらたぶんサブスクリプションするかもしれないな。
いやそれくらいはあるかもしれない。3千円のプランでなくなりますとかは全然あると思うけど。
1万円のプランになります。
3万円のやつが10万円になりますとかはたぶんないんじゃないかな。
なるほどね。だから今何サブスクリプションしてるんですか?
僕はGoogleとチャットGDPの3千円のプランにそれぞれ入ってるぐらいですね。
あ、ジェミニーのやつ。
ジェミニー入ってるんですね。まあそれはGoogleドライブが欲しかったからっていうのもありますけど。
カルガーね。
ゴテラもらえるんで。
あ、そういうことか。ジェミニーは使えるんですか?あれサブスクリプション。
使えますよ。使えますけど、使えますね。
なるほどね。
コーデックスみたいなアンチグラビティっていうのがGoogleは使えます。
やり方は一緒ですからね。
やり方ほぼ一緒ですね。
たぶんVS Codeからは使えんかっていう気がしますけど、やり方は同じです。
なるほど。こういうやつ使ってるんですね。今からさ。
AI時代の開発と学習のあり方
次また新しい作品が作るんですね、高橋さん。
そうだな。クロードコードはあんま使ったことないんですよね。
あ、なるほどね。
まあいいかなと思って。クロードコード。
クロードコード結構評判いいっていうかなんか。
なんかいいって言いますよね。ただ使ってない。
結構いいって言うんですね。
でもこれなんか正規がすぐ超えちゃうんじゃないと思うんですよね、あれ。わかんないな。
流行りに乗っておくほうがいいんやろうなっていうのは思いながらも、
まあ僕4週遅れで動いてるから。
言われたらコネクスでいいじゃん。
コネクスでいいかな。
最先端ですからね。
そこになんかめちゃくちゃ差があるんだったらまあね、考えるけど。
差は俺は分かるかどうかですね。
そうですね。だから。
高橋さん、高橋さん。
なんかね、トジチピゲのほうがいい、クロードコードのほうがいいみたいなこれを言ったり来たりしてるから。
まあなんかいいってなったらこっちに移って、いいってなったらこっちに移ってみたいな。
そういうレベルで僕、前に進めてないですよね。
そんなキャッチアップできてない。
最初クロック使ったんですか?
エビ、ザリガネはね。
そう、ザリガネは。
グロックはもうちょっと全ダメでしたね。コーディングっていう。
足なりませんでした。
足なりませんでした。
やばい、あかんか。なるほど。
でもさ、やっぱりこのGOATXが、こういうものがあるんだったら高さはさっき話したんですけど、
ソフトウェアチームのだいぶ少ないんじゃないかと思った人の数は。
20人のチームが10人だったりとか、10人プラスエージェントみたいになるんじゃないかなと。
多分怒ってるんですよね、今。
まあそれは怒ってるやろうな。
実際、人の価格も上がってますからね。
こういうエージェントのお金。
なるほどね。
まあ人間を雇うより安いって言うんですよね、スピードは。
人の品質そんなに良くないですからね、そもそも。
これは多分どの業界でも叩いても抱えてもないですね。
なるほど。
こういう、意外に悪いんですけど、コードエージェントみたいなの使ったらある程度の品質を保てるかもしれないかな。
それは、AIが品質を担保するのはまだまだ先だと思いますけどね。
また実際、品質を担保するシステムはAIの方が上手く使えると思いますね。
どういうことですか?
テストツールとかそういう話ですよね。
だからこのツールを正しく使えば品質が担保できますよっていうものを正しく使うっていうのはAIの方が圧倒的に成績はいいですよね。
なるほど。
人がやって使い方がおかしいから担保できてませんでした、このチェック入ってませんでしたとか山のようになるじゃないですか、仕事の中から。
なります。だからAIで終わればいいですね、チェック。
AIはそういうの得意ですよね。
だから博士さんね、このイサキャとマスターの実装を見てて、私もちょっとコピーだけやってるんですけども、やっててちょっと無力感、
でもちょっとショックだったなってすごいなと思って。
本当に今のAIって全然違う領域だし、これから何人を勉強すればいいのかという。
勉強なんてせんでいいと思いますけどね。
ほらそう、私も勉強せんでいいと思いますよって言われて。
もういいですよって言われて。
使うのは使ったり試したりするのはやった方がいいと思うけど。
そうそう。
いやだって博士さん勉強するって年じゃないじゃないですか、我々。
追いつかないね、追いつかなっちゃった、いろいろ。
頑張ってやろうと思えば頑張りやろうんですけど、やっぱり早くないね勉強するのは、そんなに早くなくなった。
勉強どうなんでしょうね、勉強って言ったら20代10代の方が圧倒的に有利じゃないですか、同じこと勉強するんだったら。
90早いしね。
そのほぼの良さが。
だからなんかそのディスアドバンテージな土俵であんまり戦わない方がいいんじゃないかなっていうのは思うことですけどね。
別のと、有利な土俵で戦ったほうがいいんじゃないかと。
そうですね。
勉強っていうこと一本で言うと、どう考えても物覚えが良い人たちに勝てないじゃないですか。
ですね。
それはもう確定的に、それは科学的に一生されたアドバンテージじゃないですか。
旅でどんどん落ちていく土地ですね、攻撃を。
そうですね。
まあとりあえず試しますよ、明日。
ちょっと攻撃じゃなくて土地試します。
じゃあまた感想を教えてください。
まとめと今後の展望
そうですね。とりあえず3000円の枠を全部使い切って、次に会社に相談して3万円枠を買いに行っていいですかとちょっと聞きます。
じゃあちょっと3万円の枠を取れたときは3万円でどこまで連続できるかちょっとまた教えてください。
そうね。3000枠は5時間ですね。
5時間というか1時間。
1時間。
1時間で終わっちゃう。
いや、早いな。すぐ終わっちゃうな。
すぐ終わっちゃう。
了解しました。はい、とりあえずちょっと頑張ります。
はい、じゃあここで本日はですね、CODEXという生成エージェントを使って何かしら皆さんもぜひ使ってみてくださいという。
ありがとうございました。
ありがとうございました。
27:46
コメント
スクロール