1. AI駆動開発部の日常
  2. 14【PRレビューの指摘をAIで自..
2025-12-29 30:27

14【PRレビューの指摘をAIで自動修正】Codexクラウドでサブスク内で完結

今回は、「プルリクエストに対するAIレビューの指摘を、追加でのAPI課金なしでAIに自動修正できないか」という阿部さんの取り組みを起点に語っております。
Claude Code、CodeRabbit、Codexの3つのAIレビューが走る環境で、指摘事項を手元で修正し直すというループが面倒になってきた阿部さん。GitHub Actions上でClaude Codeを動かす方法やAPI経由で回す方法もあるなか、Codexのサブスクの枠内で実現する方法としてCodexクラウドとの連携を試した試行錯誤について話しています。
ただ、僕の方は「Codexクラウドの修正結果の妥当性をコードで確認するのが重たい」という感覚があり、むしろレビュー内容を整理してくれるだけの方がありがたいかもという話に。自動修正と情報整理、どちらが実用的なのかはかなり意見が分かれるポイントでした。

【関連リンク】
▼Codex
https://openai.com/ja-JP/codex/

▼CodeRabbit
https://www.coderabbit.ai/ja

【配信サービス】
▼Spotify
https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e

▼Youtube
https://youtube.com/@ai-nichijo-fm

▼Apple Podcasts
https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202

▼amazon music
https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8

▼stand.fm
https://stand.fm/channels/68dc82a9036795923c400b4f

▼LISTEN
https://listen.style/p/ai-nichijo-fm?xtIZk9qq
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/68dc82a9036795923c400b4f

サマリー

このエピソードでは、AIを駆使してプルリクエストのレビューを自動で修正する仕組みについて詳しく説明されます。山本さんと阿部さんは、Codexやカーサーなどのツールを使ったタスク管理や効率的なコードレビュー手法について議論しています。AIを活用したコードレビューの自動化についての解説が行われます。CodexクラウドとGitHubを連携させることで、サブスクリプション内での低コストなレビュー修正が実現され、特にGitHub Actionsを使わずに運用できる方法について探求されています。AIを活用したコードレビューの自動修正機能に関する新たな取り組みが紹介され、またCodexを用いた仕組みづくりやAI駆動開発部の日常についても触れられています。

AI駆動開発の紹介
こんにちは、AI駆動開発部の日常へようこそ。このポッドキャストは、日々AI駆動開発を行う企業家の山本とエンジニアの阿部が、AI駆動開発のリアルを緩く語り合う番組です。
はい、じゃあ本日は年末最後の収録ですかね。
はい、そうなるかな。よろしくお願いします。
はい、よろしくお願いします。まあちょっと年末最後ということで、阿部ちゃんがすごい良い仕組みを作ってくれた。
いやいや、ハードルがね、上げ方がね急なんだよな。
ということで、プルリックに対してレビューとかをね、いろいろなコーディングエージェントにやってもらうんだけど、
そこからある程度自立駆動的に開始を入れてもらえるみたいな仕組みを作ってくれたので、
その辺を試行錯誤したと思うので、そのあたりの知見を共有いただけると嬉しいなというふうに思ってます。
はい、まあちょっとその本題に入る前に、最近はどうですか。
かわさ、ウィンドサーフ、コーデックス、クロード、コード、どれ使ってるみたいな。
いやー結局、コーデックスとウィンドサーフだけにまたなりつつあるかもしれない。
あーそうなんだ。
まあクロードコードとかは結構大きな回収してもらうときにはよく使うんだけど、
最近だとどっちかっていうと深い調査だったり、すごくクリティカルな問題を解決するみたいなタスクが多かったので、
やっぱりコーデックスじゃないと解決とか筋のいい実装っていうのがなかなか難しくて、
コーデックスで動かしてることが多かったかなーっていうのは。
それはもう完全にカーサーとコーデックスだわ。
でもコーデックスプラスなんかエディターみたいな座組は一緒かもね。
エディターの使い方っていうのが違うのかもしれないけど。
カーサーはやっぱデバッグモードが優秀なのと、
先週のやつで言ってたデバッグモードとあとビジュアルエディターが結構いいなっていうところが、
コンテキストが渡しやすいから細い修正みたいなのはカーサーでお願いしたりとか、
あとデバッグしてエラーの回収みたいなところとか不具合の回収みたいなのはカーサーでやって、
カーサーでシャットGPTの5.2のモデルを使ってやって、
実装自体はもう完全にコーデックスにお願いします。
結局クロードコードの方がコンテキスト量が少ないよね。
結局コーデックスでワンパンでやってる方が合理的だなっていう。
頭もコーデックスの方がちょっと一枚わてな感じするし、コードベースの理解とかも含めてっていう感じですね。
遅いけど。
遅いね。コンテキストウィンドウがね、クロードコードよりも倍ぐらいある。
オーパス4.5よりも倍あるから、それもあってコーデックスの方が。
サブエージェント使ってても結局枯渇するよね、コンテキストウィンドウが。
そうするとコーデックスで一発ドンでやってもらう方が効率がいいっていうのと、
あとコーデックスCLIで動かすと遅いんやけど、
サクサク回収したいときはカーサーでやるから、
カーサーでやってると早いから、そんなに遅くないから、
だからそれでバランス取れてるみたいな。
だからコーデックスCLIに大きい回収やってもらいつつ、
こっちでちまちまカーサーで回収してもらうみたいな、
を並行でやると結構いい感じに動くなっていう。
でUI周りでちょっとコーデックス解けなさそうだなみたいなときに
アンチグラビティでボンとやってもらうみたいな。
落ち着いたね、完全に。
まあ直近この1,2週間ぐらいの落ち着き方といえばそんなもんかな。
そうだね、阿部ちゃんと俺はカーサーとウィンドサーフで
そこはちょっと交わらないんだなっていう話してて。
ちょっと多分タスクの性質の違い上というか。
そうだね、僕の場合はやっぱりウィンドサーフがやっぱりいいかな。
カーサーよりも使い心地がいいっていうのがバッて。
どうしても高度の品質をしっかり読み込んで担保していく。
テストだけじゃなくてどういう風な実装がされているかとか
お客さんにどういう風な仕組みなんですよっていうのをちゃんと伝えられるように
理解をしなければいけないっていうところもあるので
AIが書き散らしたコードを全部見るみたいなことはやっぱり
未だにしているんですけど
そうなるとやっぱりウィンドサーフにあるディープウィキだったり
あとはコードマップっていうどういう風に処理が流れているのかっていうのを
可視化してくれるようなツールが標準搭載されていて
それをサポートに使いながらどんどんコードを読み込んでいくっていうので
レビューをしているような感じなんだよね。
本当に今までLLMが出るまではコードレビューなんて
1時間に200行とか読めばいいぐらいだったかなと思うんだけど
1時間は多いかな。
でもコードレビューで200行とか300行読んだら結構読んだなって感じなんだけど
AIはもう数千行の単位でコードを書いてくるから
それをある程度読み込んでいくっていうと
それぞれがどういう風に動いているのかっていう支援のもとを
理解していかなきゃいけないから
どうしてもウィンドサーフがやっぱ体に馴染むなっていう感じだった。
逆に俺の方はやっぱUIの細かい調整みたいなのが多いから
コンテキストを本当に渡しやすいっていうのが効いてるなっていうのをすごい感じるね。
今までスクショ渡したりとかもしてたけど
どうしてもアンチグラビティにもどれにも解けなかった問題が解けたっていう
明確にDOMで指定できる。
もちろん検証ツールでDOMで指定してってやったらいいんやけど
そこまでやったとてちゃんと改善してくれるかもわかんないし
支援の問題だったから放置してたみたいなやつ
DOMごと明示的に指定できると迷わなくなるっていう
ここのこれって言えるっていうのが結構でかいなって
あとプレイライトとかに任せたりとか
結局改善のサイクルというか
ピンポイントでここ直してっていうのをその場で伝えられて
カーサーはビジュアルエディターめちゃくちゃ便利だよなって
結局ビジュアルエディターでポチポチして変えるやつは
結局あんま使えないなって感じ
だからDOM指定に使ってるって感じかな
ここを変えてくださいみたいな指示を与えるための
あとスクショとかも渡せるからDOM指定しつつスクショをやって
スクショの元の状態とクリーンショットX使ってるじゃん
クリーンショットXでちゃんと図解で指摘するみたいなのも一緒に添えると
劇的に精度が高い
そうなんだ
指示をスクショとってテキストで渡すっていう
テキストというか図解するっていうのも合わせて
DOMでここのこれがこういう風になってほしいっていう
コメントでテキストでのやり取りも合わせてスクショで
視覚してここの場所ここみたいな感じでやっとくと
めちゃくちゃ精度が高い
そうなんだ
人と変わらんなって感じ
具体の指示を
そうそう絵でも伝えるっていう
絵で伝えると非言語的なところまで伝わるから
みたいな感じかな
じゃあちょっと本題の方に入りますか
そんな感じで
阿部ちゃんからどういう仕組みを整えていってるかみたいな
今週の1週間くらいでちょっとやってたことが
GitHubっていってソースコードを僕たちは普段オンラインで管理してるんですけど
そこになんかコードを上げて
昨日追加しましたよっていうプルリクエスト
レビューしてくださいっていうリクエストを普段投げているんですけど
それをしたときにAIが
3つぐらいのAIがレビュー返してくれるんですが
結構毎回コマゴマとして来される割には
それをまた僕らの手元で回収して
また反映するみたいなループを回していくのが
結構めんどくさいなっていうところがあったので
自動でそのAIからのレビューの指摘については
直してくれるよねっていうところを
作りたいなってずっと思ってたんで
今週試してみました
しかもあれなんですよね
結構Xとか見てると
プルリクエストに対するレビューを
自動修正できるようにしましたみたいに言ってる人が
なんかチラホラ言って
結構実現可能なものなのかとは思ってたんですよ最初
皆さんやってるのだと
例えばクロードコードをGitHub Actions上で実行して
実現可能性の検討
レビューのコメントがついたタイミングで
実行してGitHub Actions上でクロードコードを動かして
修正とまた反映っていうのをやってもらうであったり
あとはそれこそOpenAI
GPTのモデルをAPIで叩いて
これもGitHub Actions上で回すとか
っていうのをやってるのを皆さん見てたんですけど
実際にそれをやろうとすると
どれもお金が発生してしまうっていうところが
結構僕の中で課題にあって
なんかあれなんですよね僕たちってほら
クロードコードとかGPTのコーデックスとか
結構AIに対してサブスクを課金しているので
これ以上しかも結構月200ドルとか
これ以上レビューを修正するのに
お金がさらに追加がかかってくるのが
なるべくローコストで追加課金なしで
サブスクの中でできる仕組みが構築できないか
っていうところをちょっと考えていました
結論 クロードコードとかではどうしても
追加課金が走ってしまうっていうところがあって
やるとするとGitHubにコーデックスと接続することで
コーデックスのクラウド版っていうのが元々あって
それとGitHubを接続することで
サブスクの範囲内でプルリクエストのレビュー
修正してくれるっていうところをようやく分かったんで
ちょっと試しに組んでみたみたいな感じですね
GitHubとの連携
で まあ
があれとするとコーデックスのクラウドと
GitHubを接続しておくと
もともとアットコーデックスってメンションすると
レビューをしてくれたりとかあるよね
あの機能を使うと
普通にアットコーデックスでメンションかけて
レビューしてくださいって言うと単純にレビューのコメントだけが
返ってくるんだけど それ以外にもこういう実装してっていう風に
言うとその情報がそのまんま
コーデックスのクラウドのほうにデータが渡っていって
そのクラウド上でGitプルして
コードの修正を走らせてくれるっていうような形になっているみたいなんですよ
これはサブスクの枠内で
実行されるのでAPIの課金がないっていうような感じ
ただ あれなんだよね
どうしてもコーデックスクラウドっていうのが
ソースコードを引っ張ってくることは
できるし その引っ張ってきた後にプロジェクトを
コーデックス自身がセットアップすること自体はできるんだけど
その後は本当にサンドボックスモードで動くみたいで
どうしてもネットワークに接続ができないっていうのが
制約としてあるみたいなんですよ
デフォルトの設定では
修正した後にその修正した内容を
直接さっきまでプルリクエスト
開いたものに上げ直すっていうのは
今のところちょっとできてなくて とりあえず修正してくれたのを
コーデックスが修正しましたってコメントだけはなぜか
GitHub連携の仕組みを使っているのか
やってくれるので それを元に修正して結果を見に行って
それをさらに
結果を見て反映ボタンを押すと反映されるみたいな感じになってますね
今のところ
それはGitHub Actionsから
Add Codecsで呼び出してるみたいな感じってこと?
それで言うとそうだね
クロードコードと今コードラビットとコーデックスのレビューが
3体走ってると思うんだけど それらのレビューが全部終わったタイミングで
コメント
Add CodecsっていうメンションをかけるGitHub Actions
を一瞬立ち上げて
コメントだけしてもらって それをトリガーに
コーデックスに修正を依頼するみたいな形になってるかな
そういうことか
そうそう
だからちょっとだけGitHub Actionsの実行は走るんだけど
本当にコメントだけ書いて あとはもう
コーデックスクラウドに完全に委ねるみたいな
形になってるかな
もともとはGitHub Actions上で実行することも考えてたんだけど
僕らだとプルリクエストに対して
レビューだけでGitHub Actionsの無料枠を
超過しているっていう状況もあって 月結構な金額
GitHub Actions上で実行してるので
そこ上でレビューの修正とかをやらせると
かなり追加コストになっちゃうなっていうのがあったから
GitHub Actions上でやるのは避けたいっていうのも
結構意図としてはあったんよね
例えばクロードコードとかは
そういうふうにGitHub Actions上で動かすことはできるんだけど
やっぱりそれは追加課金かかるし
コーデックスに関してはGitHub Actions上で
動かすときはサブスクの範囲内では
実行できなくて APIの追加課金が必要
重量課金が必要になっちゃうから
二重支払いが発生するみたいな感じになってしまうので
どうしても難しいなっていうところもあって
今のコーデックスクラウドにメンションする
みたいな形に落ち着いたかな
コーデックスクラウドのレビューとか
リントとかはテスト落ちてでも解消してくれるんやんな
そこに対してのレビューが今
GitHubの仕組みがないじゃん 追加プッシュに対しての
コーデックスが 今だと不安定っていうかな
そうだね
一応コードの変更があったら 必ずクロードコードの方で
レビューを追加でして
それに対するコメントをしてくれるはずなんだけど
それがなぜか今だと
前の状態のソフトコードを参照していたりして
直したものが直ってない前提でレビュー返ってきたりするっていうのが
あるから
レビューの精度と改善
見てくれてる時もあるんだよね だからなんなんやんでしょうね
もしかしたら最新のプッシュがあるかどうかを見るみたいなステップを
挟んであげるだけで 指示の問題なだけかもしれない
ちょっと僕はクロードコードのレビューの仕組み
まではちゃんと見てないから
これは直そうかなと思うんだけど
見てくれてる時あるから直せそうな気がする
見れてないことはないというか
レビューとかで担保されないってなった時に
俺とかだと
信憑性が担保できないから自分で見て
結局
レビューとかコメントとかテストが落ちたとか
そういうのに対して回収してくれてるのは知ってるんだけど それは無視して
手元のCodecs CLIでやっちゃうっていう
感じに今なってるっていうのが
俺の今の現状やねんけど あべちゃん的にはCodecs Cloud
でも精度は十分出てると思ってるイメージで
なんかね指摘されてる内容によりけりで
例えばコードのフォーマットが悪いですよとか
リント落ちてるよとか あとは
ちょっとした改善ぐらいだったらもちろん
きれいに直してくれるなって感覚があるんだけど
そもそもこれ使用として
大丈夫みたいなフィードバックを
Cloudのレビューが投げてくれたりするじゃん
再検討がそもそも必要なパターンだと
判断が必要になるし Codecsも自己判断で
修正してくれてもそんなにちょっと前提が
伝えきれてないっていうのもあって
伝えきれてないのできれいな修正にはならないなみたいな感覚があるかな
なるほどね
そもそもチェックのフローが挟まってないからっていうのもある
だからまあ個人的には
最後のラスト1マイルのちょろっと修正を
してくれたらおんのじかなっていう風に思ってるかな
そう考えるとGitHubに修正したのを
いきなり上げられると逆に困るケースも今後出てきそうかもね
そうやね
結局ハンドリングしづらいイメージはあるよね
情報収集して
くれるだけでもいいけどね
そうだよね確かにコメント
レビューのコメントを全部統括して
各情報整理して本当にそれが指摘として
妥当なのかとかどこに問題がありそうなのかっていうところだけを
整理してコメントを入れてもらうだけみたいな
一応コーデックスクラウド上だとリフは見れるから
だからドキュメント作成したらそれだけぺってコピれるようになるから
それだけでもありがたいなって感じはする
むしろそれのほうがありがたいかもな
確かにそれをコピってローカルのコーデックスに
ぶん投げて直してもらって検討も一緒にしようみたいな
みたいな感じでそれ自体がプロンプトになる
みたいな状態まで持っていってくれたら
それをコピペするだけであとはコーデックスがよしらにやってくれる
確かにそれはいいかもしれない
それもサブスク内でできるのは嬉しいことやけどね
いずれにしても
ギャーって回収してくれるときもあるってことでしょ
全然いいじゃんみたいなときも
無視してるな
結局
AIによる自動修正の導入
コーデックスの修正自体が本当に妥当かってのはコードを見ないと
なかなかわからんからじゃあコードを見て判断できるかっていう話になるよね
そうそう
そうするとやっぱちょっと俺には重たいなってなっちゃうよね
確かに
だったらテキストで今こういう状況だっていう整理をしてくれてる方が
それを元に自分で改善するよって感じかな
そうそう
確かに
みんなどうやってんだろうなって結構Xで眺めてると
自動修正できるようになりましたっていうのが
もちろんやり方を言ってる人もいれば
特にやり方もなくって人もいてやり方書いてある人はみんな
追加書きあとコードラビットを導入しましたっていうパターンもあるかな
確かコードラビットも修正してくれるんだっけ
してくれると思う有料プランだと
あれがなんか結構数字よくやってくれるのかどうかは
若干気になってるんで
コードラビットはなんだろう一個一個の変更に対してみたいな
なんか細分化して精度を上げるみたいな仕組み
だから
うまくやってくれそうな気はするけどねレビューはすごいまとえてるレビューも
多いもんね
レビューはすごく多かったと思う僕らも一回
フリーミアムで使ってて
結局シート課金っていうのもあって
コーデックスとクロードコードのサブスクで十分かーってなって
課金には至らなかったけどね
そうだねあれまででも課金すると
もうサブスク時刻になっちゃうからね
AIサブスク時刻ですよ
ウィンドサーフだったりカーサーにも課金してクロードコード
コーデックスとそれぞれやってみたいな
役割があるもんねむずいよね
みんなそれぞれ違っていいところもあるし
足りない部分もあるし
まぁ仕組みとしてはいいから
磨いていきたいですよね
そうですね
探した感じだとこれしか
追加コストなしでやるっていうのはあると思う
サブスク課金を活かすとしたらってことね
他にやり方あったら知りたいぐらいの気持ちでやってます
コメント欲しいですね知ってる人がいたら
いたら欲しいですね
ありがとうございます
レビューコメントとか落ちてるところとかをまとめてくれるように
してくれたら僕は嬉しいです
そっちに切り替えてみます
じゃあ今日はサクッと
ですがこんな感じですかね
今年そうですね1年いろいろあったけど
終わりはサクッとこの修正で
ついて放ってで終わりでいいんじゃないですかね
はいじゃああれですね
何回目だ今13回目とか
14回目とかぐらいかこれが14回目なんじゃないかな
はいはいはい
一応週1ぐらいで続けそうな感じよね
そうだね話題尽きないっちゃ尽きないかなってのはあるからね
どんどん更新はあるから
確かにてかあれはもうね
情報の進化が早すぎるから
AI駆動開発部の日常は取ったらその翌日ぐらいには出す
リスナーへのメッセージ
みたいな感じのフローしてるから取り舐めてないっていう
今の話をするっていうのに
しないといけないからね
今まで1時間ぐらいで話してきたけど
30分ぐらいでコンパクトに予定をバババッと
分かるようにするのもいいかなっていうのは
ちょっと思ってます来年から
ちょっとコンパクトにしてタイトルミッド中身が
結構しっかり紐づくみたいな
結局4つとかトピック話すともう分散しちゃうもんね
けど別に1個のトピックで1時間も喋る
ことはないじゃん基本的に喋ろうと思ったら喋れると思うけど
なんか冗長のだけというかみたいな感じ
だとしたら30分ぐらいで最新の
トピックポンと売れるみたいなそんなのがいいかなっていうのは
ちょっと思ってますそういうのがいいのかね
それかなんか1週間の
AIのちょっと気になるトピックみたいなまとめるみたいな
セクションを設けるとか思うかもしれない
こういうニュースありましたよみたいな冒頭の5分
とか10分ぐらいで
軽く雑談してで週トピック
の話を2,30分して終わりみたいな
もうちょっとなんか雑談チックでもいいのかもね
5分10分ぐらいを今日言ってたサッカーサーとか何してんの
みたいな話とか
それでもいいかもしれない
雑談というか1週間のトピックいろいろアップデート
あるわけだから話せばいいかなと思うし
そうだねだって
クラウドフレア微妙だったみたいな話も含めてね
特定のユースケースにおいてクラウドフレア微妙だったみたいな
結構ねコスパ良かったりみんな最近
クラウドフレアいいよねみたいな話はしてるけど
うまくいかないケースもあるみたいなフィットしないケースもあるよね
なんかそういうのタイトルには載んないんだけど
そういう最近の気づきみたいなのをシェアするみたいなのを
入れるみたいなのもありかもね
じゃあちょっと来年はそんな感じでやっていきましょう
はい
じゃあこんな感じですかね
今週はこれで
今年はこれで以上ですかね
じゃあ本年もありがとうございました
来年もよろしくお願いします
じゃあまた
本日もAI駆動開発部の日常をお聞きいただきありがとうございましたいかがでしたでしょうか
今回の話題なんですけれどもAppleリクエストを受け取って
レビューとかあとCIが落ちたりとかいろいろするんですけれども
それを自動でCodexに拾ってもらって
回収までしてくれるっていうような仕組みづくりをしましたよ
みたいなところの話だったんですけれどもいかがでしたでしょうか
他にも気になるトピックとかあればぜひコメントとかいただけると嬉しいです
このPodcast気に入ってくれた方はいいねやフォロー高評価ぜひお願いいたします
今年最後のエピソードとなりますが
また来年もどうぞよろしくお願いいたします
またお楽しみくださいバイバイ
30:27

コメント

スクロール