24【CodeRabbitを導入！】1PR毎のAIレビュー375件をどう捌く？

00:02

おだしょーこんにちは、AI駆動開発部の日常

へようこそ。このポッドキャストは日々AI駆動開発を行う企業課の

山本とエンジニアの阿部がAI駆動開発のリアルを緩く語り合う番組

です。本日もよろしくお願いします。山本はい、よろしくお願いします。

おだしょーお願いします。今日はレビュー

関連、AI駆動開発やるってなると AIにレビューさせていくっていう

ところも結構必要。人間の目でレビューしていくのは正直限界がすぐ

来るっていうところがあるので、レビューもAIにさせたほうがいい

よねと。レビューもAIにさせるということはそのレビューに対する

対応みたいなところもAIにやらせないと結局人がボトルネック

になってそのレビュー待ちでレビューを人がやるんだったらレビュー

待ちで止まっちゃうしせっかく勢いついてるから逆にレビュー

の解消も人がやってるとそのせいで止まっちゃうしみたいな感じ

で、結局感じが悪いみたいな感じになるからレビューをAIにさせる

っていうことは結構重要。AI駆動開発においては重要なのかなという

ふうに思ってます。特に僕とか多少の開発知識はあるにしてもいわゆる

非エンジニアの人間が開発をするようになってそのときの品質担保

っていうところでもやはりセキュリティレビューもそうだしコードベース

上のレビューみたいなところもそうだし様々なレビューを逆に

もらわないと厳しいみたいなのがちょっとあるのかなと思っていて

ちょっとその中で最近Code Rabbitっていうサービスを導入したんでそこの

話とかあといろいろレビューを AIにやらすことになったことで

出てきた課題をどういうふうに解決したのかみたいなそのあたり

の話ができたらなというふうに思っておりますのでよろしくお願いします

はいよろしくお願いします

はいちょっと本題に入る前になんですけど阿部ちゃん的に普段いろんな

Code X、Devin、Cloud、あとはCode Rabbit とかそれぞれからレビューが返って

きてると思うんやけど名にすると思うんやけど実際にこのレビュー

どうなのかみたいなどんくらい妥当なものくるのかとかあんの

かなその辺からちょっと聞けたらいいのかなと思ってAIレビュー

どんなもんみたいな

確かに最近割ともう妥当性の検証自体AIに任せててもうあんまり

03:02

見てないっていうのは若干ありつもなんですけどなんかその中でも

やっぱチラッと斜め読みはするんですよなんか最後こう妥当性チェック

して手元にそのレビュー来た後に手元のCode Xで妥当性を検証する

フローを組んでるのでそのレポート結果を斜め読みするとまず確実

に以前もお話ししてたかもしれないですけども確実に的確な指摘入れて

くるのやっぱCode Xがピカイチなんですよね

おだしょーなるほど

彼の指摘はもうほぼ100で対応しなきゃいけないぐらい本当に周りに外す

ことはもちろんあるんですけどあとは指摘がきつすぎるみたいな

話もあったりするんですけどもう彼の言ってることはだいたい正しい

みたいな感じです

おだしょーなるほど

おだしょーちょっとデビンが最近導入したばっかりなんでまだ僕の

中で肌感がしっかりつかめてないんですけどもデビンもまあ正しい

ことは言ってるんですけどデビンはこう書いたらっていうサジスト

も一緒に投げてくれるんですよ Code のサジスト

おだしょーうんうんうんうん

おだしょーあれがちょっとなんか僕的には

そんなにいやこの書き方だとちょっと違うかなみたいなところもあった

りして逆にこう確かに言ってることは分かるんだけどまあ結局

自分で直すみたいなまあ手元の Code Xにやらせるみたいなことが多

かったりします

おだしょーあーデビンの

おだしょーそうデビンのサジストかな

おだしょーはいはいはいはい

おだしょーあとまあね残るはコードラビット

とクロードコードのまあクロードのデビューなんだけどまあコードラビット

はね結構いい感じに指摘はしてくれますであのとにかく数が多いん

ですよコードラビットの指摘は結構な数を打ってくる

おだしょーあーそうだね確かにへーって言った

けどそうだもんそうだもん

おだしょー結構な数を送ってたまになんです

けどほんとすごいときはなんか 15件とか20件ぐらい一気にこうデビュー

返して

おだしょーうんうんやばいよねやばいよね

っていうか

おだしょーうんまあ僕らのこれちょっと話

逸れちゃうけど設定としてかなり積極的にデビューを返すようにっていう

設定をまあしてるっていうのはもちろんあるのでまあそれぐらい

になってくれるのはありがたいんですけどもまあそのうちのまあ

7まあ67割ぐらいは対応しておいたほうがいいって感じでで残る2

3割ぐらいはたまに外してるときもあるしまあなんかまあやりすぎ

かなみたいなそこまではやらなくていいかなみたいなものも含まれてる

06:03

ような感覚ででえークロードかあのクロードの指摘はまあ話半分

ぐらいで聞いてればいいかなみたいな感覚でなんか言ってるなーと思いつつ

たまに本当にいいこと言ってたりするんでまあ無視もできないみたいな

これ何なんだろうねなんかよくわかんないプロンプトのせいなの

かなと思いつつなんかちょっと漁ってな方向だったり関係ない

話持ち出しだったりしたりしてうんうんなんか話半分ぐらいで

いいかなみたいな

おだしょーわかるわかるクロード別にもうレビューいらないんじゃ

ねって思っちゃうもんねちょっとだけ

山本そういう話もしてるもんねなんかクロード外すレビュアから

みたいな

おだしょーそうそうそう

山本あとちょっとこれ補足なんですけど僕たちのチーム上では使ってないん

だけどあのGitHub Copilotもまあレビューを返してくれるんですよでこれは

プロプランに入っているユーザーとかがCopilotレビュアとして召喚

できるっていうのもありまして僕はGitHubのプロプランに月額

400円か800円ぐらいかなって入ってるんで一応召喚はできるんですよ

ただこれこの子は多分優秀だとは思うんですけどなんかそのCopilot

側でなんか事前に何だろうプロンプトの設定とかをしてあげる必要が

あってただちょっと僕それめんどくさいなっていうのがなんか他で

結構しっかりやってるからめんどくさいなと思ってるんであんまり

やってなくてただ試しにこうどんぐらいの性能出るのかなと思って

やってみるとやっぱりプロンプトがちゃんと設定されてないから

かなんかいまいちなレビューっていうような感じが多くてなんかせっかく

僕プロプランに入ってるんだったら必ずレビュー返してもらおうかな

と思いつつもなんかもうこれ以上レビューいっぱい返ってきても

止まるなっていうの使ってないっていう感じ

うんなるほどなるほどまあそうだね多分俺も概ねコーデックス

は絶対必須Code Rabbitはもうすごいいっぱい言ってくれるから逆に

安心感はあるしかもなんかCode Rabbit のレビューをコーデックスとかに

妥当性チェックさせたらそんな別になんかねたまにもちろんある

けど妥当性ありませんみたいなけどほとんどそんななんか妥当性

もないような指摘をバンバンしてくるイメージはないからその辺

が一番重要なレビュアーだなっていうふうに思って

そうそうだねコアなレビュアーとしてはこの二人なのかなっていう

09:01

感じだね

うんうんちょっとDevinはね最近入ったばっかだからなんかあん

まり僕の中でイメージはないんですけど Code RabbitのちなみにCode Rabbit

のさあのあれは提案みたいなのは

いいかどうかみたいな

そうそうそう

いや僕ね正直もうCode Rabbit とかね細かく見てないんですよ

彼の言ってることはある程度信用しようかなっていうところでプロジェクト

自体もそんなぐちゃぐちゃに上がってる状況じゃないから言ってる

ことはきっと正しいんだろうなみたいなところで僕が確認してる

と結局ブロックしちゃう人間が解体するとブロックしちゃうん

うんうん

もう見ないで指摘されたらどんどん取り込むっていう方針

して

うんうんまああくまでもコーデックス

にレビューの妥当性をチェックした上で取り込んでいくみたいな

感じだね

そうだね

うんなんかけどそこのバランスって難しいよねそのなんか俺なんか

基本的に逆に俺はあのまあちょっと今回阿部ちゃんが整備してくれた

んでもうあんまり見ることなくなるかなって思ってんねんけど

レビューのその妥当性とか含めてたまに仕様の食い違いがあった

りするんですよね

うんまあたまにあるね

うんまあけどなんだろう最終的なまあ動作チェックはするわけ

じゃんだからそこで抑えるみたいな感じになってくんのかなやっぱり

うん今のところはそう最終的な動作チェックとかあとは

P2Eテストも今GitHub Actions上で動作するようになってるからそこ

で抑える前提のもとそのレビューの返答というかレビュー対応に

関しては自動化していくが一番パフォーマンスとパフォーマンス

が出るのかなみたいな気持ちもあるただ一方で僕自身やってて

もなんかレビューがあまりにもラリー多すぎるなっていうとき

とかは特にこれ当然だけど危険なシグナルだと捉えていてやっぱり

要件が正しくAIが理解できてないが故になんか間違った修正をして

しまって指摘されて戻すんだけど戻し方も中途半端でみたいななんか

報酬を繰り広げてるときもたまにあるんですよだから一定なんか

ラリーしてたりしたら様子を見て介入するとかはやっぱりするし

あと斜め読みレベルではあるんですけど全体の対応終わったときにどんな

12:01

修正したんだろうなみたいな読んでおかしいときはやっぱりたまに

あるのでそんな感じで全部のレビューを妥当性チェックしてどのレビュア

からのレビューが妥当だったかどうかっていうのを僕はあまり

チェックせずに最終的な成果物として正しそうに実装されていれば

一旦それでよしっていうような感じで見ているので細かくはどの

レビュアの指摘がすごい良かった良くなかったみたいなのは今トラッキング

できてない状態逆にちょっとそこはやってみたいなと思ってて今

妥当性の検証この後また詳しく話せたらなとは思うんだけどレビュー

が来たら妥当性チェックみたいなのをしてどのレビュアから来た

レビューが妥当かどうかっていうのを一覧で最後レポート出して

くれるような仕組み作ってるじゃないですかあれをちゃんと記録して

どのレビュアのどの指摘が正しかった正しくなかったみたいな

メトリックスみたいなのを積み上げていくとよりチューニングがしやす

くなっていったりしないのかなと思って例えばそれをデータベース

とかに蓄積していけばCodeRabbit の指摘でこういうのがミスの指摘

になりやすいとかだったらプロンプト調整しようとかCodeRabbit結構肌

クロード外す確率かなり最近高くなったよねってなったらレビュア

から外れてもらおうなのかもうちょっとプロンプト調整しよう

みたいな話とかがもうちょっと定量的なのができそうな基盤が

今できつつあるかなと思ってるのでそういうのをちょっとやって

いけたらなとは思ってるよね

おだしょーそうするときに今日知り合いの人と話してて

その文脈っていうのかな文脈がユーザーストーリーみたいな

形で仕様の変えりみたいなのに気づけるような仕組みは欲しい

よね例えばこれ打刻がシフト管理みたいなところでいうと打刻っていう

機能は開始時間と退金時間を記録するために必要なのにそれを阻害

するコードが埋め込まれたみたいな例えばみたいになったときに人間

からしたらっていうか僕たちからしたら当たり前の話じゃんいや

いやそんなことは今更みたいな感覚なんだけど AIが気づかない

15:04

みたいなことが結構あって

おだしょーまああるよねコンテキストがおそらく不足している僕らが

当たり前としている情報を当たり前として共有できていないとき

とかによく起こるかなみたいなイメージがあって

おだしょーそれもそうだし例えば今特定の機能は用意されてない

のに特定の機能をオンにする機能があるよってドキュメントに記載

しちゃうみたいなそういうのって関連性のあるものを引っ張って

来れるはずじゃんだからこの文脈においてこのコードの文脈

において何が必要なのかっていうのをこれは阿部ちゃんの話につながる

けどちゃんと引けてないコンテキストが渡せてないけども俺らの手が

介入しなくなるって前提に立ったときにコンテキストをわざわざ

渡すじゃなくて自分でやっぱ取れるようにしてあげないといけない

みたいな

おだしょーそうだね連想的になのか分からない

おだしょーそう連想ゲーム的にそれを今日話してたら小説と一緒

だなみたいな小説とか一番初めに作ったキャラ設定があってそれが

多分今だったらAIに例えば5冊分ぐらいまとめさせると最後のほう

には全然違うキャラじゃんみたいなとかこのキャラ設定のこのキャラ

がこんな発言するわけないじゃんとかもそうだし例えば推理小説

でこの庭にいるはずがないのになぜかいるような設定になって

たみたいなとか前後文脈が破綻するみたいなことが起きて多分

小説を作るのは結構難しいと思うよね今のAIだと

おだしょーはいはいはいはいはい

おだしょーそうそれは記憶保持というかストーリー記憶が難しい

から AIっていうのは

おだしょー確かに直前の情報をもとにどんどん小説とかを組み上げ

ちゃってどんどん実情報が乖離していくみたいなね

おだしょーそうみたいな究極論コードと小説って一緒だなと思

って

おだしょー確かになるほどね

おだしょーそうニューザーストーリーっていうのが小説のその1個の

物語なんだけどその物語っていうのが幾重にも重なっていってそれ

は初めに設定されたキャラ設定というかシステムでいうところ

のシステムそのものの前提設定が破綻してる状態のときに仕様

の乖離みたいなのがあるみたいなそういう前後関係が引けるような

18:02

仕組みを整える必要があるのかなっていう

おだしょーなるほどね多分ユーザーの例えばだけどユーザーのキャラ

設定みたいなのを事前にそもそもコンテキストとして定義ある程度

この人がどういうユーザーストーリーっていうとアジャイル開発的に

多分出てくる文脈なんだけどこういうときにどういうふうに

操作するか連想しながら例えばドキュメントの更新をしてもらう

とこの人がその人の思考をトレースするように操作したりするから

もしかしたら連想的にもうちょっと出せるものが出てくるみたいな

大平そうそうそうそう

おだしょーイメージなんかな

大平みたいなのを DBに保存するとかラグ化するみたいなのかもしれない

けどして整備していくみたいなのがただそうするとゴミみたいな

情報も多くなるからその辺の制御みたいなのが難しくなっていく

けどもうちょっと多分 AIに世界のあり方を認知させるみたいな仕組み

が必要なんだろうなみたいな当たり前の法則というか

おだしょーそうだね

大平みたいなことをちょっと最近話しててっていうのがあったちょっと

脱線しすぎて本題にまだ入ってないんやけどとりあえずそんな

感じで今 Code Rabbitとかも入れ始めて CodeX CodeRabbit Cloud あとDevian

の4社にレビューをしてもらってもうレビューが爆量に返ってくる

特にCodeRabbitもマジで爆量返してくれるけど言ってることが正しい

ことも多いから無限にはできないとか無視できないから全部対応

しないといけない阿部ちゃんとかだとそこの妥当性みたいなのを

目見で見て判断できるかもしれないけど僕とかだと余計見ても別に

どっちかどうか判断がつかないみたいな判断つくものももちろん

あるけどみたいなのがある中で CodeXに妥当性をチェックしてもらう

みたいなことをしてそこに人の手を介入させてると結構無駄

が多いなっていうところがあるんでそれで阿部ちゃんが整備して

くれたんよねレビューをどう裁くかみたいなそこの話もできたら

いいのかなって思ってあとねあれだよねそもそも爆量来てる

レビューの数をぜひに山内ちゃんのこないだのやつとか何件ぐらい

来てたのか話してほしいなって思ってたけど

何件ぐらい来てたっけやばかったよね多分多いのがちょっとどれ

21:07

かでもそうだな普通にコメント数で言うと 375とかになるんですよ

ね

おだしょーあるでしょ山内さんと AIの会話だけででしょ

おだしょーそうしかも 1個のプレリクエストで 1回の開発がでかい

っていうのもあるけどにしてもって感じやねコミット数の積み上げ

が100とかになるんですよねやり取りをしてるとつらい本当につらい

山内つらいよねそのときのプレリクエストの単位で言うとだいたい

1万2000行ぐらいの増減のあるような変更でそこに対して指摘がめちゃ

めちゃきて 375件のコメントとそれに対応するために 80回ぐらい

コミットを繰り返すみたいな修正を繰り返すみたいなことをやって

たんだよねきっとこれは

おだしょーうんそうつらかった

山内なんかこれ普段開発してるエンジニアからしてみれば正直

こんなレビュー返されるようなプレリクを作ってるのかっていう

ふうな疑いも逆に出てくると思うんですよこんな指摘箇所がある

ような穴の多いPRだったんかみたいな多分みんな聞いてるときに思う

と思うんですけど僕やってる中で感じるのはそうでもないんだよな

みたいなちゃんとローカルで開発してるはずなのに死ぬほど指摘

くるんだよなみたいな

おだしょーだから人間からこない指摘がくそくる

みたいな感じだよね

山内いやまさにそうなんですよやっぱりこれはAIの特性でもあるん

ですけど絶対にエラーを回避したいっていうのが根底にはあってこれ

なんか最近 AIの学習ロジック的にはとにかくスコア上げる方向に学習

させられてるからエラーが起きるっていうのは致命的に点数が下がる

のですべてのケースをカバーしようとするのでどうしてもそのいつら

にレビューさせるととにかくもう十箱の隅をつつくようなレビュー

が返ってくるっていうこんぐらいには膨れ上がるんだよっていう

のはぜひとも皆さんに共有したいなとは思いつつも

おだしょー AI駆動という点に立ったとき

山内そうそうそうそうじゃあこれを対応するってもう人間

からしてみたら地獄みたいな話で山内は実際横で見てて辛そう

にしてる

山内うんいや辛いしかも一応俺目通してるからね一応

24:04

おだしょーうんそうだよね

山内なんか仕様的にやばいのがあるかたまに

おだしょーうんうんうんしかもあるよねで修正はもちろん

AIがやってくれるけどプッシュしてもう一回修正してからテスト

回ってレビュー返ってきてまでなんか生事故10分ぐらい待ったり

することもあるからなんかフィードバックが

山内うんうんうんまあ他の作業するけど何かね切り替えがね

マインドの

おだしょー残ってるしねじゃあレビュー返ってきたかなって

確認しに行って返ってきてるからじゃあまた妥当性のチェックを

回してみたいなフローを何かこう人間が行き来するみたいなのが

今までだったよね

山内そうしかも AIにお願いしたらさあすぐさあやってくれるのに

さあ俺が忘れてたりとかしたらそれだけ時間ロスなんよね

おだしょーいや本当にそうだよねなんか忘れちゃって1時間後に

あそういえば変身何かレビュー来てんだったみたいなさ

山内うんうん

おだしょー普通にロスってしまう時間のロスを生んでしまって人間

がねどうしてもボトルネックになってるなっていうところがやっぱり

あったかなあこれは僕もなんかもう本当に半日を放置しちゃった

とかよくあったんでそこを今回改善したっていう話かな

山内うんうん

おだしょーで何かまあ

山内その前提でね

おだしょーうん

おだしょーそうそうだねそういった前提があって改善を今回

やったんですけど何かもともとやってた妥当性の検証みたいな

ので言うとスラッシュコマンド今はスキルに統合されていたり

するんですけどスラッシュコマンドを僕らは使ってレビューが来た

後にプロリクエスト上のレビュー内容各項目が何が妥当で何が

妥当じゃないか対応するべきか対応するべきじゃないかっていう

のを AIに自己判断してもらって対応すべきものに関しては対応して

もらってテスト回してプッシュするみたいなのをもともと用意

していたんですけど結構このワンセット終わったら結局またさっき話して

いたように見に行ってとかレビューがまた返ってきてないかっていう

のを人間がどうしてもチェックしなきゃいけないような状態だったん

ですが今回改善したのは主に二つかなまず一つ目が来ているレビュー

をそれこそ 375コメントぐらい来てたら対応したものと対応しない

ものがもう分かんなくなるしそれを AIにどこまで対応していて

どこまで対応していませんですかっていうのをしていないですか

っていうのを APIで叩いたりしてチェックしてもらうにあまりにも

コンテキスト量が多すぎるっていう問題が起きてたんですよ実際山

27:00

ちゃんも起きてたと思うんだけどそれでコメント全部取得するだけ

でコンパクト走るみたいな状況が発生していたんですけどそこ

をまず改善するためにレビューの収集に関してはもう完全にプログラム

で行うように変えました GitHubのプロリクエストって GHコマンド

っていうCLIを使ったりだとかあとは APIを経由して GHコマンド

で単純にツールとして取得できるのと APIを叩いてデータを取得する

っていう二つの取得方法があるんですけどそれは割ともう決定論

的にこういう取得の仕方をすればこういうデータが返ってくるっていう

のはもう一時に固まってるのでそこはスクリプト化して未解決

のレビューだけ判定できるような状況を作ったほうがいいかなっていう

のでそういうのを作りましたスクリプト自体が例えばだけど

Goで書いたりあとはTypeScriptで書いて CLIツールとして配布する

っていうのをまず最初に考えたんですよ例えばNPXでレビューチェック

みたいなコマンドラインツール作ってやるみたいな方針で最初

考えてたしそれが普通かなって思ったんだけど GitHubを操作する

AIが操作させるために CLIっていう GHコマンドを使ったりするんですけど

このGHコマンドが面白いことに拡張できるっていう機能を提供

していてこれ GitHubが提供しているコマンドラインツールなんですけど

GHスペースエクステンションっていうふうに打つと拡張機能としてユーザー

が作ったいろんな拡張ツールを呼び出すことができるんですじゃあ

ってなったら既にそんなことやってる人たちいるだろうなと思って AIとか

から来てる大量のレビューをまとめるみたいな拡張機能として提供

されてるんだったら世の中にあるなと思って探したんですけどこれ

が意外となくて

おだしょーそうなんだ

りなたむそうなかった一応 PRのレビューを取得するぐらい

とかだったらあるんですけど結局それがレビューもいくつかのパターン

が実はこれあってこれもすごいコミって話になっちゃうんですけど

GitHubにできるレビューのコメントって普通のコメントイシューコメント

っていうコメントとあとはスレッドっていうレビューの中にスレッド

としてスラックのスレッドみたいなイメージしてもらえたらいいんです

30:01

けどレビューの項目があってそこに一件一件連ねるようにコート

して連ねるようにレビューを指摘していくみたいなコメントの仕方

とあとはレビューっていうコメントが3軸あってそれを全部総合的に

取ってきて 1個のデータソースとして取得できるようなものがなかったん

ですよこれができないとなかなか一元的にこのレビュー項目は対応

してないとかっていうのを一覧でマッピングすることって結構

難しいっていうふうに思ったので自分で拡張機能を作って今もう

公開してあるような状態でそれを使うとそのコマンド叩くことで

特定のプレリクエストにどれぐらいコメントが返ってきてすでに解決

済みなものが何件で未解決なものが何件でっていうのがもうパッと

取れるようになってるんで AIが自律的に探索するじゃなくてもう

決定論的に取ってきてそれを基に AIはじゃあ何件あるから対処しよう

っていうようなそういうフローになるようにっていうところで

改善しました

おだしょーそれってあれなの今聞いてる方とかも使えるよう

になってるってことじゃあ

山本もう使えるようになってます

おだしょーじゃあそれも言われる概要欄に入れとけますか

山本そうですねだからそこでまず大きく大量に来るレビュー

っていうのをどうまとめるかっていうところをある程度改善したっていう

ところが1点とあと結局レビューを妥当性検証をチェックして

対応してプッシュした後もまた次なるレビューが返ってくる

わけじゃないですかそこでやっぱり人間が開在してるとまたレビュー

来てるのをまた待ってたりとかエルマに渡れちゃったとか起き

ちゃうので今回プロンプト側を改善していてプッシュをした

後にスリープコマンドターミナルでスリープコマンドが叩けるので

300秒とか5分程度待ってもらってだいたい5分ぐらい待ったらレビュー

だいたい揃ってるんでどのレビュアからも揃ってるんでまたそこで

取りに行ってあるんだったら再度検証と修正とプッシュをして

みたいなのをずっとイテレーションを回すようにっていうような指示

を加えたっていうような

おだしょーなるほどスリープコマンドを実行してスリープコマンド

を実行してる間は AIは起きてる状態だからそれで保ってるのか

おだしょーそうそう AIはそれで待機状態になるから

おだしょーなるほどね確かに

33:03

おだしょー本当は軽量なモデルとかにエージェントループ的に

ラルフループっても言うかなひたすらコマンド送信して今この

リポジトリにあるプルリクを監視し続けてレビューの返信

とかが来たらメインのエージェントに報告しろとかっていうところ

を作ろうかなと考えたりしたんですけどシンプルに一旦スリープで待って

もらえばいいかっていうので意外とそれでいけるかなっていう

感じで変えたりする

おだしょーなるほどなるほど

おだしょーどうです結構やれてくれてるかな

おだしょーやってくれてるよちょっとまだ今レビューに対して

コメントが多分一部のレビューに対してはスレッドに返信する

みたいなことができなくてヒラでコメント何のレビューに対して

このコメントをつけてんだろうみたいなのが一部発生してる

けど結構ちゃんとリゾルブしてくれるしあとやっぱループして

くれるのは嬉しいね

おだしょー良かったそうだよね

おだしょーうんあと面白かったのは不採用のやつを親指を下に

立てるマーク結構侵略だなってグッドマークの逆が逆盤で

おだしょーそうだよねブーイングのマークで

おだしょーそう結構侵略だなって

おだしょーこれちゃんと理由があってシンプルにGitHubでできる

リアクションそのいいね悪いねとかのリアクションがそれぐらい

しかなくて

おだしょーそうだねけどあれしかもレビュー系のエージェント

を作ってる会社からするとちゃんとフィードバックくれてるから多分

それ収集してるはずじゃんグッドにしてるのと

おだしょーそうだね

おだしょーだからレビューを提供してる会社にとっても嬉しい

だろうなって思いながら見てた

おだしょーかもしれないね今確か CodeXとDevinとCodeRabbitがその

機能サポートしてるはずでアクションすると多分学習してくれるんだ

ろうなと思うからついでに学習してもらおうっていう感じだよね

おだしょーなるほどそうだね結構使えてるなって感じもともと

マストラのワークフローにしてもっと精度高くコンテキストも

圧迫しづらいような仕組みにしようみたいな感じで俺もちょっと横で

ちょろちょろやってたけど今の仕組みがあるならば一旦それで

36:00

いいじゃんって思っちゃってるぐらいには

おだしょーよかった

おだしょーうんイケてるなって感じちょっとガードレール的 AIに

縦横無尽に実装してもらうという意味においては結構レビュー

は大事だからだからうちも結構いろんなレビューをさせてみたいな

おだしょーそうだねあんな4体もいるのか CodeX CodeRabbit

CodeDevみたいなすごい手厚いなとは思いつつもやっぱそれでも

なお逆にあれかなそれでもなおとは言ったけどあんまり機能的な

バグを起こすことはなくなったなって感覚はありますけどね

おだしょーそうやね多分 Edgeケースに対する指摘が多いかなレビュー

おだしょーあとはたまに根本的にクリティカルなものは指摘して

きたりしてるけどけどほとんどそうだねだし俺も動作確認手元

でしたりするけど

おだしょーバグるっていうのはあんまりなくないなって感じで

もちろん難しい外部接続系とかでそれこそレスポンスが想定しきれない

ものがあってエラーになっていたりとかそういう普通に人間がやって

も結構難しいテストとかはリグレッションテストしてるときにこれちょっと

ミスったのかっていうのがあったりはするんですけど普通に人間

が実装してて実装ミスしましたみたいなそういう話はもうない

かなって感じ

おだしょーそれはないねこれちゃんと確認したんかなみたいな

エンジニアの人が実装してるやつをちゃんと確認したんかなみたいな

思ったりするときあったけど AIには思わないね特にCodexのサブエージェント

機能出てからここが抜けてたサブエージェントに基本的にお願い

するようにしたことによって親エージェントがサブエージェントのちょっとした

実装漏れみたいなのを補填するようにしてくるようになったから

余計なくなったなって感覚があるかな

おだしょーそうなんだそうはなりそうだけど実際そうなんだね

おだしょー実際そうだね今そういう動きをしてくれてだいぶ

助かってる

おだしょーいいね

おだしょーうんそうそうそうそんな感じでいい感じになってます

ねあとはそうだなレビューが手厚いのは安心材料にはなる

けどテストが手厚いのとレビューが手厚いのとあとレビューの中

でもこのT2Tテスト作ったほうがいいんじゃないみたいなとこが

39:00

くるからそれってある程度自動で増えていくというかテストも相当

厚くなってるんで安心感が増すよね

おだしょーそうだねテストもそうしあとドキュメントも

ここ付け加えといたらとか結構ね

おだしょーうんそうそうそうドキュメントはうちの場合は何か

自動でユーザーマニュアルとか自動でプリリックのサブを見て

ユーザーに影響があるものはユーザーマニュアルまで改変するみたいな

感じにしてるから

おだしょーそうだねそれ用のアクション図があるぐらいだから

ね今

おだしょーうんうんみたいな感じだけどそれも一応レビュー

でこの言い回しだと分かりづらいんじゃないとか言ってくれたり

とかもするからなかなかこいつら見てるなって毎回思う

おだしょー本当にね

おだしょーそんな感じですかね

おだしょーうんレビュー回りはそんな感じかな

おだしょーうんコードラビットで結構そうだコードラビット

のもともとGitHubのシート数分の課金みたいな感じだったけどプル

リクを投げる人の対象を選んでシート課金になったじゃんちょっと

俺のうるおぼやったあれやねんけど多分もともとGitHubにメンバー

として入ってる人全員課金やったよねうちとかだと別にプルリク

投げないけど入ってる人とかいるじゃん

おだしょーそうだね

おだしょーちょっともったいないなって思ってたんやけど例えば

俺と阿部ちゃんしかプルリク基本的にいつも投げないんだったら

俺と阿部ちゃんのシート分だけ課金してレビュー返してもらえる

ようにするみたいな有料プランだから多分それ価格待機変わった

と思うよね前から恐らく

おだしょーそうなんだ

おだしょーだから CodeRabbit 有料でやっていいなって思ったんで

以前 1回 CodeRabbitの話題出した時はあれは無料機関のやつを使って

みてっていう話をしてたんですけどそういう意味ではちょっとプラン

が優しくなったっていうそういう企業もいるんじゃないかなって

この人が基本プルリクこの人とこの人とか開発者が半分ぐらい

なんだよね前のシートの方開発者分のシートだけあってその開発者

に当ててるシート分のプルリクだけはレビュー返してくれるみたいな

感じにしてくれたらいいみたいなそうだから結構財布に優しくなった

っていうのは

おだしょーやっぱり僕も他の会社とかでやったりするとコミット

しない人とかいるので導入しやすいですよねやっぱり活発なメンバー

だけにとりあえずシート渡して

42:00

おだしょー段階的に導入しやすくなったっていうのは結構でかい

なって

おだしょーそれすごくいいね

おだしょーあんな系レビュー返してくれてやったら安いよね

おだしょー安いと思いますよ本当にこれは

おだしょー気がするあとファイルの行に対してコメントくれるじゃん

CodeRabbitってだから人間がレビューを見るという意味でも結構優しく

設計されてんだなっていうのが思うかもしれない

おだしょーそうだねあとそれもあるしあとサジェスト機能この

コードを変更したらでオッケーボタンというか押すともうコミット

されるからいちいちローカルにまた戻して修正しては不要になる

っていうのも結構いいよね

おだしょーそうだねあれ最近かな最近出た気がする前から

あったのか分かんないけど最近俺が遭遇するようになったかな

って感じ

おだしょー CodeRabbit側でサポートしたのかなもしかしてその機能

としてもともと提供されているものでだからそこに CodeRabbit側

がその形式でレビューを開始してくれるようになったのかなって

おだしょーうんうんうんうんどうなんか分かんないけどね

なんかそんな感じで結構使いやすくなってるからいいなっていう

ふうに思ってるって感じですねけど結局それでもうあとね

ちくちく言ってくるバージョンとやんわりめとそんなに言って

こないバージョンとっていう設定ができるけどうちはもう一番

厳しいやつしてるから

おだしょー厳しく

おだしょーうんまあそれのせいで出た課題をどう解決するかみたいな

感じになってるけど

おだしょーそういう感じだね

おだしょーまあそういう設定もできるのも結構いいよね結構

設定細かくできるのもいいかなって思ってます

おだしょー結構ね設定細かくできるそう

でその辺の話も本当はしたいんだけど僕が設定したときはもう

とにかくAIにコードラビットの設定のコンテキスト食べさせてとにかく

厳しくしといてっていうのを突っ込んだだけだから

おだしょーあんま設定項目知らないっていう AIがこれならいけるっていう

のを踏んだやつを運用してるから逆に聞いててでも設定多いしな

分かんないなっていう人がいたらとりあえず AIに設定ファイル生成

させるところからやっちゃえばいいんじゃないかなって思って

さえいるけど

おだしょーそれ結構いいよねペンシルもそうやけどコードラビット

設定ファイルで管理できるっていうのも結構でかいよね

しばやんいいよねそうそう Gitで設定ファイルももちろん管理

できるから AIにもとにかく厳しくいっぱいレビュー来るようにし

45:04

といてみたいな雑なお願いで導入する

大平けど一応あれを阿部ちゃんが設定した後にどんな設定したんだろう

なって思って見てたけどちょっとだけ変更したって俺言ってたよね

確かちょっとだけ変更したわって言ってたけど

しばやん言ってた言ってた

大平ほんのちょっとだけやったから割とまとえてたんやと思う

しばやんそうなんだなよかったじゃあ

大平なぜか俺が見るっていう

しばやんそうだね

大平まあそんな感じでちょっとレビューとか結構 AI駆動開発やってる

中では大事なんでちょっと今回議題として取り上げてみました

じゃあちょっと本日もありがとうございました結構長くなりましたね

しばやん長くなっちゃったねありがとうございました

大平ありがとうございます本日も AI駆動開発部の日常をお聞き

いただきありがとうございましたいかがでしたでしょうか今回の話題は

レビューとその対応についてっていうところがあったんですけれども

こんな感じでいろいろな話題について取り扱っていきたい

と思っておりますのでもしこんなことを話してほしいとこあれば

お気軽にコメントなどいただければと思いますこのポッドキャスト

気に入ってくれた方はいいねやフォロー高評価ぜひお願いいたします

それではまた次回もお楽しみくださいバイバイ

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

AI駆動開発部の日常

感想

総スター数

コメント

感想を書く