AI駆動開発部の日常 - AI駆動開発部の日常

24【CodeRabbitを導入！】1PR毎のAIレビュー375件をどう捌く？

Mar 2, 2026

今回は、「AIレビューが爆量に返ってきて人間がボトルネックになる問題」を起点に、AI駆動開発におけるレビュー体制と自動化について語っています。僕たちのチームでは Codex、CodeRabbit、Claude、Devin の4つのAIレビュアーを導入しています。これらについてどのレビュアーの指摘が的確で、どれが参考程度でよいのかなど、各ツールの評価について2人の意見を話し合いました。 AIのレビューと修正を繰り返すうちに、1つのPRがコメント375件・約80コミットまで膨れ上がってしまい、人間が手動で付き合い続けるのは現実的ではないという課題も浮き彫りに。後半では、阿部さんがこの課題を解決するためにGitHub CLIの仕組みに基づき、CLIの拡張機能を自作・公開した話や、sleepコマンドを使ってAIによるレビュー対応と再確認の自動イテレーションを回す仕組みなど、具体的な改善策に踏み込んでいます。レビューの妥当性検証をどこまで自動化できるのか、お互い気づきの多い時間となりました。 ▼CodeRabbit https://www.coderabbit.ai/ ▼Devin https://devin.ai/ ▼Github CLI https://cli.github.com/ ▼ 阿部さんが自作したGithub CLIの拡張機能 https://github.com/abekdwight/gh-pr-review-check --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

23【Amical・VoiceOS・Apple純正比較】音声入力ツール結局どれ？

Feb 22, 2026

今回は、以前も話題にした音声入力アプリAmicalのアップデートとして、阿部さんがVoiceOSやApple純正の音声入力を経て再びAmicalに戻ってきた経緯について語っております。スクリーンショットのコンテキストを読み取って文章を生成してくれるVoiceOSの機能に惹かれつつも、実際に使ってみると出力の精度に課題があったという阿部さん。一方でApple純正はレスポンスの速さと安定感が魅力だけれど、カタカナや英語の変換に弱い。この三つ巴の中でなぜAmicalに軍配が上がったのか、それぞれの強みと弱みが浮き彫りになるやり取りでした。後半では、Amicalの言語設定を英語にすると日本語の発話がそのまま英語に翻訳されるという偶然の発見から、コンテキスト効率やAIへの入力最適化の話へ展開。さらに音声入力が前提になった世界では、キーボードの配置やパソコンの形状そのものが変わるのではないかという未来の話にまで広がりました。 ▼Amical 公式サイト https://amical.ai/ ▼VoiceOS 公式サイト https://www.voiceos.com/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

22【悲願のCodexサブエージェント！】並列化でAIの思考が深まる理由とは？

Feb 15, 2026

今回は、ついに実装されたCodexのサブエージェント機能を実際に使ってみた感想を起点に、「サブエージェントによってAIの思考はどう変わるのか？」について語っております。僕としては待ちに待った機能で、experimentalながらかなり安定している印象を受けました。さらに面白かったのが、親エージェントがサブエージェントに進捗確認をしたり、タスク委譲の前段で視野を広げた探索を始めたりと、Claude Codeのサブエージェントとは少し違う振る舞いが見えてきたことです。スコープの分離が思考の深さにどう影響するのかという点でも、阿部さんとかなり盛り上がりました。 ▼Codex https://github.com/openai/codex 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

21【Z.ai GLM-5はメインで使える？】Opus 4.6やCodexと比較

Feb 14, 2026

今回は、2026年2月12日にZ.aiがリリースしたGLM-5を使ってみた感想について語っております。阿部さんはGitHubのプルリクエストに来るAIの自動コードレビューの妥当性評価と実装方針検討を、GLM-5とClaude Opus 4.6、GPT-5.3-Codex Extra Highの3モデルに同時に投げて比較したところ、情報収集やツールユースの巧さが光る場面がある一方で、最終的な判断にブレが出るケースもあったとのことです。僕の方でもドキュメント更新やPlaywright MCPを使ったE2Eテストを試してみました。もっともらしい嘘（ハルシネーション）をつく傾向があり事実確認には注意が必要ですが、タスクを前に進める「推進力」は非常に優秀でした。特にE2Eテストでは、画面に残っていた不要なエラー文言を自律的に発見して指摘するなど高い実行力を発揮しており、メインモデルとして採用できる可能性も十分に感じられた回になります。後半では、各LLMに同じプロンプトでLPサイトを生成させる比較の話題でも盛り上がりました。 ▼GLM-5 https://z.ai/blog/glm-5 ▼各LLMのLPサイト生成比較 https://nikukyu.sitocha.cc/testllm/index.html 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

20【Claude Codeの新機能】Agent Teamsとサブエージェント

Feb 13, 2026

今回は、Anthropicが提供するClaude Codeで新しく登場したAgent Teams機能について語っております。従来のサブエージェントが「隔離された部屋で黙々と作業する作業者」のようなイメージだったのに対し、Agent Teamsは「同じオフィスで対話しながら協働するチーム」のような概念だと捉えています。エージェント同士がメッセージをやり取りし、共有タスクリストで協調する仕組みそのものが、これまでとは異なるアプローチに見えました。阿部さんと話を通じて感じたのは、この対話可能性こそがAgent Teamsの本質かもしれないということです。あえて反対意見を言うDevil's Advocate役を配置したり、リサーチャー、ルール確認担当など役割を分担して議論させる。単なる作業効率化ではなく、答えのない設計をチームで練り上げるような「ミーティング」的な活用法こそが向いているのではないか。当然、チームメンバーが増えればコミュニケーションコストは指数関数的に上がり、コンテキスト消費も増大します。そのため、作業を並列で進めるならサブエージェント、知識的な議論を煮詰めるならAgent Teamsという使い分けが現実的なのかもしれません。 ▼Claude CodeのAgent Teamsについて https://code.claude.com/docs/ja/agent-teams 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

19【無料でここまで？】OSSの音声入力アプリ「Amical」でAI開発を加速

Feb 3, 2026

今回は、「AI駆動開発で音声入力を使いこなすには？」という観点から、無料で使えるオープンソースの音声入力アプリ Amical について語っております。僕はAmical Cloudの精度が高いと感じていて推していますが、阿部さんは深夜帯の文字化けを避けるためローカルの Whisper large-v3-turbo を使っているとのこと。PCのスペックやマイクによって最適な設定が変わりそうで、使い方次第では向き不向きがあるようです。ボキャブラリー機能を辞書的に使ってはいましたが、「句読点を入れてください」といった指示をボキャブラリーに登録する活用法もあるようで、これは試してみたいところです。後半では話題の OpenClaw についても少し触れ、AIがPCを操作する時代の「常識を疑う姿勢」についても話しています。 ▼Amical 関連リンク https://amical.ai/ ▼Whisper 関連リンク https://github.com/openai/whisper ▼OpenClaw 関連リンク https://openclaw.ai/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

18【FigmaからPencilへ？】AIネイティブなデザインツールの可能性

Jan 27, 2026

今回は、AIネイティブなデザインツール Pencil について語っております。僕自身まだ使っていないのですが、阿部さんが試しに触ってくれたところ、かなり気に入っている様子でした。Figmaに近い操作感でありながら、デザインデータがJSON形式でGit管理できるという点や、Claude CodeやCursorとMCP経由で連携できるという点が、従来のツールとは大きく異なる体験だそうです。「デザイナーがいないチームでどうUIを作るか」「ユーザーマニュアルへの画像反映をどう自動化するか」など、実際のプロダクト開発での活用イメージも話しています。後半では、AIをツールとしてどう組み込むか、エージェンティックに動かすサービス設計とは何が違うのかなど、サービス開発の視点でも盛り上がりました。 Pencil 関連リンク https://www.pencil.dev/ 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

17【コスパ最強は本当か】Z.ai GLM-4.7をCursorで使ってみた

Jan 26, 2026

今回は、Z.aiが提供するGLM-4.7という激安AIコーディングモデルを実際に使ってみた感想について語っております。月額3ドルから始められて、しかもウィークリーのレートリミットがないという破格のプランです。僕たちは普段Claude CodeやCodexを使っていて、毎週末にはレートリミットに苦しむことが多かったんですが、このGLM Coding Planだと5時間ごとにリセットされるため、使い切る心配がほとんどありません。API経由でCursorやOpenCode、さらにはClaude Codeでも設定できるというのが大きなポイントです。肝心の性能について、阿部さんと僕では感じ方に若干の違いもあり、「実務で使えるレベルか」「どこに限界があるか」など率直に議論しました。コスパ重視でAIコーディングを試したい方には参考になるかもしれません。 GLM Coding Plan 関連リンク https://z.ai/subscribe 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

16【opencode試した】並列開発サブエージェントとBest-of-Nの違い

Jan 19, 2026

今回は、AI駆動開発には切っても切り離せない「AIエージェントの並列実装」について、そのパターンや実際の使い方を語っております。並列開発には大きく2つのアプローチがあります。Cursorが採用しているBest of Nと、Claude Codeやopencodeが採用しているサブエージェント型。僕はどちらかというと1つの指示で複数タスクを采配してほしいと思っているのですが、阿部さんはGit worktreeを使って環境ごと分離する仕組みづくりに取り組んでいます。DBのコピーやポート番号の自動割り当てなど、プロジェクトごとにチューニングが必要だという現実もあり、理想と実装の間で試行錯誤が続いています。収録中にCursorにサブエージェント機能が追加されたことを発見する嬉しい場面も。CursorのCEOが数百体のエージェントでブラウザを構築した実験の話や、GLM-4.7のようなコスト効率の良いモデルの登場、GitHub Copilotのopencode公式サポート開始など、並列開発を取り巻く環境が急速に変わっていることを実感する回となりました。 ▼opencode 関連リンク https://opencode.ai/ ▼Cursor サブエージェントドキュメント https://cursor.com/docs/context/subagents ▼GLM-4.7 公式ブログ https://z.ai/blog/glm-4.7 --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f

15【便利なCursorのDebugMode】CodexとClaudeで使える？

Jan 5, 2026

今回は、阿部さんがCursorのDebug Modeを体験して「これはClaude CodeやCodex CLIでもできるようにしたい」と実装してくれたSkillsについて語っております。 CursorのDebug Modeは、AIがコードベースを読んで仮説を立て、ログ取得用のローカルサーバーを立ててそこにPOSTリクエストでログを送信させ、ユーザーが操作して事実を収集していくという流れ。僕のような非エンジニアにとっては、むやみにコードをいじらず本質にたどり着ける点がかなり助かっています。阿部さんはこの仕組みを、ローカルサーバーを立てるnpxコマンドごとSkillsとしてパッケージ化。フロントエンドでもサーバーサイドでも同じ方法でログ収集できる点や、ngrokやCloudflareトンネルと組み合わせればアプリなどスマホ実機での検証にも対応できる点など、Cursorにはない拡張性も見えてきました。後半では、SkillsとSlashコマンドの使い分けについても議論しています。強制力の強い指示はSlashコマンド、知識レベルの振る舞いはSkillsという棲み分けの話や、テンプレートを活用した報告書出力など、お互い気づきの多い時間となりました。【関連リンク】今回阿部さんが作成したdebug用のskillsはこちら公開されていて利用することも可能です。 ▼debug用のskills https://github.com/abekdwight/code-debug-skills ▼CursorのDebug Modeについて https://cursor.com/ja/blog/debug-mode 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f