32【お便り】MiMo-V2-Pro、AI記憶を管理、AIの情報収集方法について

MiMo-V2-ProとAIモデルの比較評価

おだしょーこんにちは、AI駆動開発部の日常

へようこそ。このポッドキャストは、日々AI駆動開発を行う企業課の

山本とエンジニアの阿部が、AI 駆動開発のリアルを緩く語り合う

番組です。本日、よろしくお願いします。

山本よろしくお願いします。

おだしょーよろしくお願いいたします。では、

ちょっと今日は、いくつかありがたいことにコメントとかお便りとか

いただいていて、先日公開したのもお便りからみたいな感じで、答え

からみたいな感じで進めたと思うんですけれども、ちょっとその

ような流れでいけたらなと思いますので、よろしくお願いいたします。

じゃあ、早速、今回2件から3件、時間あれば3件ぐらい答えてっていう

ようなことができたらと思っております。早速なんですけれども、

1件目から進めていきますね。1つ目ですね。こういうときってニックネーム、

ラジオネームみたいなのあるんですけど、ラジオネームとかはいただ

いてないので、〇〇さん、ななしさんっていう形で来ましたっていう形

でいけたらと思うんですけれども、お一人目が、いつもリアルな情報

をありがとうございます。オープンルーターで1位になっているMimo

V2 Proというモデルをぜひ試してもらいたいですと。今の現時点

で、ちょっとすいません。気づくのが遅くて、今さらかみたいな

感じではあるんですけれども、中華モデル系だとまだまだ最新より

かなみたいな感じなのかなと思っておりますが、今多分オープン

ルーターで1位ではない状態になってしまったんですけれども、いとき

なんか結構話題には上がりましたよね。Xiaomiの出してるモデルということで

ちょっと話題になったんですけれども、一番分かりやすい特徴は100万トークン

コンテキストを扱えるというようなところが結構いい部分なのかな

っていうふうに思っていて、あとちょっと特徴的だなみたいなのを

思ってるのが、ちょっと9円3.6プラスとかのほうが今ディスカウントも

入ってて安いっていうのはあるんですけど、とはいえインプットプライス

が段階式、たまにあるやつですよね。段階式256Kまで1ドルで、256Kから

100万トークン1Mまでが2ドルみたいな感じで段階踏んでるんですけれども、

アウトプットプライスが256Kからまでが3ドル、256Kからが6ドルっていう

ような形なんですよね。キャッシュリードとかもあるというような感じになって

いるんですけれども、めっちゃ安いわけではないですね。

感覚的にはめっちゃ安いわけではないなっていう感覚があって、イメージ

GLM5.1と同じくらいが256Kまでで、256K 以上を使おうとすると逆に倍ぐらい

になっちゃうっていうような感じなんで、そんな安いモデルではない

っていう感じですね。逆に9円とかだとそれのだいたい2分の1いかない

ぐらいでいくんで、半分よりちょっと高いかなぐらい、ディスカウント

入ってるんでね。実際はほぼほぼ一緒なんですけど。アウトプット

プライスが一緒で、インプットプライスは256Kまでは9円がデフォルト

の価格で言っても安いっていうような形になってるんで、9円3.6

プラスのほうがコスパがいいモデルっていうような感じのぐらいですね。

これ阿部ちゃんがちょっと使って結構気に入ってた印象を受けて

いて。使ってたよね。なんか印象良さそうだったよね。

阿部いや、まず僕

大平その辺の話が聞けると、ある程度回答になるのかなって思って

いて。

阿部確かにそうだね。僕が登場したのが3月の18日だっていうこと

なんですけど。

大平ちょうど1ヶ月前か。

阿部ちょうど1ヶ月前かな。その後すぐにオープンコード全っていう

オープンコードを使ってるときに利用できるモデルとしてフリーモデル

として登場してきたので、まず使い始めたっていうところがあるんですけど。

やっぱり僕の中で一番大きかったのが、当時は僕はGLM5とかをメイン

というか中華系モデルとしてはメインで使っていたんですけど、

コンテキストウィンドウがGLM5とかだと200Kとかそれぐらいでしかない

ので、結構長時間のタスクやるとコンパクション走るよねっていう

ところがあったんですけど、この MIMOv2 Proは100万トークンをサポート

したっていうことで、結構ロングランできるだろうなっていうところ

の興奮があったので、結構積極的に使っていたっていうところが

ありました。実際に使ってみると正直最初に感じた感想としては

GLM5よりちょっと頭いいんじゃないかなっていうことを最初感じて

ました。同じようなタスクやらせても結構鋭い回答してくれていて、

最初の初感はすごく良かったんですよ。

5より、5.1よりっていう

当時はまだ5.1は出てなかったんで、5との比較があったんですけど

今逆に言うと5.1多分触ったことあると思うんだけど、5.1と比べ

たらどうとかってなんとなく

正直5.1自体の評価が僕の中で全然良くなくて、それ前回のトップキャスト

で話したと思うんですけど、全然インフラとしては安定してない

のか、回答が揺れたいっていうか何だろう

おだしょー根本的に不安定っていう状況

大平そう、根本的に出力が不安定っていう状況があるので、僕の中で

5.1自体の正しい評価があまり測れていない。良いときは確かに

鋭い回答をしてくれたっていう前回の話だと思うんですけど、あん

まだことの比較ができないかなと思ってます。ただMIMO V2 Proも中華モデル

あるあるなんですけど、ちょっと会話が長くなると途端に出力が

破綻し始めるっていうのはあって、例えばMIMO V2 Proでよく起きていた

のは同じことをひたすら連呼し出して止まらなくなる

おだしょー GLM系でもあるやつね

大平そうそうそうがとにかく多かったので、実用には乗せられなかった

っていうのが結論としてある

おだしょー一瞬良かったけどってことね

大平そうそうそう。一方で、GLM 4.7のとき

みたいなコンパクションした瞬間に過去のコンテキストを全部忘れて

しまったりとか、過去に依頼していたルールとかを完全に忘れて暴走し

始めるみたいなことがV2 Proにはなかったので、基本的にはGLM 5に

行くかどうかぐらいで、でもGLM 4.7 よりは確実に頭がいいみたいな

感覚でした。これが安定していたらかなりメインのモデルになり得る

なって感じだったんですけど、このループの問題とかが起きてしまった

んで、どうしても使えなかったっていうのが当時の

おだしょーなるほど。ちょっと話変わるけど

QN3.6プラス使った?実際

おだしょー僕使いました、はい。

おだしょー結構いいよね。そういう不安定さ全然ないよね。

おだしょー QN3.6プラスには一切不安定さは感じてなくて、たぶんGLM 5とか

GLM 5.1よりもよく動いてくれるなっていうような感覚を得てますね。

おだしょーそうだね。俺もそんな感じがする。QN3.6プラスで前回ぐらい

に話してた、記事を書くドラフトっていうか情報収集してくれる

やつだと、マストラでやろうとすると、俺が使おうとしたときはストラクチャー

アウトプットに対応してないっていう問題があって、実際に記事っていう

か日本語性能的にどうかみたいなところは測れてなかったんですけど、

今実際にもうフリーから有料版になったってとこで、もしかしたら

またストラクチャーアウトプットが対応してるかもしれないんで、

そこ試したいなっていうふうに思っています。ちなみにQN3.6プラス

QNコードでQNオースみたいな、オースログインみたいなんで入ると、

1日1000リクエスト分

おだしょーそれめっちゃ良かったよな

大平阿部ちゃん、俺が言ったときさあ、月1000リクエストと勘違い

してたよね

阿部普通そう思うでしょ

大平ずっと1日やのに1000リクエストすぐ枯渇するじゃんとか言って、

どんだけ使うんよとかって思ってたら、そもそも月単位だと思って

たっていう。QNコードで今QN3.6プラスが1日1000リクエストっていう

結構相当量使えるような、

破格なのが出てるんで、ぜひ試してみてほしいんですけど、

俺ちょっと実際QNコード入れてやってみたよね。結構安定してた。

おだしょー本当ですか

大平かなり安定してた

おだしょー結構サブで使うやつとしてはかなり優秀だと思います

大平ただQN3.6の一応プライバシーポリシーとか利用規約とか見てたら、

データ利用はする可能性があるみたいな感じで書かれてたから、

本番の仕事とかでは使わないほうがいいのかなみたいな。だから

遊びプロジェクトでぐるぐる回しとくみたいな、そんなのではQN3.6

プラスをQNコードから1日1000リクエスト分使うっていうのはかなりいいな

という感じなのを得てますと。ちょっと補足というかお得情報を共有でした。

そんな感じかな。じゃあ実際この方への回答としては、

実際どうだったかっていうところで、一瞬良かったんだけど、中華モデル

あるあるの不安定さがあったっていう感じですね。

おだしょーそんな感じかな。オープンコードに登場したばかりの話なので、

結構モデルってやっぱり訓練された時の

大平オープンコードとのはみ合わせとかもあるしね。

おだしょーそこもあるんで、Xiaomi のコーディングプランあるんだっけ

とかで、何かハーネスを使ったらより性能が引き出せて、もっと良くなる

可能性は全然あるのかなと思ってるんで、引き続きウォッチなのかなとは

思ってるかな。

大平ただコスパだけで言うとQN3.6プラスのほうが安くていいんだったら、

逆にウォッチしとく必要すらないみたいな感覚もあるよね。

おだしょー確かに値段的にはね。

大平値段的にも、それ見るんだったら俺ミニマックス2.7とか、ミニマックス

2.7の後継をちょっと期待してウォッチしとくほうが、あれだとGLM5の2分の1

かとかになるから、圧倒的に安いし早いっていうのがミニマックス

の2.7があるんで、しかもあのサブスクだとコーディング以外にも使って

いいっていう選定だから、そっちのほうが可能性感じるよね。利便性

だけでウォッチしとくという意味合いで言うと、なかなかコーディング

っていう意味では強いのが他にいっぱいいるからね、GLMもそうだし

QNもそうだし。

おだしょーそうだね。僕の中で中華モデルとして期待感があるのはGLMとかQN

とかミニマックスと君とMIMOなのかなみたいな、こういう並びでざっと

見てて、それぞれ後継がどうなってくれるかがすごい楽しみかなって

思ってる。

おだしょーじゃあそんな感じで、微妙だった

けど引き続き安倍さん的にはウォッチで、山本的には他のを見ときゃ

いいんじゃねっていう感じで、今のところの結論でした。じゃあ次、

AIに関する情報収集の方法と源泉

お二人目いきます。この方も特にお名前とかないので、そのまま

読ませていただきますが、いつも拝聴させていただいてます。お二人

に質問なのですが、普段どのようにしてAIに関する情報をキャッチアップ

されていますか。注視しているサイトや利用しているSNSなど、情報収集

の仕方やインプットアウトプットの仕方、日々の習慣など幅広く教えて

いただきたいです。よろしくお願いします。私はこちらのPodcast Xを流し見

するくらいです。じゃあ、安倍さんどうでしょう。

まずあれですよね、ちょっと僕嬉しいなって思ったのが、Xを普段見ている

のと、このPodcastを聞いているので情報収集されているっていうのは

一つ情報収集の起点になっているって思ったらすごく嬉しいなって

思って。

確かに、誇らしいよね。

ありがたいなって。

誇らしいなって。

ありがとうございますって感じ。じゃあ僕がどんな収集をしているかですかね。

僕もXで情報収集というか、一番最新の情報をキャッチするのはやっぱ

Xから流れてくるのが多いかなっていうふうに思ってて。僕がメインで

使っているXのアカウントはもう AIの話ばっかり、自分もAIのツイート

するし、見るのもAIの情報ばっかりなんで、フィードが完全に最適化

されていて、どんどん情報が流れてくるので、流し見しているだけで

最新のAIのモデルの情報だったり AIを使ったライブラリーの情報

っていうのがバンバン流れてくるので、結構そこが情報を収集する

規定の1個になっているかなって思ってます。あとやっぱり他にも

そこで自分、そこっていうのはどっちかっていうと受動的に情報を取り

に行く。流れてるのを見て最新のを追っていくっていうのがXがメイン

なんですけど、逆に能動的に情報を取りに行きたいときにどうして

いるかっていうと、やっぱりChatGPT のディープリサーチは幅広く見て

くれるし、分析もかなり優秀だなっていうふうに感じるので、結構

そこに自分が普段考えていたり作りたいことのアウトラインを

流して調べてもらうっていうのをよくやるんですけど、結構帰りに

僕は自転車で帰ったりするんですけど、自転車乗る前にひたすら音声入力

でバーッと喋って、ディープリサーチ 10分とか20分かかるんで、自転車

声で家に帰ってる間にその結果が出てくるんで家帰ってみるみたいな

ことをやったりとか、あとはあれかな、普通にCodexとかクロードコード

上でもこういう観点で調べてほしいですっていうと結構情報を収集

してきてくれるので、そういうのでAIに依頼して収集したりします。

最後に僕の中で結構、一時情報ではないんですけど、結構見に行ってる

のはRedditがあって、Redditって結構ボットをブロックするんで、Codex

に依頼したりとかChatGPTとかで調べてって言っても、Redditの情報

は取ってきてくれないんですよ。けどRedditって結構ユーザーの生の

声がいっぱい転がっていて、こういうのやってみたとか、こういうのどう

みたいな、新しいモデルこれだけどみんなどう思ってるみたいなの

が結構みんな活発に話し合ってるので、そこ見に行ってみんなどう

思ってんだろうとか、自分が困ってることを調べたら結構同じことに

困ってる人がいたりして、なんか一昔前のスタックオーバーフロー

的な感覚が若干あるんですけど、そういった感じで情報収集に使って

いるんで、ざっくり僕の情報収集はこんな感じですかね。

おだしょーこれは、Xは普通に流れてくる

よねと、あとYouTubeのまさおさんのやつは見るようにしてるって

感じかな、まさおAIじっくり解説 CHチャンネルってやつは見てます。

レディットも、自分が検索したらレディットが多いからレディット

に引っかかる、レディットで明示的に検索しようとしてるわけではない

けど、レディットに当たるっていう感じで、あとディープリサーチ

が、スマホからディープリサーチかけるのと、5.4プロで検索の

ケーパーベリティつけて検索させるのを並行でやるっていうのはかなり

ある。この辺が基本的で、あと趣味的にはマストラのブログを見る

のと、あとオープンコードとおまえオープンエージェントと、あと

オープンハンズとかジェミニCLIとかその辺のチェンジログ見るのは

好きって感じかな。どんなものが入ってきているのかで、どういう

動きができるようになるかっていうのが結構分かりやすいから、逐一

見てるね、どんなことができるようになったんだろうっていうのを、

マストラのチェンジログもそういう意味ではどういうことができる

ようになったっていうのから、それを起点に、じゃあこれができるよう

になったってことはどういうことができるようになるかなみたいな。

僕はどっちかというと、AIサービス作りの観点での参考にっていう

のが多いけど、そういうイメージなのかなって感じですね。

あと、オープンルーターのモデルの欄はめちゃめちゃ見に行くね。

新しいの出たら、あそこのポンって上に出てくるから。あそこを見てる

と、最新これかみたいな。

なるほどね。でもなんか僕、今その話聞いて、ふと思ったの。

なんかマストラのブログ見るとかっていう文脈っていうと、確かに

オープンAIとか、あの辺は定期的に見に行ったりするし、僕は結構

エージェント周りの実装レベルで、今の動向としてどうなってるんだろう

とかっていうの結構気になって見に行くっていうことがあって、

その一時情報として結構見に行くのは、クラウドフレアとかが結構

エージェントクラウドで実行するための基盤を、今活発的に作り込んで

いってるっていうところがあるので、どういうのが考え方として

あるのかなって見に行きたいときに、結構クラウドフレアのブログを参考

にしに行ったりとか、あとその系でいうと、ストライプとかショッピファイ

とかも結構そういうのに目が向いている。バーセルとかもそうですよね。

そういうところに目が向いてるので、その辺のブログを見に行ったりとかも

してたなって。

ストライプのアニュアルレポートとか面白いよね。

確かにアニュアルレポートとかね。

とかも結構面白い。なんかその辺が結構あるなっていう感じと、あと

俺は仕事の性質上結構いろんな職務をすることが多いんで、これ

楽にならないかなみたいな。定期的にこれで海外含めて一番最先端

のサービスって何だろうみたいなのを見に行って、それができてる

理由って何だっけとかを、チャット GPT-5.4 Proに分析しまくらせるみたいな

とかっていうのは逆にあれだね、チャットGPTのアプリで俺プロ以外

使わないかなほぼ。

うん、言ってたね。

使う意味がない、プロ以外。頭悪いとは言わないけど、ただの推論

というか予測だけなんで、誰でもできることを返してくるから、

プロだと本当に考察してくれるから 5.4 Proにかけるっていうのが必須

なのかもしんないね、分析とか含めて。俺とアメちゃんの比較

すると結構面白いよね。多分アメちゃんはクラウドフレアとか

より技術的にどこまでいけるようになったんだっけみたいなところ

を見に行く傾向があって。

解決の仕方とかを見てるイメージ

そうそう。俺はマストラでこういうところできるのか、実運用的に

AIサービスとしてどこまでできる可能性が広がってるのかみたい

のを見に行きたがるという。そういうの違いはあるよね。

AI駆動開発っていう意味では、たまにオープンコードとオーマイオープン

エージェントを使ったときに、オープンコードのいろんなところにフックス

があるから、開発事例としてどういうのがあるのか。じゃあこういうこと

できそうだよねみたいなのを阿部ちゃんに話したりとか、そういう

話はすることはあるけど、その辺はディープリサーチ。オープン

コードを使ってる前提だとどういうことが海外事例であるのかみたいな。

逆にあれだ、ディープリサーチとか検索とか消させるときに、絶対

俺が言うのは、プロンプトに入れるのは、日本国内の情報ってそんなに

やってみたっていうのが多くて、実運用レベルじゃないことが結構

多くて、やってみましたみたいな、ピッチするためだけにやりました、

はい終わり、そこのショットでやってみましたみたいなのが多くて、チュートリアル

みたいなのが多くて、そこじゃないなみたいなのがあるから、それで

言うとチャットGPTにもできるだけ英語圏、もしくは中国語圏の最先端

事例をキャッチアップするようにしてくださいみたいな一文は入れる

ようにしてる感じかな、イメージで言うと。それ入れるだけで全然

違うかな、返り方が。

たしかに日本語で質問してると、どうしても日本語の検索というか

日本国圏の情報収集したりしちゃうもんね。

そこに傾くんよね。それはちょっと嫌だなって思って、なんでそういう

感じの調べ方をするかなって思う。これは結構すぐにでも使えること

よね、たぶん。

たしかにそうだね。

って感じですかね。

こんな感じですかね。

ちょっとクラウドフレアのが、俺にとっては難しすぎてね。

技術的な解決方法もそうかもしれないんだけど、僕もAIはどこまでクラウド

上で自由に動かせるようになれるんだろうみたいな。自分もAIエージェント

のサービスみたいなのを今作ってる中で、課題感とか限界を感じるところ

があって、そこ突破してるところとか別の手法ないのかなみたい

なので、見に行ったりする。結構難しいんですけど、読み応えがある

し、今の動き、AWSとかも最近はAWS S3にファイルシステムを購入

されたみたいなので、エージェントがクラウドで動く基盤みたいな

のを作っていってるんだなみたいなのが、世の中の流れとしてある

っていうのを感じるから、そういう各企業の技術ブログを見に行って

いくっていうのを意識的にやっている感じですね。

おだしょーなるほどね。だから、動ける環境っていう

ほう結構あるよね。俺は結構そうだね。ハーネス周りのほうが好きという

か、見るって感じだね。何でオープンクローがこんなに伸びたんだろう

みたいなとか、何かどこまでできているか、どういう方針にすると

ファービスとして、それこそ阿部ちゃんの言ってるクラウドに移ろう

としてる。今、ローカルファーストのところからクラウドに移そう

としてるっていう大きい文脈もあるだろうし、けど一方でローカル

LMがめちゃくちゃ強くなってるので、そうするとデバイスのほう

で推論させるほうが早いし、セキュア出しっていうふうになるから、

Webでやりつつローカルのリソースをどう使えるようにするのかみたい

なところとか、そっちのほうが興味が湧きやすいのかな、どっちか

みたいなのがあるかもね。多分ローカルに集約させていくことには

なりそうだなっていう気はして、特に我々がやってる領域が飲食

領域っていうところで、そこまで IT部門に活用できる予算がない

っていうとか、そういう前提とかに立ったときにローカルLMファースト

っていうのは1個の多分貝になるかなって思って、そういう意味

でもなのかな。どうちゃんと提供しきるかみたいなときになった

ときに、クラウドの高級モデルじゃなくてもできるような仕組みって

どうなんだろうとかみたいなところはすごく興味のある領域だから

っていうのが前提としてあるかもしれない。そうすると多分ワークフロー

をどう組むかとか、コンテキストエンジニアリングどうするかとか、

ローカルLMでローカルリソースを食いつぶしながらLM動かすって

どういうふうにするのかみたいなとか、その辺のほうが興味が行き

がちなのかな。サービスの性質上行きがちっていうところがある

かもしれない。阿部ちゃんは結構多分インフラとかやることが多い

から、そっちにかなり多分興味の先として向きやすいっていう。

あと俺からの要望も出てくるしっていうのがあってっていう感じ

なのかな。だから前提、多分どこ調べるかは結構あるかもしれない

けど、意外と各企業のブログはいいよっていう。もうマストラブログ

読むのはもう趣味ですから完全に。

おだしょーなるほどですね。

はい。そんな感じです。答えになってるかな。じゃあ三つ目

AIの記憶管理と会話履歴の活用

いきましょうか。これちょっと前提としてCode Rabbitで300件ぐらいレビュー

捌くぜみたいな話をしたときなんかな大変だよねみたいな。今も変わ

らずだけどみたいなのの話にコメントをいただいたんですけれども、前提

知識とかストーリーとかをスキルでステアリングできないかなと思

うんですけれどどうですかねみたいなコメントが来ておりました。結局

前後文脈分かって、特に過去の文脈分かってないからレビューがトンチン

からも返ってきて、それに素直に AIが引きずられてそれをステアリング

してそのレビューに対応するように回収したら結局仕様が過去言った

じゃんみたいにずれていくよねみたいな話をしたことに対しての

コメントなのかなというふうに思っているんですけれども、これ

最近阿部ちゃんがオープンコード使うようになって過去の会話履歴

とか全部残ってるからいいんだよねみたいな話してたと思ってて、

その辺が結構近しいという話なのかなって思ってるんだけど、俺は

逆にそんなに1個のプランを立ててそのプランをやり切るっていう

ベースでしか今んとこやってないから、そんなに過去の会話ログとか

見たくなることはあんまりないんやけど、阿部ちゃんは結構外部の

仕事とかで過去の会話ログを見てバグ調査とかそういう文脈になった

瞬間、ガンガン使いたくなるんだろうなみたいな感覚があって、阿部ちゃん

は多分それで結構使ってるのかなと思ってるんだけど、実際具体的に

どういうふうにやってるのかみたいな教えてもらったりできるかな

そうね、ちょっと質問の話とは逸れちゃうけど、どういうふうに

過去のセッションの情報を取ってるかみたいな話で言うと、まずそもそも

僕って結構他の外部のお仕事とかで、とりあえずちょっとバグって

そうだから確認してほしいですとか、考数だけ見積もってほしいですとか

いろんな実装まではしないけど、とりあえず調査したいみたいな

タスクかなり多くあるんですよ。それやるとAIのセッション立ち上げて

オープンコードでセッション立ち上げて調査して、だいたいこんな感じだよね

って言って会話が終わったらそこでもう閉じて、別のまたセッション

を立ち上げるみたいなことを頻繁に繰り返すわけでして、その後の

時に実際にそのタスクに取り掛かろうみたいな話になった時に

そのセッションのヒストリーを辿るのって、例えばクロードコード

使ってる人やコードエックス使ってる人とかだと分かると思うんですけど

レジュメっていう機能があって、過去の一応履歴をなんとなく見る

ことはできるんですけど、あの履歴見る機能ってめちゃくちゃ貧弱

なんですよね。最後の会話のテキストの一覧だけがダーッと出てきて

各セッションの最後のコメントだけが見えるぐらいで、これ何の

話してたんだっけみたいな、しょっちゅう落ちて結局前話してた

やつなんだっけみたいなことになってしまいがちなんですよ。一応クロード

コードもコードエックスもJSONL っていうような形式でセッション

の履歴はJSONっぽいようなログっぽいようなファイルに書き込まれたり

がするんですけど、結局それって検索するの結構大変だよねっていう

ところがあって、ただ一方でオープンコードのほうはSQLiteにそのセッション

の履歴とかAIが動いた結果っていうのは全部記録されるようになってる

んです。SQLなので結局クエリを作って叩けばかなり高速に検索

ができるっていうところがメリットとしてあって、いろんな単純に

テキスト検索だけじゃなくてフィルターとかをうまく活用して高速に検索

することができるので、僕の場合とかはセッションの履歴を検索

するためのツールを作ってオープンコードでこういう会話昔してた

と思うんだけどどうだったんだっけと思って検索すると一発で

引けて再開ができるようにしたりしているっていうのがまず検索

というか過去の情報とか引っ張ってくるっていうのにかなりオープン

コードが便利だなっていうふうに思ってると

おだしょー何てお願いしてるの何てお願いすると

しばやんもう検索用のツールを作っちゃっててウェブとかで複数

の単語を入れたらそれに筆列がパッと出てきたりとかあとはSQLite

のファイルデータが一応ローカルにあるんでAIにちょっともう何だろう

大平そういうのが来たりとか

しばやんセマンティック検索っぽいことを

大平めっちゃその整えた後の話じゃなくてこれから多分整える

人が多いと思うからオープンコード使ってる人だとそうするとどこ

にあるのかそのファイルがあるのかとかどういうふうに見てもらって

たのかみたいなとかその辺が聞きたいかもしれない

しばやんはいなるほどねそれで言うとまずオープンコードで履歴

を検索したりとかやるにはオープンコードのデータベースSQLiteのデータベース

自体はフォームディレクトリ配下に.localっていうフォルダができる

んですよそこのshareっていうフォルダのオープンコードの中にopencode.db

っていうファイルが1個生成されていてそれが全てのオープンコード

のデータの集約場所になってるっていう感じなんですよ

おだしょー.localってあれやんな Macでアプリとか入れたら入るやつ

やん新しくの中に.localの中にいっぱい出てくる

しばやんそこのデータベースの中身を覗いてみるとテーブルが10個ぐらい

そのデータベースの中に入っててプロジェクトとかパートとかメッセージ

とかっていうのがセッションとプロジェクトとセッションとパート

とメッセージっていう一番よく見るテーブルが4つぐらいあって

だいたいAIにディレクトリを検索してほしいときはまずプロジェクト

単位で絞ってもらうとよくてプロジェクトの中にワークツリーっていうカラムが

プロジェクトテーブルっていう中にワークツリーカラムっていう

のがあってそのワークツリーっていうのは作業していたフォルダを指して

いるので今のフォルダをワークツリーで検索かけてまずどのプロジェクト

があるのかっていうのを見つけてもらいたい

おだしょーそれをそのときは.local のこのSQLiteのファイルを見てって

言ってってことだよねこのSQLite さっき言ったところに見つけて

おだしょー SQLiteを見てっていうところ

に見つけてもらってそこでプロジェクトを見つけるとプロジェクトにひも

づいてるセッションっていうのが聞けるようになるのでそれにひ

もづくセッションをとってくださいっていうふうに言うんですよそう

するとだいたいこれまでの会話の履歴のまずどういうセッション

を行ってたかっていうのが一覧で分かるようになるところがあります

でセッションの中の会話ってどういう自分がしゃべった話とAIが返した

結果っていうところが入ってると思うんですけどそれがテーブル

としたらメッセージがそれっぽいかなっていうふうに思うかと思

うんですけどメッセージ自体には詳細な会話の中身っていうの実は

入ってなくてどっちかっていうとメッセージにばらさかるパート

っていうテーブルが結構肝になっててそこに実際の会話の中身とか

例えばツールコールした履歴とか実際にAIが読み取ったり吐き出してる

結果がパートっていうテーブルに出てるのでパートを見れば全部

大体分かるというところを教えてあげるとそれをやればもう大体

分かる

おだしょーなるほどね

しばやん自分はそれがもう理解できてるからそれベースにウェブ

のシステムを組み上げて履歴が一発で引けるようにできるような

感じで

おだしょーなるほどそれをこの人のコメントみたいにスキル図

にしてあげてももちろんいいしっていう感じだね

しばやん確かにそうだねあと最近思ってるのは結構計画とか

立ててる間に計画自体がすごい長時間のセッションになるずっと

ラリーこれってどうなんだろうみたいな話し合いをずっとして

て最終的にプランファイルを作ってもらった後にそのプランが妥当

なのかっていうのを別のAIに評価してもらうときに今言った感じ

で結局SQLの中身を覗いてもらえば過去の会話の履歴全部見れるので

その会話の履歴を元に最終的に合意をAIと合意した内容に沿ってる

かどうかっていうのを評価してもらうこともできるなって思って

あとは同じようにしてプルリクエストの指摘の妥当性に関しても直近

のセッションとかを確認して会話の実際に話していた内容と沿ってる

のかどうかっていうのを結構高い精度で見てもらえるようになるん

じゃないかなっていうのはこのコメントをもらったときに

確かになと思って今日やってみたんですよ試しに例えばプラン

を練ってもらった後にここを見れば過去の会話の履歴が見れるから

そこで話していたのと違う計画になっていないのかフィードバック

してほしいみたいな話をしたらちゃんとロゴを見て確認してくれた

上で若干矛盾してるようなプランになってるところが一部あります

ってフィードバックをくれたので結構いいんじゃないかな

おだしょーなるほどある程度開発として初期開発のときって

結構方針が変わったりするじゃないですかそうすると前言ったけど

逆に前言ったことを引きずって欲しくないみたいなときとかも

あるっちゃあるのかなって思ってだから安定稼働して運用に乗ってる

プロジェクトだとそういうのが必要になるのかもしんないねより

効果的になるのかもしんないなって今聞いてて思いましたまだ

リリース前でガンガン変わるみたいなときに昨日までAって言ってたけど

今日Bやってるみたいな感じになったら逆に過去の文脈引きずりで欲しくない

みたいなときが

そういうときもある

だから安定稼働してる保守とかに入ってるような保守運用モード

に入ってるようなプロジェクトがより効くかもしんないねって

かそっちのプロジェクトのほうが圧倒的に多いだろうからそういう

意味ではすごく有用なのかもしんない

確かにたまにプランの中に例えば Aって話をしててプランを作る

過程でAって話をして Bに変わったのに Aはやらないよとか Aに引きずら

れた情報がプランに乗っかっちゃってるときも逆にあったりする

のでそういうときにはむしろセッションの流れをちゃんと読んで

理解してほしいなっていうところも僕の中では感じていてそういう

意味では立ち上げの当初のほうでも結構効いたりするのかなとは

思ってたりして

おだしょーなんか立ち上げの当初とかで言うと今俺が今この

Podcastを自動で編集するみたいなワークフロー作ってるじゃんそれ

で一番初め ChatGPTのアプリのほうで設計とかしてもらったよねそれ

をやるそのときに勝手にChatGPT側がAgentMDに書いてたやつがずっと

残ってるやつがあるんやけどそれがプロジェクトステータスみたいな

ファイルがあって .mdみたいなファイルがあってこれは俺だけ

しか今やってないからっていう前提なんやけど必ず一定のプロジェクト

とかタスクが終わったタイミングでそのときのタイムスタンプを

スクリプトでポンって取ってそれと一緒に今何をしたのかどういう

判断だったのかっていうプロジェクトステータスを一生そのマークダウン

ファイルに書き続けてるみたいなのがあって阿部ちゃんのやつだ

と会話履歴みたいな感じになるから結構コンテキストがポンって

でかくなるけど要約した一つの文脈を一つのマークダウンにバー

って書いていっててこれ多分もっと増えていくともちろん

コンテキストがやばくなってずっとは続けらんないなみたいな感覚

はあるんやけど結構とはいえこういう経緯があってとかって

勝手にやってくれるから楽だなみたいなのがあってそういう

要約と実態の事実情報としての会話ログがセットで紐づいてて

タイムスタンプ込みでちゃんと保存されてて基本要約見るんだけど

もっと深もって見たいときは会話ログを見るみたいなそれがチーム

全体でちゃんとクラウドに上がって全員がアクセスできるような状態

で進むとすごくいいんだろうなっていうのをちょっと阿部ちゃん

とそのお話をしてる中で思ってたね

阿部いやそうなんだよねそれを欲しいんだよねいわゆるメモリー

的な話だとは思う

大平そうあと生データだけだとやっぱ重すぎるじゃん基本的に

個人運用が限界だと思うんだよねそうなるとローカルの個人で

その辺の仕組み結構欲しいよね欲しくなるよねその要約を書いて

くれることで割と勝手に判断してくれたりとかもしたりとかあとは

レビュー PRチェック PRのレビューをチェックして返すやつもそれを

見て判断してるような気配があったからこれはこういう観点でこういう

ジャッジをしたので拒否ですみたいなのをやってるのよねみたいな

おだしょーそうだねちょっと今回は生データを取って判断して

もらうっていうまず取って判断できるのかなって

大平そうだね

おだしょーこれの検証だったのでそこはあんだけどやっぱ要約して

クラウドに上げて生データもクラウドに上げたほうがいいなと

大平一緒に上げて紐づく状態で

おだしょーそうそう

大平ですると検索効率も上がるしその上でラグ化されてるみたい

なとかぐらいなのかな

おだしょー話に戻るけどやっぱそういうことやるとクラウド上に

上がってればチーム全体の共有もそうだしプロリクエストのレビュー

の結果の精度もぐっと上がるんじゃないかなと

大平そんな気がする

おだしょー改めて思います

大平そんな気がするそれ欲しいよねそれが

おだしょーなんかありそうなんだけどね

大平サイファーとかそれに近いんでしょうねおそらく

おだしょーそうだねあとスーパーメモリー

だっけなんかそういうのも最近出てきた

大平そうそうスーパーメモリーも一応オープンコードのプラグイン

もあるのかな確かスーパーメモリースーパーメモリーとかサイファー

とかがその辺になるのかなっていう感じね

おだしょーそうだねいやちょっとね

大平なんか意外と導入価値ありそうやね

おだしょーありそう

大平何回かあれしようとしてたけどね

おだしょーサイファーありかもねスーパーメモリー

とかだと多分有料だってなってくる

大平うんうんうん有料になるほど

いるのかどうかっていうとちょっとはてなマークだもんね

おだしょーそうちょっとねそこまではいいかなって気持ちになっちゃ

うんだよなって

大平確かに

おだしょー自前でなんかデータベースとかをクラウドにポンって置いて

うまいことできる仕組みが作れたらなっていうふうには思う最近だと

なんだっけな Obsidianとかを活用してメモリー作ってますよみたい

なのをもともとOpenAIとかでエンジニアやってた人が自分が考えた最強の

メモリーの仕組みってこうだみたいな Xでめちゃめちゃバズってたみたいな

のがあったりしたらそれを真似したら活用できたりすんのかな

とかボヤッと

大平ちょっとあれとかかな Master & Observational Memoryみたいな

おだしょーはいはいはい

大平その辺も一つなのかな

おだしょーそうだねそれも一つあると思うよね

大平そうだね

おだしょーやってみないとわからんなって思いつつもやるには重たい

なって気持ちも

大平 Cypherは意外と入れれそうやな簡単にというかセレナはもうい

らないなって感じ逆に

おだしょーそうだねもういらないかな

大平セレナはいらないなっていう感じだな

Cypherがいいのかなすごい最近になってギュインってCypherの利用者数が

利用者数っていうかスター数が増えてるね一回なだらかになってる

けど何かで話題になったりしたのかな

大平そうだねけどスーパーメモリーもMITでこれもセルフホスト可能

なんじゃないもしかしたら

おだしょーそれだと結構うれしいかもしれないあとなんか最近だと

オープンクローの対抗馬としてエルメスっていうエージェント

が出てきてるけどあれもなんか自立学習をするメモリーを自分たち

で作ってるとかだからそういう機構を真似してみるのもありかか

って思ったりはした

大平まあCypherかスーパーメモリーなのかななんか前調べた感じだと

オープンコードと相性いいという意味ではスーパーメモリーが結構

相性良さそうな感じだったな

おだしょー多分僕が言った話をやってるのがまさにオープンコード

スーパーメモリーっていうオープンコードのプラグインなのかな

って雑に思ってるけどどうなんだろうね

大平なんかそんな気がするそことの統合をうまくやってくれたみたいな

だから阿部ちゃんの言ってた会話の履歴があってそこにうまく

かみ合ってくれてるやつを探すのがいいでしょうね前提として

そうするとオープンコードスーパーメモリーとかはいいのかもしれないね

おだしょーいや本当にそうだね

大平そうだね

おだしょークロードとかCodeXを使ってる人たちも一方でほとんどの

人はそっちだろうからそっち側でもなんかあったらいいなって

僕もたまに使うんでねやっぱなんかエージェントハーネスが

いろいろあるがゆえに情報が分散しちゃうっていうのは

大平うんけどそれで言うとオープンコードスーパーメモリー

はあくまでも多分スーパーメモリーのオープンコード用の設置面みたいな

話だと思うから前提としてオープンコードとオーマイオープンコード

みたいな立て付けみたいな感じになると思うからだからオープン

コードスーパーメモリーを使いつつスーパーメモリーは別にクロード

とかも使えるはずじゃん前提としてそういうものとしてやる

のが一番管理はしやすそうだよな

山本一個メインとなるそういうスーパーメモリーみたいなもの

を作って入り口はどっからでもみたいな

大平うんそうスーパーメモリーサイファー

だと多分セルナみたいな感じになるから多分プロンプトとかをやって

逐一やってもらうようにしないといけない MCP経由で多分記憶

を保持していくみたいなベースだと思うよねどっちかというと

けどスーパーメモリーオープンコードスーパーメモリーとかちょっと

ちゃんと見てないけどおそらくそういう過去の会話ログとかから

勝手に収集していくみたいだからエージェントの動きによらない

仕組みのほうが結構便利そうだなってセルナはそれがあるじゃん

やっぱり毎回セルナをちゃんと更新するようにしてもらわない

といけないみたいな結局エージェントによるみたいなその管理はみたいな

そことはちょっと切り離したいよね正直なんかコンテキストも無駄

だし時間もかかるし

大平そうだねそうなんですよ履歴から自動的にみたいなところ

をやってほしいなとそうなると CodexとかCloudだとデータの

蓄積の仕方がJSONでしかないと使いにくかったりするのかなっていう

のを何となく自分の思ってたりしたりする感じかな

三沢だから両面から入れられるもののほうがいいでしょうねオープン

コードが主体としてやるっていうのが前提なのかもしれない

大平ちょっと触ってみたいないずれにせよ

三沢じゃあこんな感じかな結構話が長々となりましたが 3人の

方ありがとうございますコメントいただきまして

三沢ありがとうございます

大平ありがとうございますじゃあ今日は以上ですかね

三沢はい

大平ありがとうございます本日も AI駆動開発部の日常をお聞き

いただきありがとうございました今回はPodcastのほうにコメント

お便りいただいた方に対する回答ということでちょっといろいろ

多岐にわたってお話しさせていただいたんですけれどもこんな感じ

でコメントちょっと全部拾えるわけではないんで申し訳ないんですけ

れどもできる限り回答していけたらなと思っているのでコメント

であったりとかお便りとかいただけると大変うれしいですこのPodcast

気に入ってくれた方はいいねやフォロー高評価ぜひお願いいたします

それではまた次回もお楽しみくださいバイバイ

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

AI駆動開発部の日常

感想

サマリー

目次

総スター数

コメント

感想を書く