なるほど、自分たちで持っているサービスの課題を
もう何かまとまった時間全員で取って
まあ軽く競い合うような形、形式にして改善していこうっていう時間を何かまとめて取るみたいなイメージ?
そうですね、イメージとしては本当にKaggleのコンペみたいなものを自分たちで作って
一定の期間分析の時間を取って
いい予測モデルができたら、それの予測結果をサブミット提出して
そしたらスコアが返ってきて、何ポイントだったみたいな
誰々は何ポイントだったかな、こっちが勝ったねとか自分が負けたねみたいなことが
リアルタイムで分かっていって
最終日に誰が一番その予測スコアが高くなるかっていうのを競い合うっていう
まあそういう対戦形式の分析コンペです
あ、てことはじゃあなんか1週間とか2週間とか期間割と長め?
なんか俺勝手にこうクイックに半日とか1日とかでできるとこまで全員がバーってやるから
なんか一旦こうベーシックなところの分析はもうらできるみたいなものを想像してたんだけど
そうですね、今回全体概要からお伝えすると
分析のコンペ期間は3週間もの多いので
その中で各自それぞれの仕事があるので
隙間時間を使いながらそのコンペも同時並行でやっていって
でデータを理解してどういうアプローチで精度向上しようかというのを各自考えて
で実際に試してみてっていう
そしてスコアが返ってくるってこの実験のサイクルを
一人1週間に1回は最低でもやろうねみたいなところを約束応答として決めて
で3週間やり切ってっていうそんな流れで進めましたね
それってその中で使ってるマッチングのアルゴリズムなのか
なんかこうレコメンドシステムみたいな感じなのかみたいな
モデルを磨いていくコンペ?
そうそうそう、なので今回のタスクで言うと
プロダクト自体が需要予測のプロダクトなので
将来のある商品がどれだけ売れたかみたいなところを
AIのモデルを使って予測しているっていう
そんなアルゴリズムに対して精度を上げていこう
品質を上げていこうっていうところでタスク設計をして
今回自分がこの企画をしたんですけど
なので自分がコンペ運営者みたいなところでデータの準備から評価指標を決めて
で最終のスコアの評価とかもやってっていうところの全体設計と
あとはこの企画を全体に説明して
参加者募ってやってみたっていうところの一通りをやってきたんで
いろいろと話せるかなと思って持ってきましたね
なんか素朴な疑問としてはなんでコンペ形式なんだろうっていうのがあって
普通だったら1チームが
需要予測のモデルとかを作っているチームだったりっていうのがあって
そのチームがもう1回モデル見直して
自分たちでじゃあここ改善しなきゃって言ってやって
またなんか精度の高いバージョン2.0みたいなやつが上がって
っていうのを積み重ねていくようなもんなイメージじゃん
それをなんかコンペっていう形式にするに落とした理由みたいなのがあんまピンとこないなと
確かに言ってる通り仕事の中事業会社の中だと
そういう専門のチームがあってそこがやるべき仕事なんですけど
今回に関してはいくつかチームの中での課題感っていうのがあって
この精度向上の取り組みしてるのって本当に1人とか2人のチームがやってたんですよ
そこのアプローチが結構頭打ちだったりアイディアが発散しないよねっていうところを感じていて
そこの幅を広げたいっていうところで
比較なら参加できるメンバー全員いろんなアイディア持ち寄ってやってみたらいいんじゃないかっていうのが1つですね
なるほどね確かに確かに
あとはですねチームビルディング的な要素もあって
データサイエンスの組織と言いつつも意外とこういうアドホックな分析をする機会がないメンバーもいたりするわけですよチームの中に
そうなんだ
そうなんかAIのモデルの運用をしている人たちだったりとか
どちらかというとAIエンジニア的に開発をメインでやってるメンバーとかがいて
あまりこう予測モデルの精度向上とかっていうところに時間を割くことができないっていう機会がなかったっていうところの機械不足の解消とか
データサイエンススキルの向上とかっていうのがあったり
あとはですね新規の参入メンバーにとっては
今動いている需要予測モデルの使用理解とかもなかなかできてなかったりとかして
そういう意味でプロダクト理解を深めていこうとか
そういう意図もあってのコンペっていう形式だったらタイミング的にいいんじゃないかっていうのが
いろいろとはまっていった時期だったのかなと思ってますね
まあ確かに新しく4月とかに入った人とかもいるし
で分かるな確かに2人とかのメンバーだったら
いやここからどうすんねみたいな話にもなりそうだしみたいな
なるほどね
それって何その前例があった上でその形
なんか前もこれでうまくいったよねみたいなのがあんの?
いやこれは完全に初めてチームの中だと初めてでやってみたら面白そうじゃないとか
意外とデータサイエンスの組織を抱えている事業会社で
社内コンペとかやってる企業とか多いと思うんですよ
それこそメルカリとかヤフーラインとかやってたり
1Qとかあるじゃないですかヤフーは
あれってヤフーなんだ
そうそう社内コンペを開催してるみたいなところでいくつか事例があったりするんで
せっかくだったら試しにやってみるかという
なるほどね
軽い気持ちで始めたものではあるんですけど
他の会社もやってるから盛り上がるんだろうみたいな
そうなんだ
案の定盛り上がって3週間終わって色々と話聞いてると
なんかハマってずっと時間を割いてやってしまったよみたいな感じで
楽しくやってくれたみたいなんで
効果は一定あったのかなというところと
あとは実際制度向上にもベースラインの嘘口からはスコアが上がっていったんで
モデルの品質改善にもつながったんで良かったかなというところが
全体の所感というか
そうなんだ
そういうのが積み重なってやってる会社とかだと
すごい参加者集まりそうな気がするけど
初めてで割と集まるもんだった?
いや今回はもうチームの中っていう風に閉じてやったんで
集まるも何もなくチームメンバー全員が必須参加で
10名もいないチームなんで
で一人一人がやるみたいな
そうそうそう
なるほどね
じゃあ普通に一人二人が開発してたところより一回り大きいぐらいの
母体の組織みたいなのが全員デューティーとして参加みたいな
はいそうです必須参加でやったって感じでしたね
そういうのアド音で入ると結構きちいって
なりそうだなって思うじゃんやっぱ
1日とかだったらほらあるじゃんなんか集中的にディスカッションするから
もうこの日は他のミーティングを入れずにガッツリやるわみたいな
日があってもわかるんだけど
3週間運営むずと思って
そこの参加メンバーのモチベーションのコントロールとか
あとは参加のハードルをいかに下げるかみたいなところを
結構事前準備で考えてやってきたんで
そこの話からしていこうかな
3週間のコンペとは言ったものの事前準備に
3週間くらいかけていて同じくらいの期間を
そこでもちろんデータセットの準備とかどういう評価指標でやるかとか
っていうのはもちろんコンペをやる上で必要なものは揃えたんですけど
一番は参加者が簡単にそのコンペでサブミット
自分の予測モデルを簡単に作れるかっていうところが大事かなと思っていたんで
まずは誰もがボタン一つで一連の予測値が出せるような
ベースラインのノートブックっていうんですかね
サンプルコードみたいなところを事前準備していて
そこをベースに少しずつカスタムしていけば
自分のやりたいことが少しずつ変えられるような
まずは構成を取ったっていうのが一つの工夫ですかね
なるほどね
もともとあまり時間取れないよっていうメンバーもいたんで
そういう人向けにそのノートブックとあとは特徴量を少し変えるだけ
例えば100個ある特徴量だからいくつか選択するだけで
そのモデルが再学習されるような設定ファイルを準備しておくとか
そこら辺の実験でもまずはいいかなと思って
事前の準備を結構しましたね
確かにハードルが下がれば一旦週1ぐらいでサブミットしてくれればいいの
ラインもクリアはさせやすそう
そうなんですよね
あれだよね
今回10人とかでスモールにやったって話だったけど
なんだろうな例えばデータセットが
ちゃんと管理されてるサーバーというか
場所みたいなのがあってそれは別にGoogleワークスペースでも
さっきの話ある程度完結しそうだしGitHubでもいいしみたいなのがあって
それが繋がったカーソルとか
全員同じスペックのやつが
手元にあるみたいになったら
こういうアイデアいけんじゃねって言ったら自然言語である程度できる
世界でもあるわけじゃん今だと
多分みんなキャッチアップはしてるけど
コードの改善の仕方って絶対AIに聞いてるだけじゃん
間違いない
自然言語縛りにした上で
事業開発とかの人も入って
これ当てた方が絶対に事業予測って精度いいじゃんって
こっそり思ってることをモデルに組み込むみたいな
運用もこれからできるんだろうなって聞いててちょっと思ったよね
そのアイデアは今回やって
そこに向かえるなっていう兆しを感じていて
データセットと評価指標と
あとは分析する環境さえ標準的なものが
揃って準備されれば
人間がやってもAIのエージェントがやってもそこって同じだと思うんですよ
やる人が変わるだけで
全然いけるよね
人間のコースかけるよりかはAIエージェントにグルグル実験回させた方が
絶対効率的なのは当たり前なんで
その下地というか土台を今回作ることができたなという風に感じていて
確かに今の形可能性広がるような
そうなんですよね
第2回第3回ってやっていくうちに徐々にここのコンペの形式をブラッシュアップされて
自分の中ではゆくゆくはこれはAIエージェントに置き換えるみたいなことを
トライするべきなんだろうなっていうのは
期待しつつやってみたいことも一つになってきてますね
しゃべって自然言語でこの要素
そうだなみたいな特徴量はこれとこれとこれがいいんじゃないかなと思ってるけど
どうかねみたいなのを話してフィードバック返ってきながら
じゃあそれでいこうって言ってフィードバックOKみたいな
ポチポチって押していったら特徴量決まって
じゃあモデル回すか一旦特徴量変えただけで
いくみたいないったらどうなる
まあOKそうだから一旦サミットしとくかみたいな感じで
サミットさせて同じようなアプローチをした人たち
自然言語でやるからこそ統計たまっていって
それを分析してまとめたら
この4本ぐらいのブランチのパターンになりそうだよみたいな
になってみたいなのやったらめっちゃ効率良さそうだし
敷居も下げれるよね
そうですね人間がどこまで開催するかっていうのはありますし
ちょうどここ最近ちょっと話取れますけど
カグルのコンペでテーブル形式のコンペが今開催されていて
そこの中で暫定位置を取ってるユーザーが
完全にAIエージェントだけで
コンペに参加させたみたいな
俺この間それXで見たかもしれんな
こういう風にやりましたみたいなところがディスカッションに書かれてたんですけど
データセットとコンペのルールと
モデルを作るっていうところのタスクをAIエージェントにやらせて
サブミットして評価して