データアナリストのりょっちです。
データサイエンティストのたっちゃんです。
久しぶりのweb3回でございますか。
本当に久しぶりじゃないですか。
もうずっと生成AIの話とか、書籍の本出してやろうって話とか、
自分の事業家の話とかしてたんで。
半年、もっと、1年くらいやってない。
覚えてないですもん、前回何の話をしたか。
ほろよいweb3と絡んだくらい?
あー、そんくらいかもね。
かもしれないですよね。
じゃあ今日は、何だっけ?
株価予測みたいな話だっけ?
そう、今日はNumeraiっていうプラットフォームの話をしようと思ってます。
そういうカードゲームあったよね。
昔。
え?
あの、中田敦彦が作ったみたいなやつ。
なんだっけな。
心理戦とかそういう系のゲームかな。
ぬめろん、ぬめろん。
ぬめろんね。
いや、まあそれはいいのよ。
Numeraiですよ、今日は。
はいはい、何にも調べないで来たよ。
あ、ほんとですか。
一言で言うと、データサイエンティストが株価の予測をして、それでお金を稼ぐことができるっていうプラットフォーム。
えー、なんかちょっとカグルっぽいね。
あ、でもまさにそうで、そのカグラーの人たち、カグルをやってる人、データサイエンティストカグラーって言うけど、カグラーもこのNumeraiに参加してたりするって言われていて。
へー。
で、カグルのちょっと、なんだろうな、不満がある部分とか、ちょっと治安の悪い部分とかに嫌気をさせてる人が、まあNumeraiはいいよねって言って、流れてきてるっていうのも一部あったりするって。
え、そうなの。え、なにそのカグルの嫌な面って。あんまなんか聞かなくない?聞く?
いやまあ、徐々に治安は悪くなってるって言われていて。
カグラー界隈そんな感じなんですか?
カグルってデータサイエンティストが参加するデータ分析のコンペティションで、まあいいAIモデルを作った方が上位になってメダルをもらったりとか、何回もこういう金メダルとかを取ってるとグランドバスターとか呼ばれる称号になるみたいな。
そういうランキングのシステムとかあるんですけど。
で、しかも賞金も出るもんね。
そう、上位何位とかに入って、上位10位とかまでに入ったら賞金が出るとか。
会社にもたくさんいますわ。
そうですよね。なんだけど、やっぱり誰もが上位に行きたいから抜け道を探すわけですよ。
まあそうだよね。ゲームですから。
はい。でなった時に、いくつかこう抜け道というか悪いことができていて、一つがプライベートシェアリングって言われる、そのコンペに参加している人たちの中で、チームを組まずに情報共有をしちゃうとか。
ああ、俺それできるよなってずっと思ってたわ。
そうそう。っていうのはルール上禁止されていて、もし誰か見つかったらバンはされるのかな。とりあえずランキングから除外されたりとか。
へえ。
この人たち同じ組織に属している。カグラじゃん。チーム組んでないのに上位にいる。おかしいよねみたいなことが、まあランキングのリーダーボードを見てるとあったりするんですよ。
ああ、やるんだ。やっぱりやるんだ。
まあやってるかどうかはグレーだし、ちゃんとルールを守ってるかもしれないけど疑われるようなユーザーも一部いるっていうのが実際のところ。
まあそうだよね。だってそれで別に上位に上げといたら、それだけで別にね、後々得するもんね、全員ね。
そうそう、まあ転職とかにも使えるかもしれないし、何かしらのメリットがあったりしますよね。
真摯に取り組むよりもリターンはでかいからね。
そうなんですよね。だからまあそういう悪いことをして上位になるっていうケースとかあるし、
あとは結構コンペごとに評価指標が違ったりして結構複雑だったりするんですよね。
結局カグルっていうゲームはその設定されている評価指標をできるだけ高くするっていうゲームなんで、
それの評価指標の中に我々には明かされてない重みみたいなのが使われていたりすると、
カグルの運営者しかわかってないマジックナンバーとか、参加者全員公平ではあるけれども、
カグルの運営に対するちょっと信頼感が、不信感みたいなのが一部あったりしたりとか。
そういうのはあんま聞かないね。どこでそんな話してるのみんな。
カグルのディスカッションとか刑事マーみたいなのがあったりするんですけど、
そういうところで、このコンペの運営はレスポンス遅い人だわ、ちょっとこのコンペ外れかいかもねとか、そういう話題になったりするんですよ。
へー、そうなんだ。
対応が雑な人だよねとか、ここの企業が出してるコンペちょっと微妙だよねとか。
へー、そんなあるんだな。
っていうのがあったりして、というところで、徐々に参加者も増えてきてるから、全体として治安の悪くなっていく方に動いていってたりもするのかなっていうのが現状。
話戻すけど、そういう運営への不信感とか参加者への良くない行いがあったりとかして、
家具類への不信感からまた別のプラットフォームを求めて、今回いうぬめらいっていうところに人が増えてきてるっていうのも一部あったりするよっていうのが今日の話。
へー、そっちはじゃあぬめらいに行くとそういう不満が解消できる形にはなってるってことだ。
そういうなんか別に明治的に対抗してるわけではない。
そうだね、明治的に対抗してるわけではないし、性質がちょっと違うっていうのがあって、ぬめらいは一つのファンドになってるわけですよ。
どういうことかというと、ぬめらいのプラットフォームでやってることは、世界中のあらゆる企業の株式を将来どれくらい上がるか下がるかっていうところを予測するAIモデルを作ろうとしてるんですよ。
ぬめらいが。
ぬめらいのプラットフォームでデータサイエンティストがですね。
うんうん。
なんで各データサイエンティストはいろんなAIモデルを作りますと、自分の一番強いと思う。
で、そのAIモデルに対して課金金を払うんですよ、データサイエンティストはそのサブ提出するときにそのAIモデルをぬめらいに対して。
提出するのに費がかかる。
そうそうそう。実際に良い精度を出したときにはその精度に応じてぬめらいからリターンが返ってくるんですね。
ほう。
逆に悪いモデルを出したときにはその課金金が募集されるみたいな。
そういう仕組みをとってるわけですよ。
うんうん。
これがデータサイエンティストにとって良いモデルを作るモチベーションになっていて、できるだけ大きなリターンを得ようと思って良いAIモデルを作っていくっていうところがデータサイエンティストがやってること。
ほう、なるほどね。
自信を持った予測のモデルを出すときに、じゃあ10万とか払って、お前じゃあこれ10万で売買するぜ、みたいになって。
そうそうそう。
で、上がったところで課金金に対して何倍かでまた返ってくるみたいな。
うんうん。はい、疑問です。疑問があります。
それはプラットフォームでやる必要はあるんですか?
自分たちでやってもいいんじゃないかって話ですよね。
そう、本当に自信があるんだったら別に自分の売買に使えばいいじゃん。
それはそうだよね。
ヌメライっていうプラットフォームが集合地みたいな形になるメリットとか、人がたくさん集まってくる理由があんまり分かんない。
これね、自分も調べてて思って、これ別に自分でやればいいじゃんと思ったんだよ。
うん。
ただ、実際の株価予測を自分でやろうとしたときに相当データを集めるのって難しいと思うんですよ。
うーん、それは株価の単純な変動のデータ以外も取れるってこと?
ヌメライは学習に使えるデータセットっていうところを既に準備していて、
すべてのAIに読み込ませる特徴量が匿名化されているので、どんな特徴を使っているかは不明なんだけど、
かなりの数の特徴量が準備されているデータセットがあって、それに対してデータサインテストは単純に予測モデルを作るだけなんですね。
その学習データを使って。
あー、なるほど。
データが綺麗に整備されている状態だからこそ、データサインテストはAIのモデルを作ることだけに集中できるっていうところが一つヌメライを使うメリットなのかなと思うんですよね。
あー、なるほどね。
あー、まあでも言わんとしていることはわかるわ。
きっと、今株価予測って言われて想像してるのって多分みんなただのチャートの形状だったりとか、箱ひげ図みたいになってるものとか、
ああいうのだけだと思ってるだろうけど、多分もっといろんな企業の情報とかが含まれていて、
それがまあなんかいい感じに企画化されてるとかマスクされて、どんな指標なのかわかんなくなってるんだけど、扱いやすくはまとまっている。
で、そういうデータが揃った上で、じゃあ本当にモデルだけで勝負したらどうなるのかっていうところがカグルとの共通っていうのか。
そうだね。
で、しかも課題が株価を予測するっていうもう一つにどっかしてるみたいな。
うんうん。
はいはいはい。追いつきました。
いやそう、っていうね、そういうプラットフォームがありますよって話で、いやでも今、そう突っ込んでくれた通りで、データセットを準備するってすごい大変だよなと思っていて。
そうだねー。
特にこのぬめらいが準備しているデータセットすごくて、自分もデータダウンロードして見てみたんですけど、何百っていう数の特徴量が企業ごとに準備されてるんですよ。
企業ごとに何百って特徴量って、多分あらゆる指標があると思うんですね。売上とかそういう企業の財務とか、そういうお金回りに関する情報とか、
どんなサービスしてるかとか、それを過去にちょっとそういう分析したことがあって、それをネット上からもちろん収集するのはそう簡単じゃなくて、やっぱりそういうデータセットを集めている別のサービスがあったりするんですけど、
そこのライセンスだけでもすごいお金がかかる。
あーなるほどね。
月額数百万とかそういうレベルで。
あーなんとなくイメージつくわ。
ってなると、やっぱ個人でそういうデータセットを集めるのはやっぱ難しいんじゃないかなと。
帝国データバンクみたいな、あれの詳細バージョンみたいなのがたくさんあるわけだ。
あーあるんですよね。
なら場が整ってて、AIのモデルでそういうのができるのかみたいなのを、不特定多数の人たちが寄ってきて、試してどうなんだ。
で、自分のモデルが良ければ、その分のリターンが返ってくるから、なんか磨き込み、磨き込み甲斐があるというか。
なるほどね。
まあでも、なんかトークンを入れて、すごい分かりづらくしてるというか、
トークンとでやり取りして株価を予測してって言ってるけど、
まあ言っちゃえば全員で株を、すべて株取り分ってことだよね。
確かにね。
トークンも同じようなもんだから。
そうだね。
株価を予測するためにNMRの株を買って、参加して、
で、その中で株主たちが、
いや、俺の使ってるモデルでやった方がリターンは大きいから、
今回は俺のモデルでいくぜみたいなのを言って、
で、ポジになったらリターンが返ってきて、
で、たぶん、なんだっけ、ヌメロンじゃなくて、
ヌメラーかな。NMRでもいいや。
っていうが、の価値も上がっていき、みたいなサイクルが回っていくんだね。
そうそうそう。
あー、なるほどね。
なんか、後発だからこそ、参加者が参加している意義みたいなのを持てるようなプラットフォームにしているんだね。
そう、なんかこう、うまく仕組み作りができているようなっていう風に思いますよね。
こういう全体像が見えてきたときに。
まあ、確かにね。
ちょっと面白いなと思いません?この仕組み。
いや、おもろいね。
Web3というか、こう、トークンを使ったコミュニティの作り方として一つ正解の形というか、
うまく働く仕組みができているんじゃないかなと思うんですよね。
そうね。で、しかも持っているトークンがなんか、ガバナンスのトークンではないから、
ガバナンストークン渡してDAOを運営するみたいな発想だと、なんか民主主義の変なところが出るみたいな話があるけど、
価値が変化するトークンを持たせて、そいつを上げるためにみんな頑張ろう、だだけってことか。
そうだね。
やっぱり、一応運営はNumeraiっていう組織があって、運営はしてるから、完全に分散されてるかっていうと、そうではないんだけれども、
そうだよね。
一部中央集権的にはなっているのは事実だとは思うんだけれども、
ただ、NMRというトークンは、課金に対してのリターンというところだけで働くもので、
そこのトランザクションっていうのは、イーサリアムか、イーサリアムのブロックチェーンを使っているから、
そこのトランザクションは刻まれてるよっていうところだから、
透明性があるといえばあるんだよね。
NMRとの交換というか、取引自体はオープンな状態で記録されているっていうところでの透明性。
はいはいはい。じゃあデータは見れるのか。
見れると思いますね。DUNEとか使える人は見てみたら、どういうふうにこのサービスが広がっているかとかは、
分かるかなと思うんですけれど。
今、見てました。
そうですか。ちなみにこのNUMERAIは2015年くらいからできている組織というか。
だから10年くらい前からあるんだよね。
出てこないよ。
NMRで調べたらどうですか。
出ないね。
逆にDUNEでこれのダッシュボード作れば、もしかしたら注目されるかもしれないっていう感じ?
いいんじゃない?面白いんじゃない?
でもDUNEとかも実際そうだよね。
構造化されたデータにちゃんと落としてくれてるっていう利点がやっぱプラットフォームとしてあったみたいな。
一応コード書けば自分でブロックチェーン上にどういうログがあってとかっていうのは整理できるんだけど、
それをする手間とか考えたらプラットフォームの上で活躍した方が良いじゃんみたいな話だよね。
そうだね。いい感じでスケール書くだけでデータ取得できるっていうところは強いですよね。
そこを整備しちゃうっていうのがプラットフォームとしてはやっぱ勝ち筋なのかもしれないですね。
こういうDUNEとかだと。
で、多分データベースだけ持ってるっていうのの脆弱性というか、
後発が来た時に追いつかれちゃうとか資本のパワーに負けるんだよねきっとね。
ってなってくるからトークンでバンドルしましょうみたいな感じか。
まあきっともっと細かく考えてるんだろうけどシンプルにそういう話なんだろうね。
そうね価値を自分たちで作りに行くっていうことをしたっていうのがヌメライですよね。
ビッグテックが入ってきたとて、そこに付随した同じようなサービスを作れるけど、付随した価値みたいなのを喪失はできないからね、C的には。
そうですね。ヌメライが誕生する以前にも似たようなデータサイエンティストの力を使って株価を予測させに行くみたいなコミュニティがあったらしいんですけど、
クォンツとかそうだもんね、仕事としては。
クォンツはNASAのロケットエンジニアスタートだからね。
隣のデータ分析屋さん、今回も面白いと思ったらフォロー・レビューよろしくお願いします。
番組の関数や質問はハッシュタグとなりの分析屋、隣のほうがひながらで分析屋は漢字でお願いします。
また概要欄に貼っているお手紙フォームからコメントを寄せください。
ではまた。バイバイ。