1. となりのデータ分析屋さん
  2. 111. 株価や仮想通貨をAI予測..
2025-04-09 21:35

111. 株価や仮想通貨をAI予測するコンペサービス「Numerai」が激アツ!web3をデータサイエンス【ビットコイン】


3/28にりょっち筆頭著者で発売する「マーケティングをAIで超効率化!ChatGPT APIビジネス活用入門」はデータサイエンスが気になる人はmust buy!!


りょっちの初単著「⁠⁠⁠やっぱり宇宙はすごい⁠⁠⁠(SB新書)」がおかげさまで発売後即重版!宇宙×データサイエンスについても描いてるから、コワーカー諸君も必ず手に取ってくれたまえ。


番組の感想や、質問はXから「⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠#となりの分析屋⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠」もしくは、以下おたよりフォームからお寄せください!⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://forms.gle/1Qq3cfqYgVXgs5Qr6⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠


=========================

▼Numeraiはこちら

https://numer.ai/home


=========================

▼書籍の購入はこちらから

⁠超入門 はじめてのAI・データサイエンス(培風館)⁠


=========================

りょっち

X : ⁠@_ryo_astro⁠

Instagram : @ryo_astro


たっちゃん

X:⁠@tatsuki_2022

サマリー

Numeraiはデータサイエンティストが株価予測を行い、お金を稼げるプラットフォームです。カグルからの参加者も増え、評判の高いデータを利用してAIモデルを作成しています。Numeraiは株価や仮想通貨の予測をAIを使って競い合うコンペティションを提供するウェブ3プラットフォームです。このプラットフォームではトークンを用いた参加が必須で、参加者は自分のモデルを競わせることで報酬を得る仕組みがあります。

Numeraiの紹介と背景
データアナリストのりょっちです。
データサイエンティストのたっちゃんです。
久しぶりのweb3回でございますか。
本当に久しぶりじゃないですか。
もうずっと生成AIの話とか、書籍の本出してやろうって話とか、
自分の事業家の話とかしてたんで。
半年、もっと、1年くらいやってない。
覚えてないですもん、前回何の話をしたか。
ほろよいweb3と絡んだくらい?
あー、そんくらいかもね。
かもしれないですよね。
じゃあ今日は、何だっけ?
株価予測みたいな話だっけ?
そう、今日はNumeraiっていうプラットフォームの話をしようと思ってます。
そういうカードゲームあったよね。
昔。
え?
あの、中田敦彦が作ったみたいなやつ。
なんだっけな。
心理戦とかそういう系のゲームかな。
ぬめろん、ぬめろん。
ぬめろんね。
いや、まあそれはいいのよ。
Numeraiですよ、今日は。
はいはい、何にも調べないで来たよ。
あ、ほんとですか。
一言で言うと、データサイエンティストが株価の予測をして、それでお金を稼ぐことができるっていうプラットフォーム。
えー、なんかちょっとカグルっぽいね。
あ、でもまさにそうで、そのカグラーの人たち、カグルをやってる人、データサイエンティストカグラーって言うけど、カグラーもこのNumeraiに参加してたりするって言われていて。
へー。
で、カグルのちょっと、なんだろうな、不満がある部分とか、ちょっと治安の悪い部分とかに嫌気をさせてる人が、まあNumeraiはいいよねって言って、流れてきてるっていうのも一部あったりするって。
え、そうなの。え、なにそのカグルの嫌な面って。あんまなんか聞かなくない?聞く?
いやまあ、徐々に治安は悪くなってるって言われていて。
カグラー界隈そんな感じなんですか?
カグルってデータサイエンティストが参加するデータ分析のコンペティションで、まあいいAIモデルを作った方が上位になってメダルをもらったりとか、何回もこういう金メダルとかを取ってるとグランドバスターとか呼ばれる称号になるみたいな。
そういうランキングのシステムとかあるんですけど。
で、しかも賞金も出るもんね。
そう、上位何位とかに入って、上位10位とかまでに入ったら賞金が出るとか。
会社にもたくさんいますわ。
そうですよね。なんだけど、やっぱり誰もが上位に行きたいから抜け道を探すわけですよ。
まあそうだよね。ゲームですから。
はい。でなった時に、いくつかこう抜け道というか悪いことができていて、一つがプライベートシェアリングって言われる、そのコンペに参加している人たちの中で、チームを組まずに情報共有をしちゃうとか。
ああ、俺それできるよなってずっと思ってたわ。
そうそう。っていうのはルール上禁止されていて、もし誰か見つかったらバンはされるのかな。とりあえずランキングから除外されたりとか。
へえ。
この人たち同じ組織に属している。カグラじゃん。チーム組んでないのに上位にいる。おかしいよねみたいなことが、まあランキングのリーダーボードを見てるとあったりするんですよ。
ああ、やるんだ。やっぱりやるんだ。
まあやってるかどうかはグレーだし、ちゃんとルールを守ってるかもしれないけど疑われるようなユーザーも一部いるっていうのが実際のところ。
まあそうだよね。だってそれで別に上位に上げといたら、それだけで別にね、後々得するもんね、全員ね。
そうそう、まあ転職とかにも使えるかもしれないし、何かしらのメリットがあったりしますよね。
真摯に取り組むよりもリターンはでかいからね。
そうなんですよね。だからまあそういう悪いことをして上位になるっていうケースとかあるし、
あとは結構コンペごとに評価指標が違ったりして結構複雑だったりするんですよね。
結局カグルっていうゲームはその設定されている評価指標をできるだけ高くするっていうゲームなんで、
それの評価指標の中に我々には明かされてない重みみたいなのが使われていたりすると、
カグルの運営者しかわかってないマジックナンバーとか、参加者全員公平ではあるけれども、
カグルの運営に対するちょっと信頼感が、不信感みたいなのが一部あったりしたりとか。
そういうのはあんま聞かないね。どこでそんな話してるのみんな。
カグルのディスカッションとか刑事マーみたいなのがあったりするんですけど、
そういうところで、このコンペの運営はレスポンス遅い人だわ、ちょっとこのコンペ外れかいかもねとか、そういう話題になったりするんですよ。
へー、そうなんだ。
対応が雑な人だよねとか、ここの企業が出してるコンペちょっと微妙だよねとか。
へー、そんなあるんだな。
っていうのがあったりして、というところで、徐々に参加者も増えてきてるから、全体として治安の悪くなっていく方に動いていってたりもするのかなっていうのが現状。
話戻すけど、そういう運営への不信感とか参加者への良くない行いがあったりとかして、
家具類への不信感からまた別のプラットフォームを求めて、今回いうぬめらいっていうところに人が増えてきてるっていうのも一部あったりするよっていうのが今日の話。
データサイエンティストの役割
へー、そっちはじゃあぬめらいに行くとそういう不満が解消できる形にはなってるってことだ。
そういうなんか別に明治的に対抗してるわけではない。
そうだね、明治的に対抗してるわけではないし、性質がちょっと違うっていうのがあって、ぬめらいは一つのファンドになってるわけですよ。
どういうことかというと、ぬめらいのプラットフォームでやってることは、世界中のあらゆる企業の株式を将来どれくらい上がるか下がるかっていうところを予測するAIモデルを作ろうとしてるんですよ。
ぬめらいが。
ぬめらいのプラットフォームでデータサイエンティストがですね。
うんうん。
なんで各データサイエンティストはいろんなAIモデルを作りますと、自分の一番強いと思う。
で、そのAIモデルに対して課金金を払うんですよ、データサイエンティストはそのサブ提出するときにそのAIモデルをぬめらいに対して。
提出するのに費がかかる。
そうそうそう。実際に良い精度を出したときにはその精度に応じてぬめらいからリターンが返ってくるんですね。
ほう。
逆に悪いモデルを出したときにはその課金金が募集されるみたいな。
そういう仕組みをとってるわけですよ。
うんうん。
これがデータサイエンティストにとって良いモデルを作るモチベーションになっていて、できるだけ大きなリターンを得ようと思って良いAIモデルを作っていくっていうところがデータサイエンティストがやってること。
ほう、なるほどね。
自信を持った予測のモデルを出すときに、じゃあ10万とか払って、お前じゃあこれ10万で売買するぜ、みたいになって。
そうそうそう。
で、上がったところで課金金に対して何倍かでまた返ってくるみたいな。
うんうん。はい、疑問です。疑問があります。
それはプラットフォームでやる必要はあるんですか?
自分たちでやってもいいんじゃないかって話ですよね。
そう、本当に自信があるんだったら別に自分の売買に使えばいいじゃん。
それはそうだよね。
ヌメライっていうプラットフォームが集合地みたいな形になるメリットとか、人がたくさん集まってくる理由があんまり分かんない。
これね、自分も調べてて思って、これ別に自分でやればいいじゃんと思ったんだよ。
うん。
ただ、実際の株価予測を自分でやろうとしたときに相当データを集めるのって難しいと思うんですよ。
うーん、それは株価の単純な変動のデータ以外も取れるってこと?
ヌメライは学習に使えるデータセットっていうところを既に準備していて、
すべてのAIに読み込ませる特徴量が匿名化されているので、どんな特徴を使っているかは不明なんだけど、
かなりの数の特徴量が準備されているデータセットがあって、それに対してデータサインテストは単純に予測モデルを作るだけなんですね。
その学習データを使って。
あー、なるほど。
データが綺麗に整備されている状態だからこそ、データサインテストはAIのモデルを作ることだけに集中できるっていうところが一つヌメライを使うメリットなのかなと思うんですよね。
あー、なるほどね。
あー、まあでも言わんとしていることはわかるわ。
きっと、今株価予測って言われて想像してるのって多分みんなただのチャートの形状だったりとか、箱ひげ図みたいになってるものとか、
ああいうのだけだと思ってるだろうけど、多分もっといろんな企業の情報とかが含まれていて、
それがまあなんかいい感じに企画化されてるとかマスクされて、どんな指標なのかわかんなくなってるんだけど、扱いやすくはまとまっている。
で、そういうデータが揃った上で、じゃあ本当にモデルだけで勝負したらどうなるのかっていうところがカグルとの共通っていうのか。
そうだね。
で、しかも課題が株価を予測するっていうもう一つにどっかしてるみたいな。
うんうん。
はいはいはい。追いつきました。
いやそう、っていうね、そういうプラットフォームがありますよって話で、いやでも今、そう突っ込んでくれた通りで、データセットを準備するってすごい大変だよなと思っていて。
そうだねー。
特にこのぬめらいが準備しているデータセットすごくて、自分もデータダウンロードして見てみたんですけど、何百っていう数の特徴量が企業ごとに準備されてるんですよ。
企業ごとに何百って特徴量って、多分あらゆる指標があると思うんですね。売上とかそういう企業の財務とか、そういうお金回りに関する情報とか、
どんなサービスしてるかとか、それを過去にちょっとそういう分析したことがあって、それをネット上からもちろん収集するのはそう簡単じゃなくて、やっぱりそういうデータセットを集めている別のサービスがあったりするんですけど、
そこのライセンスだけでもすごいお金がかかる。
あーなるほどね。
月額数百万とかそういうレベルで。
あーなんとなくイメージつくわ。
ってなると、やっぱ個人でそういうデータセットを集めるのはやっぱ難しいんじゃないかなと。
帝国データバンクみたいな、あれの詳細バージョンみたいなのがたくさんあるわけだ。
あーあるんですよね。
なら場が整ってて、AIのモデルでそういうのができるのかみたいなのを、不特定多数の人たちが寄ってきて、試してどうなんだ。
で、自分のモデルが良ければ、その分のリターンが返ってくるから、なんか磨き込み、磨き込み甲斐があるというか。
コンペティションの特徴
そうですね。
はーなるほどね。
実際の株式市場でそのモデルが動いて、リアルタイムに結果が返ってくる。
本当に短いスパンで、本当に2週間に1回とかのペースで、もうずーっとコンペが実施されてるんで。
それもまたちょっとカグルと違うところで、カグルって数ヶ月かけて1つのコンペが終わるんだけど、
ヌメライはほんと1ヶ月弱で、ポンポンポンとコンペがもうずーっと続いてくんで。
あ、コンペ形式ではあるんだ。
そう、そうなんですよ。
変わらず、将来の株価予測なんだけど、その期間が変わっていて、次はここからここまでの将来のね、
ここから1ヶ月先の株価予測。また1ヶ月後はそこから2ヶ月先から3ヶ月後の株価予測みたいな感じで、
もうずーっと続いてくっていうイメージ。
うーん、なるほどね。
だからそういう意味で、自分の作ったモデルが上手くいった上手くいってないかっていうフィードバックが、
すぐ返ってくるってところも、参加するときのモチベーションになったりするのかなっていう。
そうだしかないね。そういうサイクルを早めに回したいし、
あとは公になってるパブリックな情報を指標にしているから、
さっき言ってたカグルの中で変なマジックナンバーみたいなのが隠れて評価指標がわかりづらいみたいなところもないし、
誰もなんか恣意的なことはできない。
Web3とトークンの役割
そうそうそう。
へー、なるほどね。
だからさっきの課題感みたいなところが解消できてるよねっていうところが、
まあぬめらいが信頼されるポイントかなっていうのと、
冒頭話してたWeb3、ブロックチェーンみたいな話。
ああそう、その要素がいつ来るんだろうと思ってた。
で、それがさっき自分の作った、データサイエンティストが作ったモデルに対して、
課金金をかけるって言ってたんだけど、その課金金がトークンになってるんですよ。
はいはいはい、なるほど。そこに入ってくるのか。
これがWeb3の要素だなと思っていて、
ぬめらいのコミュニティプラットフォームでは、
ぬ、ぬめらかな、NMRっていう単位を使ったトークンがあって、
ビットコインのBTCみたいなことね。
そうそうそう。で、1ぬめら、今8ドルとか9ドルぐらいなんだけど、
うん。
まあだから1200、300円とかかな、今日本円だと。
うんうん。
で、そのトークンをまず購入して、購入したトークンを使って、
AIモデルに対して課金を払うっていう手続きを取ることでようやく、
このコンペに参加して報酬を得る準備ができるっていう、そういう仕組みになってるんですね。
うんうんうん。
実際に報酬を得たかったら、まずはNMR、ぬめらを購入しましょうよっていうところで、
で、売買というか参加費とかはNMRで払う。
そうそうそう。
で、リターンもNMRで返ってくる。
で、そうすると参加者が増えていって、取引が増えていくと、
それだけステークホルダーも増えていき、人気になっていくとトークンの価値も上がっていき、
そうだね。
だから序盤に頑張る意義もあるし、
うん。
プラットフォーム自体を盛り上げることにもインセンティブが働くみたいな。
そうだね。
Numeraiの競争力
なるほどね。
まあでも、なんかトークンを入れて、すごい分かりづらくしてるというか、
トークンとでやり取りして株価を予測してって言ってるけど、
まあ言っちゃえば全員で株を、すべて株取り分ってことだよね。
確かにね。
トークンも同じようなもんだから。
そうだね。
株価を予測するためにNMRの株を買って、参加して、
で、その中で株主たちが、
いや、俺の使ってるモデルでやった方がリターンは大きいから、
今回は俺のモデルでいくぜみたいなのを言って、
で、ポジになったらリターンが返ってきて、
で、たぶん、なんだっけ、ヌメロンじゃなくて、
ヌメラーかな。NMRでもいいや。
っていうが、の価値も上がっていき、みたいなサイクルが回っていくんだね。
そうそうそう。
あー、なるほどね。
なんか、後発だからこそ、参加者が参加している意義みたいなのを持てるようなプラットフォームにしているんだね。
そう、なんかこう、うまく仕組み作りができているようなっていう風に思いますよね。
こういう全体像が見えてきたときに。
まあ、確かにね。
ちょっと面白いなと思いません?この仕組み。
いや、おもろいね。
Web3というか、こう、トークンを使ったコミュニティの作り方として一つ正解の形というか、
うまく働く仕組みができているんじゃないかなと思うんですよね。
そうね。で、しかも持っているトークンがなんか、ガバナンスのトークンではないから、
ガバナンストークン渡してDAOを運営するみたいな発想だと、なんか民主主義の変なところが出るみたいな話があるけど、
価値が変化するトークンを持たせて、そいつを上げるためにみんな頑張ろう、だだけってことか。
そうだね。
やっぱり、一応運営はNumeraiっていう組織があって、運営はしてるから、完全に分散されてるかっていうと、そうではないんだけれども、
そうだよね。
一部中央集権的にはなっているのは事実だとは思うんだけれども、
ただ、NMRというトークンは、課金に対してのリターンというところだけで働くもので、
そこのトランザクションっていうのは、イーサリアムか、イーサリアムのブロックチェーンを使っているから、
そこのトランザクションは刻まれてるよっていうところだから、
透明性があるといえばあるんだよね。
NMRとの交換というか、取引自体はオープンな状態で記録されているっていうところでの透明性。
はいはいはい。じゃあデータは見れるのか。
見れると思いますね。DUNEとか使える人は見てみたら、どういうふうにこのサービスが広がっているかとかは、
分かるかなと思うんですけれど。
今、見てました。
そうですか。ちなみにこのNUMERAIは2015年くらいからできている組織というか。
だから10年くらい前からあるんだよね。
出てこないよ。
NMRで調べたらどうですか。
出ないね。
逆にDUNEでこれのダッシュボード作れば、もしかしたら注目されるかもしれないっていう感じ?
いいんじゃない?面白いんじゃない?
でもDUNEとかも実際そうだよね。
構造化されたデータにちゃんと落としてくれてるっていう利点がやっぱプラットフォームとしてあったみたいな。
一応コード書けば自分でブロックチェーン上にどういうログがあってとかっていうのは整理できるんだけど、
それをする手間とか考えたらプラットフォームの上で活躍した方が良いじゃんみたいな話だよね。
そうだね。いい感じでスケール書くだけでデータ取得できるっていうところは強いですよね。
そこを整備しちゃうっていうのがプラットフォームとしてはやっぱ勝ち筋なのかもしれないですね。
こういうDUNEとかだと。
で、多分データベースだけ持ってるっていうのの脆弱性というか、
後発が来た時に追いつかれちゃうとか資本のパワーに負けるんだよねきっとね。
ってなってくるからトークンでバンドルしましょうみたいな感じか。
まあきっともっと細かく考えてるんだろうけどシンプルにそういう話なんだろうね。
そうね価値を自分たちで作りに行くっていうことをしたっていうのがヌメライですよね。
ビッグテックが入ってきたとて、そこに付随した同じようなサービスを作れるけど、付随した価値みたいなのを喪失はできないからね、C的には。
そうですね。ヌメライが誕生する以前にも似たようなデータサイエンティストの力を使って株価を予測させに行くみたいなコミュニティがあったらしいんですけど、
クォンツとかそうだもんね、仕事としては。
クォンツはNASAのロケットエンジニアスタートだからね。
隣のデータ分析屋さん、今回も面白いと思ったらフォロー・レビューよろしくお願いします。
番組の関数や質問はハッシュタグとなりの分析屋、隣のほうがひながらで分析屋は漢字でお願いします。
また概要欄に貼っているお手紙フォームからコメントを寄せください。
ではまた。バイバイ。
21:35

コメント