1. となりのデータ分析屋さん
  2. 73. ブロックチェーン分析は生..
2024-07-17 29:21

73. ブロックチェーン分析は生成AIがサポート!web3時代のデータサイエンティストになろう【Farcaster】【Dune Analytics】

00:03
ちゃんと都知事選行った? 投票行って外食した?
ザ・ピース歌った? 全然連想ゲームに置いてかれてる。 どういうこと? えっ?
え? 投票行って外食するでしょ? で、ピース? えっ?
モーニング娘。のザ・ピース。 あー、そういうことね。
世代だなぁ。 ちゃんと投票行って外食した? 世代じゃん。 選挙行くたびに思ってるよ。
あ、外食しないと。 即帰宅だよ。 いや、しろよ。外食だろ。 まあ、トミンじゃないんだけどね、俺。そうだよね。
残念ながら。選挙がないから外食に行けない。 多分同世代しか伝わらないっすよ。
投票行ったら外食しないといけない。 外食行ったら投票行かないといけない。 すごい歌だね、それね、今思えば。
モーニング娘。すげーな。 ということで、しかも全然関係ないって言うね。最後ちらっと都知事選の、都知事選の裏の科学の話みたいなのしたけど、
今回の本題はWeb3ブロックチェーン分析。 LLMのおかげで
時代が変わったねって言う。 今から分析屋さんとして名を挙げようとしたら、ここだけなんじゃない?
勝ち筋は。 まだ第一日になれる可能性は残ってる。全然なれるでしょ。なんか一個分析バズコンテンツ出したら
多分業界有名人って感じはする。だね。 ちょっとなんで、一体どんな状況になってて、LLM使ったらこれもう
いけるじゃんってみんなに思ってもらえるような回になってる気がするんで、 ぜひ最後まで楽しんでいってください。どうぞ。
隣のデータ分析屋さん。 この番組は隣の席に知らないことを気軽に聞けるデータ分析屋さんがいたらいいなぁ
を叶えるポッドキャストチャンネルです。 データアナリストのりょっちです。データサイエンティストのたっちゃんです。
久しぶりにブロックチェーン分析の話しますか。 しましょうか。 勢いで前回
予告言っちゃったから喋んないと。 喋らないといけないですよ。 まあこのポッドキャストのさ、
なんだ、歴史みたいなのを振り返っていくと、ポッドキャスト自体は1年だけど、その前の文字のメディアやってみた時から通算したら2年ぐらい?
うん。もうそんな経つかつ。 ブログ書き始めたの?あれなんだかんだ1年ぐらいやってた気もしますよね。
ちゃんと力入ってたのは最初の3ヶ月ぐらいだけど。 あれね、俺が前、今の会社に転職するタイミングに動かしてたから
03:03
いやだから、いや3年前とかか。 2022年の
8月とかって記事があるから、一番先に出したのは7月か。 だから2年前だね、ちょうど。 そんなところから目をつけてたけど、結局
がっつりやってるような、やってないような、みたいな感じで来てしまったわけなんですが。 ですが、最近ね、最近ちょくちょく触るのよ。
オンチェン分析? そう、その当時感じてたハードルみたいなのが、だんだん下がってきてるなっていうのが、正直
あるから良い、良い世界になってるって感じ。 うーん、どんな課題でした?
あの、例えばさ、今も結局分析のプラットフォームとしては、Dune Analyticsってやつが
まあまあ 一番おっきめというか。他にもいろいろあるから好きなの使うんだけどみんな。
で、まあじゃあDuneの中の話で言うと、 あの、データベースがどれを使えばいいのか、まあわからんみたいな。
まあわからん、確かにあったなぁ。 いくらブロックチェーンのデータが構造化されているとはいえ
そもそもこのデータ見たいときはどの値をどうすればいいんですか? そもそもいっぱいデータベースあるけどどれ触ればいいんですか?みたいな
になってたと思うんだけど、何が良くなったかで言うと まあ一部のデータベースに関しては定義書がちゃんとあった上で、その定義書を学習した
チャットGPTのあのファインチューンされたモデルみたいなのがあったりするのよ そう
その このサービスの
DAO出してくださいみたいな。デイリーアクティブユーザー出してくださいみたいに言ったら あのもうDuneのクエリをバーって書いてくれる
えっ すごくない?それ
そうなのよ それって何?Duneのサービスの中で
LLMが使えるっていうこと? Duneの中にもあんのLLM使えるあれはあるんだけど
それはクエリ書いてくれるっていう感じじゃなかった あ、そうなんだ
もう一個ちょっと応用というかまあちょっとしたサポートみたいな 感じなんだけど、あの俺が言ってたのは具体的なサービスの名前言うと
あのワープキャストっていう web3版
のツイッターみたいなXみたいな うーん、ワープキャスト
そうUIとかもそうだしやる行動とかも基本的にはもうXの機能ままみたいな
ポストする? そうそうそうポストするんだけどまあそれが全部チェーン上に乗るから
06:01
まあ一個一個のアクションにある程度お金がかかっちゃうんでね そうか
web3だからトランザクションが発生するとねガス代みたいなところがかかってくるのか そうそうそう
だからあの有料サービスにはなってるんだけど 有料サービスでやるとこの
限られたアクション数の中で行動できるXみたいな
感じになってるサービスがあってなんだそれをこう抱えてる チェーンというかなんか裏側のシステムみたいなやつがあるんだけど
それのデータベースを学習したチャットGPTのGPTsとかが置いてあるのよGPT側に
そうなんだ これはね結構ね使えてデューンかけるファーキャスター括弧GPTっていう
のがあって そういうモデル ファーキャスターっていうのがそうGPTsのタイトルみたいな誰かが作った
でそうするとデューンの中で組むクエリを 教えてくれるのでこのファーキャスターっていうのがこのワープキャストを内包してる
システムみたいなもので っていうのがあるからそのプラットフォームの中にあるものに関してはこのサービスの
ダウン出してくださいこのサービスの中の一番人気のユーザー出してくださいとか っていうのをやると
バーって返してくれるでそれをデューンにそのペチって貼ったら結果出てくるみたいな だからデューンはいわゆるSQLのクエリでデータを抽出したりして
可視化するみたいなツールだから それで使うためのSQLクエリを生成AIがクエリを出力してくれるみたいな
そうそうそういうことなんだ ちょっと分析素養は必要というか出力してほしいカラムとか
出力してほしいそのテーブルの形状をちゃんとイメージして指示出せば出すほど 良いんだけど
頭使ってデータベース探してとかをやんなくて済む それが難しかったですもんね
いざクエリ書き切った時には結構疲弊してるみたいなさ しかもあんま自信ないみたいな
本当にこのカラムが例えばアクティブユーザーを示しているのかとか ユーザーのIDを示したカラムなのかとか
ガス台なのかとかそういう項目が 何の定義がついているかっていうのがよくわからないっていう状態でしたよね
そうそうそれがね結構そのサポートが入るから 結構簡単になってる
そう注目されているシステムだからこそ 外部GPTなんて外部のサービスなんだけどそこに
そこで有用なものを誰かが作ろうとしてるし その人が欲しいからっていうのもあるだろうけどやっぱそうやって作られてるし
09:04
あと一応ねデューンGPTっていうのもあって デューンに関する質問ができるっていうのも一応できてる
ここはねテーブル聞いてもそんなちゃんと返してくれない そうなんだ
なんかどっちかっていうとこう会社とかにさ インターナルな会社の情報を聞いたら返してくれるGPTとかある会社結構あるじゃん
社内チャットボットみたいなやつとか そうそうそうそう
であの社内のポータルとかウィキとかああいうのをクローリングして学習してあってみたいな あんな感じのデューンGPTっていうのもできてるし
っていうのでなんかこうデューンっていうちゃんと注目されてる プラットフォームだからこそGPTの方に誰かが作った二次創作物みたいのがあって
それ使うと結構簡単にその今まで頭使ってた部分はスキップして仕事ができる だいぶでかいですねそれは
いやでかいよ でしかもその結果とかを使ってじゃあそれをパイソンで分析したいですみたいなところとかも
GPTの中でそのまま考えられるからさ その出力結果が出た上でこいつらをパイソンで処理するときこうしてみたいな
それも全部対話しながらできるし 確かにな
なんならデューンが出してくれたデータセットみたいなのを持ってきて そっちの生成AI系のモデルに打ち込んでなんか初期分析してくださいとかもやろうと思ったら
できますよね あできるできる
あのしかもなんかわかんない当時もちゃんとあったのかな デューンの結果を引っ張ってくるAPIめっちゃ使いやすくて
そうなんだ そうそうそう
なんかAPIのキーは発行しなきゃいけないんだけどそのキー発行したらその誰の誰が書いたクエリでも引っ張ってこれんの
あー確かにデューンがAPIを出しましたよみたいなのやつをどっかで 1年前ぐらいだったかな
なんか話題になってた気がする なんかそうでAPIのキーを
例えば俺グーグルのコラボで触ってたんだけどそれ まあコラボ側にちゃんと登録しとくじゃん
でそのキーをちゃんと読み出した上でなんか投資番号みたいのがついてるのよ そのデューンの中で作ったクエリ全部に
誰1万いくつとか10万いくつみたいな クエリ1個作ったらそれだけ
ログが全部投資番号でついてるみたいな状態 なっててそのクエリ id をボチンって入れるとそこで走って出てくる結果がそのままもう
あのコラボ側でデータフレームでベチンって出てくる えー
だからもう
そのデューンのなんか限られた 可視化のビジュアライズのオプションがいくつかあるじゃん
12:02
あそこからはもう一瞬で離脱できるというか すごいねだったらもうコラボ側で api 経由でデューンと接続もできるし
なんならその生成 aik のモデルに対してもやろうと思ったら api で 連携できるからもうコラボで判決してデータの抽出と分析できるみたいなのが
実現できますもうこれ聞いただけでさ そうあのあの苦労してた2年前ぐらいのあれに比べたらもう今超余裕そうじゃん
超余裕 だとはやっぱ周りに
そういうブロックチェーン使ってなんかサービス 展開しますみたいな人が俺は自分の会社にもいるし
それこそねあのホロウェブ3とかもまさにそうじゃそうだね彼らも ってなってっていうので周りにいっぱいいるからあの時に比べてあのなんだ
情報を聞ける相手がまず増えてるわけよ でなおかつ分析がめっちゃしやすくなるっていうのがあって
だから なんかね結構好き好きに結果出せるっていうのがあるし
やっぱまだ2年前誰も気づいてないって言ってたけどまだまだ誰もいない そこまで流行ってはいない
なんかねリューンの中にはやっぱいるんだよね結構いろいろ勢力的にやってる人の アイディアを出してる人もいるんだけど
あの SQL って
なんだ結構みんな書けるじゃん まあ一番最初にビジネスマンが
テック系になろうと思ったらやりやすくですよね そうそうそうあとはちょっとさちょっとちゃんとやってるマーケターの人とかも書ける
まあそうですね プロダクトマネージャーとかやってる人も書けるしさなんかこう
エクセルのマクロとかのレベルで知ってるじゃん っていう風になってるから SQL っていうプラットフォームに落ちてれば結構みんな触るのよ
なるほど だからあの中ではめっちゃすごいダッシュボード作っててあこんな
こんな複雑なクエリよく書くなみたいな400行とかのリューンのクエリとかがあってさ すごいわと思って見てるんだけど
そのやっぱ限られた可視化方法の中でしかできてないから アナリストのルーキーみたいなところから
そのシニアアナリストとかみたいな呼ばれるところの ステップを超えれる人がやっぱ少ないみたいなイメージ
使えるツールが限られているから見せ方とかの限界があるみたいな話 そうそうそう
でなんかシニアとかになってくるとちょっとこう機械学習側のとかなんかあんまみんな知らないけどよく使われてるアルゴリズムとか
なんかそういうのを組み合わせてなんか話ができる人とかが 一般的なデータアナリストデータサイエンティストとかっていうのだと
まあなんか評価が高いじゃん けどやっぱシニアってなってくるとちょっと少ないみたいな
15:06
のもっと縮小版みたいな感じだからやっぱ 深い分析結果っていうのが調べると出てくるけど一般的ではないみたいな
なるほどデータの深掘りに限界があるって感じなんですかねその まあそうだねプラットフォーム依存しているとそうですよね
例えば なんかこうユーザーのセグメントを分けながらどんどん深く
カテゴリーと組み合わせてこういうユーザーがこういう結果が得られますよねみたいなところを 細かく見ていくのができないというか
そうだねあくまで全体感しか捉えられないみたいな 統計処理とかもやっぱちょっとむずいじゃんクエリじゃそうね
っていう感じのがあるから まあ
こっからまだまだ伸びそうだしその初歩の部分はマジでハードル下がってるから今が 狙い時というか参入しがしやすさはありそう
なんか面白いなぁでもなんかその差が実感できるからこそ面白いなって思っちゃうね そうだねぇ
そこら辺で仕事って増えてくるんですかね それむずくて
その注目度は一時期よりは下がってるじゃん web 3っていう業界全体に対してなんだか最近はちょっと
話題も出てこないですよね新しい話題というか でもこれってあの一時期の ai とかと一緒でさ
いわゆるなんかめっちゃ話題になってなんでも ai みたいになった後のいわゆる死の谷みたいなさ
になって表面にふわふわ浮いてた奴らがいなくなってその地に足ついて ちゃんと
世の中に実装していくっていうのをゴリゴリやってる人たちが今いるみたいな イメージなわけよもうなんか
nft を発行したら儲かる時代が終わった
ありましたね ってなっててって考えるとなんか一般的な事業の繊維みたいな考えると
さて事業の基盤ができるみたいなでそっから 改善していくためのいろんな意思決定をするために
最初はセンスでカバーする部分もあるけどだんだん定量的にカバーしなきゃいけ なく
なってくる ってなってきた時ぐらいじゃデータアナリストとかが必要になってくるます
そうねここのデータどうなってるんだっけみたいなところちゃんと把握しておき たいニーズが生まれるっていうことですよね
ビジネス活用する場合に あとは
かもう最初からデータサイエンスで最終的に なんか裏でこういう
ai のモデルとか交渉なことをしようと思ってるからって言ってデータサイエンティスト が起業しているパターンと
まあ大きく2パターン あるとしたらやっぱアナリストのデータ分析の需要が出てくるので
18:01
中期ぐらいの時というか事業の成長の中であったと まあ初期には必要ないパターンが多いですよね
そうそうそう まあなんかあのこの間のさデータ基盤の話じゃないけどさ
ブロックチェーンの 上にどんなログを落とすかみたいなのもまあ大事っちゃ大事だし
なんか今だとオンチェーンとオフチェーンに分けて データ管理するとかっていう方法もあるんだって
まあ別に多分前からあったと思うんだけど そうするとそのどんなデータを保持しとくとか
ブロックチェーン上にはまあこれだけは残るけどユーザーのちゃんとした なんかプライベート情報とかは自分たちで管理しておいて
で最終的にこういうキャンペーンとかもできるしみたいな なんかこう基盤の設計とかをしておいてサービス展開するとかだったらいるんだよ
もう今の時点で多分必要なのか なるほどね
まあだからまだ準備段階なんだろうね そのデータ分析する人がそこに食い込んでいくには
で多分結構な ご奉仕活動というか
あの リテラシースタックをしていく
活動をしてた人たちが でブロックチェーン分析第一人者みたいになる
みたいなイメージだったな じゃまだチャンスはある
チャンスはあるね その間言われてる会社のそのブロックチェーンのやつサービス展開してる人に
2年前のあのメディアのところから激烈にずっとやってたら多分今 世界のトップクラスのアナリストになってると思いますよね
頑張れなかったなぁ 頑張れなかったよね
頑張れなかったけど今からでも遅くないし そのなんか勉強し始める時の資金の低さが生成AIでだいぶ下がってるんだったら
なんか今から結構爆速的に 成長しようと思ったらできそうですね
いやできると思う なかなか面白い世界になってきたよっていうこの生成AIが生まれたからこそ
この2年で時代がガラッと変わってきたなっていう話だね いやー生成AIマジありがたいっすね
いやすごい正直一番実感したかも 俺は
音チェーン分析をどうやるかというところで 音チェーン分析と
そうねあとやっぱコーディングのところで生成AIは異常に 役に立つことを実感してるから
分かるなぁそのなんか専門性に特化したツールとか を一から触るってなった時の生成AIのありがたみめっちゃ自分を実感してて
全然音チェーン分析と違うんですけど最近 強化学習を組み込んだサービス展開というかを考えているのがあって
21:07
強化学習って環境に対してどういう状態が返ってくるかみたいな 常にこうアクションをして環境が変わってそれによって
良い方に行ったか悪い方に行ったかっていうことを繰り返しながら学習していくんで 実環境でその状況を作れないからシミュレーションをすることが一般的なんですよね
だった時にシミュレーションのツールって結構世に無限にあるんだけど それって専門家がちゃんと入らないと使えないものが多くて
でその時にゼロからシミュレーションツールを勉強するんじゃなくて もう生成AIを専門家として置いてこれどうすればいいんだっけっていうのを聞きながら
使い方を教えてもらうっていう そんな関係でやると全然初心者でもできるみたいな
エージェントシミュレーションとかをやろうとしてる感じ そうですね
ちょっと俺もやりたいんだよね だからねめちゃめちゃありがたいし助かっているから
それに近いなと思いましたよね すごいよマジで
っていうのでねまぁちょっとだからそれをベースにね やってる分析とかを育休前にがっつりやってこれ論文にしよっか
みたいな言ってたんだけど ちょっと育休で止まりまして
今ちょっとストップしてる どうしたもんかって感じ
そのさっき言ってたプラットフォームの分析を 論文としてまとめるっていう感じを考えてるんですか
そうそうそうツイッターとかのAPI使ってなんかこう 例えば選挙とかのエコーチャンバー効果がみたいな
なんか選挙の陰謀論みたいな分析とかさ 論文ってやっぱ結構出てるのよ
そうなんだ 印象操作の論文とかっていうのがそのデータ上で見るとみんななんかさもう
タイムラインて自分の世界として一つの世界として認識してるけど そのタイムラインって本当プラットフォーム全体の
一部も一部 自分に特化したものだけど世界はめちゃめちゃ広いわけじゃんけどその
自分が興味ある気になる情報と似た人が発信する情報だけがタイムラインに集約するから 錯覚を起こすっていう状態になりやすいんだよね
ありえそう 世の中最近の何度も なんかその話したかったんだ そういうのがあるからそういう論文
になるみたいな みんなが実感してる現象と実際のデータだとこういう状態になってるよ みたいな差分というか
っていうのをちょっと出そうとしてたりする なるほどね 全体で見るといやいやみたいな
24:01
めっちゃ一部でしか君見てないっすよっていうのが言えるってことなんだ とかなんか流行ってるって言ってるけど実際こんなよみたいな
とかね あれとかすごかったよあれ都知事選
はいはい俺はまあ東京都民じゃないからあれだけど 神奈川に住んでるから都民の人たちはやっぱいっぱいいるわけじゃん周りに
ってなった時に 多分ねたっちゃんのタイムラインと俺のタイムライン
だけ見てる人は 庵野たかひろが当選するように見えそう
たしかに庵野さんめっちゃ出てたねー あれがまさに
まさにです いや確かにそれわかるわ あの人だって結局
何位だ?5位になった? 5位とか4位とか
5位かな タボ神さんの後ぐらいかな そうけど俺らの周りには
AIとかデータ分析とかエンジニアとかの人ばっかりしかいないわけよ であの人は公約をGitHubにあげて
でAIでよくするとか言ってオードリーターン出してきてデジタル超云々とかの話をして ここらへんの人たちの心をがっちりつかみにいってたわけね
けど世の中では別にそんなに得票数がないみたいな 全体の一桁パーセントですよね絶対
うん多分 そのぐらいだと思うな あのねそういう研究やってる人とかもツイッターで言ってたんだけど
某候補のエコジャンバー効果がすごいらしいみたいな そうだわ人によってはもうユリコで埋め尽くされてるパターンもあるだろうし
蓮舫さんもあるだろうし すごいだろうな あとあれね 石丸さんね 石丸さんのタイムラインの埋め方エグいと思うよ
youtubeとかが石丸さんに埋め尽くされて投票した人はいっぱいあると思う ガーシーと同じパターンだね そうだね
もうmemeみたいになっちゃってたしね そうそうそうそうであれは
どこまでが戦略でどこまでが偶発的なものなのかは定かではないんだけど まあ多分裏にちゃんとそういうの考えてる人がいて
アメリカの大統領選とかはそれでトランプが最後めっちゃまくったみたいな論文とか出てる SNSのある意味使い方としては
正しいと言えば正しいのかもしれないですね memeをどう作っていくかっていう
プロパガンダみたいなそういう思想の 思想をどう伝播していくかみたいな感じだから
そういうのを結構 アメリカの大統領選終わったらすぐそういう論文が出るとか
結構あるから なんかそういうのに近い
こういう一部のクラスターがこういう動きをしてるからみたいな そういう論文を書こうと思って
で都知事選でやってほしいですけど絶対に多分すぐ出るよ 出るんですかねなんか今回その石丸さんが sns を使って得票数を
27:05
稼いだというところでインフルエンサー的なムーブが政治家で政治でもできるって ことを証明したという評価が一定数ある
ってことをしたんで そうねいや多分やってたんじゃないかなんか
東大の鳥海さんっていう 確か鳥海さんであってるあってるあってる
俺がこれなんかエコーチャンバー的なのやべえなってるなって思ったぐらいでツイッター ですげーそういうの言い始めてて
でなんか api とか触りながら そんな話を
なんかまとめられそうみたいな話をしてた気がするから そのうちでんじゃないかなと思って
論文としてその世界的に注目があるかで言うとなんかもだんだん際どいかもしれ まあ確かに東京の都知事選がちっちゃいね世界ではあるよね
ていうので何の話があそういう論文をまあ web 3上のプラットフォームでもはい起きてそう
みたいなもうねちょっと 分析してるんでまあいい感じに出揃ったらここでも話そうかね
はい 楽しみにしてますっていう感じでございます
はいじゃあ次回次回ですね次回ちょっと 生成 ai やっぱいいよねっていう続きというかはい
あの結構前に本書いてるって話したじゃん ジャット gpt の api の教科書を作りますみたいな
あれの進捗というか全然話してなかったから話そうかなっていう 生成 ai 続きですね
生成 ai 続きまあ 気になるでしょみんなそうだねー
どんどん新しいサービスも出てきてるしね使い方も増えねそうだよねー すごいよ本当にマジで生きていけない
ai なかったら生きていけないということでまあじゃあそんな話を次回はします はーい隣のデータ分析屋さん今回も面白いと思ったらフォローレビューよろしくお願いします
番組の感想や質問はハッシュタグ隣の分析や隣のが平仮名で分析やは漢字でお願いします また概要欄に貼ってあるお手紙フォームからコメントを寄せください
ではまたばいばーい
29:21

コメント

スクロール