1. となりのデータ分析屋さん
  2. 2. データサイエンティストの..
2023-04-05 38:55

2. データサイエンティストの登竜門Kaggleって何?衛星データの大会やメルカリの大会も開催

「21世紀、最もセクシーな仕事」というレッテルを持つ最大級にダサい職業「データサイエンティスト」。データサイエンティストにとっての登竜門であるデータコンペティションが開催される「Kaggle」を、入賞経験を持つたっちゃんが教えてくれます。


番組の感想や、質問はTwitterハッシュタグ「#となりの分析屋さん」もしくは、以下からお寄せください!

https://forms.gle/wXw9W9v8DouaHR7q7


りょっち

Spotify独占配信Podcast「佐々木亮の宇宙ばなし」はこちら!

Twitter (@_ryo_sasaki)

Instagram(@ryo_astro


たっちゃん

Twitter(tatsuki_2022⁠


web3 x データサイエンスメディア「Fungible Analyst」はこちら!

00:02
はい、ということで今回のテーマは、人工衛星のデータを使って人の家を覗くっていう話をしています。
何言ってんすか? 人工衛星データを使って、Kaggleっていうデータサイエンティストのコンペに勝っていくみたいな。
データサイエンティストがめちゃめちゃ受けるコンペティション、大会、データサイエンスの大会についてどんなメリットがあるのかとか、
あとは何をすればどれだけの価値があるのかみたいなのを、経験者のたっちゃんにいろいろ語ってもらおうかなという、そういう回になってるんで、ぜひ最後まで楽しんでください。
隣のデータ分析屋さん。 この番組は隣の席に知らないことを気軽に聞けるデータ分析屋さんがいたらいいなぁ
を叶えるポッドキャストチャンネルです。 データアナリストのりょっちです。 データサイエンティストのたっちゃんです。
今日はデータサイエンティストがもう絶対というか、必ずやってると言ってもいいぐらいの、Kaggle、データコンペティション、Kaggleについて
ちょっとたっちゃんにいろいろ教えてもらおうかなという回になってますけど。 ちなみに
Kaggleってなんすか? Kaggleはデータ分析プラットフォームって言われていて、よく知られているのはデータ分析のコンペティションが開かれる。
大会ってことだよね。 大会。世界中の人が参加できる、無料で参加できるプラットフォーム。
っていうのが一番有名なところかなと思いますね。 Kaggleね。 僕自身もKaggleには参加してたし。やったことないんだよね、俺Kaggle。
あーそうなんですね。 じゃあKaggle自体、Kaggleがそもそもデータ分析の大会?
データサイエンスのAIとかそういうのの性能の大会? そう、Kaggleで開かれるコンペが、いわゆるデータを元に
なんかある精度を上げましょうみたいな、そういうお題があって そこの精度が一番高かった人が優勝っていうのがあるんだけど
例えば? 例えば、結構日本で開かれた大会で有名なのが、2018年かな、メルカリが開催したコンペっていうのがあって
メルカリって出品者と買い手がいると思うんだけど、出品したことあります? メルカリ俺あんま使わない。
データサイエンティストなんかすげーメルカリ転職するよね。 結構データ分析にも力を入れてる会社だと思うんだけど、その会社が開催したコンペが
その メルカリで出品されている商品の画像と、あとはそこの説明文と
あとそこのなんか商品の品質とかを元に、その商品の価格を予測するっていうコンペ、そういうお題
その説明文タイトルと出品物で、 その商品の価格をAIで決めると。
03:06
AIで決めるっていうお題があって、 今まで出品されている何百何千何万のデータをもとに、その価格をちゃんと正確に
当てれる 分析者が
優勝するっていう、そういう一つの大会が昔開催されたんだけど それって正解あんの?
なんかイメージ的には 確かになんとなくこうみんな同じぐらいの値段で出すけど
ちょっと吹っかけるやつとかもいるじゃん。 吹っかけた上で
聞いた話ね、メルカリあんま使わないからわかんないんだけど メルカリで買おうとしたらだいたいなんか
500円とか1000円とか値引くじゃん。 値引きますね。普通に売られている商品よりかはちょっと安く値引いて出品するって
そういうことですよね。 はいはいはいはい。でなんかその
すげー詩意的なデータが入ってんじゃないかなって思ってるよね。 外れ値的な、なんか相場は1000円だけど
言っちゃえばオークションみたいなもんじゃん。 確かにそうですね。だから、いや俺は2000円で売るけどねみたいな。
なんならその2000円の値段がつく可能性もあるじゃん。 いや間違いない間違いない。自分もしたことありますよ。昔大学で使ってた教科書とかを
いやもう捨てなくて、捨てるよりかはまあ消費性、そのものの品質もいいから出そうかなって言って そういうの好きだよね。意外と小銭稼ぎしてますね。めっちゃ好きだよね。覚えてるもんなんか
あのレシート登録してお金もらえるやつめっちゃやってたよね。 あーやってましたやってました一時期。なんかまあ2、3年くらい前そういうサービスめちゃめちゃあって
あったあった。でそれで小銭稼げるからいいかなみたいな。 100円200ちょろにちょろにおるみたいな。そういうのマジでやんないんだよなぁ
すげーよくやるなーと思っていつも見てたわ。 いやでもそう、メルカリも似たようなところで、その今ってメルカリってその商品の画像を
撮るだけで、その商品って大体いくらくらいってもう出てくるんですよ。 へー
だから例えばなんだろうなここにある 充電器でもいいや充電器の写真撮ったらそれがアップル製の充電器で
で参考価格いくらみたいな。 あー知ってるそれ。そう今ってそのレベルまで到達してるんですよ。
じゃあそれがある前ってことだ。そうそうそう。でそのコンペで得た知識だったり
いわゆるメルカリが獲得した分析技術っていうのはそのカグルの情報をもとにいろいろ 内部で改良されて今はそういう画像からも参考価格を提示できるぐらいまで
はいはいはいそういうなんだろうな仕組みを作れるっていうのが一つ コンペを開催する側のモチベーションにもなるんだけど。そういうことだ
そうそうそう。でそのコンペ開催して じゃあ逆に言うとあれなんだこうめっちゃちゃんとしたコンペ開催してデータも提供して
06:02
で企業側が開催しますでそこにめちゃめちゃ優秀な奴らががーって集まってきて なんかモデルをバーって作ったらそれを何企業側が使っていいみたいな契約になってる
それはもう参加する時の契約に書かれてて だから常時いろんなコンペが開催されてて
それがじゃあカグル側のそのなんだ カグル室内側のメリットってそういうのがあるんだ
いやそうなんですだからそれでプラッグデータ分析プラットフォームって言われてて プラットフォームっていろんなこうなんだろうな
関係者がこぞってそのプラットフォームを使うっていうのがあるんだけど 開催する側の企業っていうのはそういう世界中の
いわゆる優秀なデータ分析者が集まるわけだからその人たちが持っている技術を ただで
獲得できる 自分の会社の技術に生かせるみたいなメリットがあるのが
なるほどねそれでじゃあウィンウィンのわけだ プラットフォームを介してお金は発生しないけど
室内側は そのデータとか分析結果を使えるっていうメリットがあって
それを提供した側にもこう なんだ名誉みたいなのがあるみたいな
そうなんですよ そういうことね 常に10個くらいのコンペが出ている状態でなくなることもなく
これ2010年ぐらいからカグルってもうサービスとして始めてるんだけど そうだね
もう今も2023年になってもずっと続いてる そういうことか えっと一周してんだ
一周してますね なんかあれはね読んだことあんのよ
カグル本 あのオーライリーから出てるやつかな
はい あれ何色のやつだろう 赤のやつ
赤のやつ あっ結構最近出たやつかな なんかカグル本って言われると白の表紙で
水色の文字で書いてる カグルで勝つためのデータ分析みたいなのが結構
知られていて 読んだ 自分はもう家にありますね それ読むと勝てんの あれね
なんかあれで聞いたよ 白金工業FMっていうのさ ブレインパッドのさ
会社でやってるポッドキャストあれめっちゃ好きなんだけど 僕も好きですよ あれで言ってた
吉田さんが言ってた カグル本みんながとにかく買う 2017年とかに発売したやつを
とにかくデータサイエンティストはまず買うって 買いますね 買うんだ 買います買います
それをマナーみたいな そのカグルをやるためのマナーとして
でも そうマナーというか基本的なデータ分析の色派みたいなところが
そういう方にはまとまっているんで そこで学ぶっていうのもありますし
実際にカグルでやった技術って業務に活かせることもあるから そこはちゃんと学んでおきたいなっていう
09:03
カグル本買って これ良かったな みたいなのあるの?
あー 結構ありますよ 多分データサイエンティストがやる仕事って
カグルのさっき言ったメルカリの金額を予測するって話したと思うんですけど
それに近いことも仕事でやってて 自分だったら 会社のあるサービスの解約する人を当てるみたいな
どのユーザーが解約するかみたいな
普通に実務でやったことあるわ
結構ありますよね
あるあるある
そうそうそうっていうところを予測するときに 結局一人一人のユーザーの情報
年齢だったりどこに住んでるとか そのユーザーがどういうサービス使ってるみたいな
いろんな情報もとに解約する人を見つけるんですけど そこのデータの扱い方
こういうふうに 簡単な話 男と女っていう情報をどう機械で扱うかとか
すごい簡単な話だけど それのやり方もいくつかパターンがあって
単純に男を1にして女を0にするとか
ワンホットエンコーディングですね
さすがにデータサイエンティストですから 私も
っていうやり方もあるし
でもその1と0つけちゃったときに 機械は代償関係を考えちゃって
1の方が大きい値 0の方が小さい値っていうふうに 扱っちゃう可能性もあるんで
シンプルに1、0にするのも良くないよねっていう 思想があったり
じゃあそういうときはどうするかっていう やり方とかも書いてるんですよ
確かにあんまりオルスちゃんと勉強したことない
なくはないけど お作法みたいなのが書いてあるってことですよね
こうやったら精度上がるよねとか
もうあれ?だからAIのスコアを競うわけじゃん
予測性のマックスで100%もう何でも予測できます みたいなモデルがあったとしたら
それに対して大体9割とか8割とかっていう 精度が出てる中で
もう1%とかを競うそういう話なんでしょ
そう1%0.0何%とかっていうところに 100人200人がもうジャってなってて
そんな受けてるの?
コンペによっても参加者って結構まちまちなんだけど
さっき言ったメルカリのコンペは 3000人くらい参加してる
ヤバ それでも大成功の例の一つでしょ
どっちかっていうと
日本では結構有名で上手くいった例なのかなと思いますね
結構炎上コンペとかもあって
炎上コンペ?何それ何それ
それはどっちの炎上?
そもそもお題がクソなパターンと
クソとか言っていいのかな
クソなパターンとあとはなんだろうな
データ自体がそもそもあんま信憑性のない
やってもしょうがないデータっていう意味の炎上と
12:04
やりがい搾取的な部分と
そもそも出題者のリテラシーが低いみたいな
たぶん2つパターンぐらいあるじゃん
ありますね
その炎上するパターンって何その炎上
血もあるんだけど
なんかコンペって2ヶ月3ヶ月とかの期間で
開催されてて
でよくある炎上コンペは主催者側の
リテラシー不足が多いのかなと自分は思ってるんだけど
途中でデータにミスがあったのが発覚して
それが途中で切り替わるとか
結局世界中の優秀なデータサインティストが
集まるわけだから
データを本当にデータの端まで
いろいろ調べるんですよ
そうなってきたときに
意図しないデータが含まれてたり
おかしな値が入ってたり
そういうことか
なるほどね
見つかったりいろいろあるんですよ
そんなんあんだ
どこ海外で炎上してんのそれって
データサインティストはツイッターが大好きなのかなと思ってて
いるね
ツイッターで大割れするなーっていうのは
自分の観測情報だけど
思ってますね
じゃあ逆に言うとあれなんだね
出題する企業が割とリスキーっちゃリスキーで
ちゃんと整形された綺麗なデータを
渡せなかった時には
一気に猛烈な反発がやってくるね
猛烈な反発がやってきますよ
しかもデータサインティストとかを取ろうとするって
データサインティストって全然取れないわけじゃん採用
市場で
市場的に
多分需要に対して全然データサインティストいない
みたいな状況って
結構簡単に予想がつく
だからそうなってくると
めちゃめちゃ
逆の広告効果が効いて
マイナスプロモーションになっちゃって
もうその会社にデータサインティスト近寄らん
みたいなことにもなりかねないよね
ここの会社ってデータのリテラシーないから
ってことがバレちゃうと思うんですよね
いやーあると思いますよ
そういうのに燃える人とかいんのかな逆に
いないか
どうなんだろ
逆境最高みたいな
いやでもかぐるくそコンペオブザイヤーとか言って並べてる
Twitterユースとか見たりしますよね
性格悪いね本当に
でもそれぐらい
人気のある
Twitterでも炎上するぐらい
参加者も多いし
結構日本人でやってる人も多いのかな
みんなやってるイメージは
確かにあるわ
ありますね
自分も参加してて結構日本人多いなって最近思うんですけど
あれってさ本当に世界で流行ってんの
いやーどこなんだ
日本と中国は結構いるっていうのは聞くんだけど
アメリカインドも多いかなっていうのは感じます
アメリカもいるんだ
15:00
そもそもあれだよね
かぐるって2010年とかにできて
途中でGoogleに買収されてるわけじゃん
すぐ
すぐなんだ
かぐるがかぐる社があって
すぐGoogleがそこ買収して
そうGoogleの参加で今かぐるが
じゃあ日本で流行ったのが2015年とか2016年とか
ってなってくると
それもう日本で流行った時には
あくまでGoogleの手がついたサービスみたいな状態になって
国内で流行ってるみたいな状態だ
うんうんそうですそうです
だからGoogleが主催するコンペも結構あって
自分も参加したことあるんですよ
Googleのですね
GoogleってAndroidあるじゃないですか
スマートフォンの位置の測位精度を上げようみたいな
コンペがあって
GPS
GPSのデータを使うコンペだったんですけど
なんか車にずっとスマートフォン置いて
アメリカのある州をぐるぐる走って
でそこで得られた位置情報を元に
元々ちゃんと走った正しい道を
GPSの情報が捉えられてるかどうかみたいな
そこの誤差
どれくらいずれたかっていうところの誤差を
限りなく小さくしようっていうデータの分析
あのあれ
じゃあ古いカーナビ使ってたら
わけわかんない畑のど真ん中バーっと走ってるとか
海の真ん中バーっと走ってるのは
あれは誤差MAXの状態
誤差MAXの状態そう
じゃなくて
でももうGoogleがやってるAndroidのスマホだし
ある程度精度は出てるけど
そうそうそう
例えば国道1号線バーって走ってるけど
なんかこうちょっと
市街地を通ってるような
家の上を通った雰囲気の
ログも出てきちゃう可能性があって
そうなんですよ
それを
それをどうする
コンペ上は元々にあった地図と
地図に対して
自動的に補正をかけるみたいなことをする
そうそうそうそう
元々地図上のその位置って
決まってるんでそれを正解と見立てて
あるタイミングで
正しい位置に入れるかどうか
GPSの信号があるかどうかっていうところを
の距離の誤差を
測るんですけど
そこの誤差が限りなくゼロになるように
はあ
もうその道を完全に通ったと言えるような
データを
なんかじゃあAIとは違うのそれは
でも
AIそれはどうやって使うかってところが
ポイントだったりするんですけど
かぐるのコンペって
AIの能力を競い合う
はいはい
大会だと俺勝手に思ってた
ああ
そういうわけではない
そのイメージあるんですけど
本質は
社会課題じゃないですか
っていうところに対して
どういうアプローチで
AIを使えるか
データをうまく活用して
精度を上げられるかっていうところがあって
その
Googleのスマートフォンの話は
18:02
GPSなんで衛星が取得してるデータを使って
その衛星のデータをもとに
正しい位置の
即位ができるかっていう話なんで
はいはい
衛星データをどう扱うか
なんか
そんな
そのレベルから始まるんですよ
宇宙規模まで広がっていく
そうですそうです
だからソフトウェアの研究してる人は
すごい詳しかったりするんで
そこの
衛星データを扱えるように
データの処理をしたりとか
あとはその
処理されたデータを使って
AI使っても
じゃあ何をなんだろうな
どうやってそのAIに入れなきゃいけないか
っていうところも
工夫しなきゃいけないんで
イメージ的にはなんかこう
何か情報をもらって
明日こうなってますみたいなのとか
ちょっと先の未来を
予測するのがAIみたいな
感じのこう
イメージを持ってるから
そうするとなんか
あんまり使い方がピンとこない
そうなんですよね
まあ
僕のやり方としては
昔のコンペだったので
全然言えるんですけど
言えないやつもあるのか
業務に挟まってたりして
業務に挟まってたらもう言えないですし
Kaguruの開催期間中は
他の人に話したらダメなんですよ
チームメンバー以外は
何する何する
なんで
なんか
手品義務的な
手品義務というか
Kaguruのルールになってて
そう
プライベートシェアって言ってて
そのルールが
Kaguruの開催期間中は
自分のやってるやり方とかを
言えるのは
Kaguruのその参加者の中の
ディスカッションの中でしか
喋っちゃダメで
SNSでこんな開放思いついたんで
使ってみましたとか
ダメなの
ダメ
ルール違反なんですよ
みんなツイッター好きなのに
みんなツイッター好きなのに
言えないよ
まあそうそうそう
そんなルールあるんだ
そうなんですよ
なんで
まあもう
昔のコンペだから言えるんですけど
その衛星の
僕は衛星のデータを使って
なんかこう
マッピングしてあげるというか
うん
引いてあげて
そしたら正解のデータと
その
簡単にデータから得られる
何だろう
位置の情報
はいはい
なんかこの誤差っていうところ
うん
誤差を
予測するような
AIを作ってあげるみたいな
ああ
やり方を
することで
じゃあ誤差が分かったんで
後からその
得られた
AIが予測した誤差を
引いてあげれば
正解に近づけられるような
みたいなアプローチをするっていう
はいはいはい
なんかまあ
そういうなんか工夫
そういう
どうAI
どこにAIを使うかっていうところ が
結構ポイントになってくるんで
うん
じゃあ違う別の
全く別のチームは
全然違う解法を使ってるパターン もある
ありますあります
何ならもう
AI使わずに
その衛星データの解析が
めちゃめちゃ上手い人は
うん
最初から衛星データを使って
なんかこう
本当に研究者しか知らないような
技術とかツールを使って
ああ
もうほぼビタビタに
数センチの誤差で
予測できたみたいな人が
このコンペは1位だったんですけど
あそう
じゃあ負けたんだ
完全に負けましたね
21:00
まあでもあるね
そう
そう宇宙バックグラウンドじゃん
俺ら
ああそうですね
しかももう
それをもう
それしかやんなかった
やんないで
ドクターまで行ってるわけじゃん
はいはいはい
ってなると
確かになんか
その業界の人しか知らない
衛星データの使い方とか
解析こうしたらが一番いいみたい な
なんか
ドメイン知識というか
もうそこだけで
差別化ができるみたいな
のもきっとあるじゃん
だからそれに負けたってことでしょ
完全に負けましたね
無理でしょそんなの
いやまあでも
googleとしては嬉しいんですよ
そういう情報が手に入るから
まあそういうことね
まあまあまあ
仕方ない
だからお前らには名声を与えた から
お前らの知識は
俺らのもんだみたいな
俺らの知識
そうそう
ああ
ちなみに
はいはい
そんないる
衛星データ使うってさ
こう
宇宙業界の
特に宇宙ビジネスの人とかと
ポッドキャストを介して
めちゃめちゃあったりするから
そうですよね
もう
なんかこう
データの使い方こうだよっていう
メディアがあったりとか
うん
こう
あとは
国内で使えるデータを
なるべく文科省とか
文科省だったかな
経済産業省かな
はいはい
棚からバックアップ受けて
もう
みんなに無料で使えるようにします
みたいな
テルースって
なんかありますよね
最近ニュースとかにも
よく出てくるのが
そうそうそうそう
それとかが
もう
底上げをしよう
底上げをしようとしてる
段階なわけよ
でそうすると
多分
まだ底上げの段階ってことは
全然いないわけじゃん
そうですね
それを使える人って
ってなってくると
なんかそのコンペを開催したところで
そんなに人が集まるかみたいな
あー
疑問が出てくるんだよね
はいはいはい
個人的には
ってなった時の
その参加者どんぐらいっていう
その大会
あでもこの大会は
1000人くらいかいかないぐらいだったかな
まじ
そんなにいる
それでも
さっきメルカリの話が
3000行ったって話だったんで
3分の1くらいになるんだけど
いやまあ確かにだって
メルカリのはだって画像診断と
画像診断から得られた特徴量を使って
そうだね
あの価格を予測するだから
なんとなくこう普通のAIを組めるとか
ある程度のデータサイエンスリテラシー があれば
なんとなくこうスコアは出ない にしても
想像はできるじゃん
で想像できるものだったら参加 するじゃん
うんうん
こっつきやすいから
そうそう
衛星データのコンペがあります ってなったら
まず
いやGPSのデータとか触れねえしな みたいな
しかもそこから出てくる座標のデータ って多分
俺らが知ってる統計何度とかの話 じゃないじゃん
多分
めっちゃなんか桁数
なんかもう
あーってあって
そう
緯度経度とかの話じゃなくて
そのもっと宇宙で観測した時の
座標上の位置みたいな情報になるん で
それをまず使える緯度経度に変換 するみたいな処理があったりするん
そこの知識を持ってないと分析 はできないよねっていうのがあるん
24:03
それによくもまあ1000人もいる よね
あでもそうこれかぐらの一ついい とこで
分析ができる人のノートブック って言うんだけど
データ分析者ってそのノートブック 上で分析したコードを書いて
それPythonでやるの
世界でJupyterノートブックっていう ツールを使ってPythonでコードを
書くんだけど
その出来上がったノートブック を参加者は公開したら見れるん
ですよ
なんで
他の人が触ってるやつが見れる
そうそうだからその出来上がった コードを見てこういうふうに分析
すればいいんだってところはチュートリアル 的に親切な人が教えてくれる
参加してる
えー
だからみんなでそのノートブック を見ながらこうやれば分析できる
んだっていうところで
そういう意味で取っつきやすい かなっていう
そいつが勝つんだろうね結局
まあね
結局そうでしょそいつがみんな こっちだよみたいな
で普段だったら100人しか集まらない ところを
いやこうやってやればこうやって やればってやったら
いけるかもしれないいけるかもしれない って言って1000人集まってきて
どこでドーンって勝っていや俺は 1000人に勝ったみたいなことができる
わけじゃん
いやそうねでもさっき隠れのコンペ のメダルの話したんだけど
ノートブックメダルっていうのも あって
リファレンス的な
そうそうそうそのノートブック いいなと思ったらいいなをして
そのいいねいっぱい獲得した人が ノートブック上で優秀っていう
ところでメダルがもらえたりするん ですよ
だから競争様的ないろんなこと を教えてくれる人は
そこでのメダル獲得もあるっていう 教える側にもメリットがあるっていう
仕組みがあるんで
すごいねちゃんとさすがgoogleさん
そうそうだからお互い精査たくま しながらいい情報を共有してでも
大事なところは教えないみたいな
それでじゃあデータサイエンス 業界の底上げみたいになってる
わけだ
結果的にみんなウィンウィンが 実現できてるのかなっていうふう
には思うんですけど
googleってさグランドマスターとか いるじゃん
ありますね
あれってどういうランクになってんの ちなみに周りに結構いるんだよ
グランドマスター
はいはい
でその人たちがすげーのは知ってん の
はいはい
すげーのは知ってるけどその他の ピラミッドがあるでしょ
ここの人たちにあんま合わない から
多分ここの人たちは自分が何かは 言わないですよね
あそういうことか
グランドマスターが一番上にあって その下にマスターっていうレイヤー
があってその下にエキスパート とかっていうのがあるんですよ
そういう4段階ぐらいかな初心者 のレイヤーがあってみたいな
でそのコンペで獲得したメダルの 数とかメダルの色とかによって
27:03
じゃあ金のメダル1枚とシルバー を2枚ゲットしたからじゃあ次
1個上のマスターになりますっていう ふうにルールが決まっててでゴールド
5枚だったかなその中でもチーム 参加じゃなくて1人で参加した
ときに金を取ったっていうのが 1個でもあれば一番上のグランド
マスターというレイヤーになれる みたいな
ああそういうことだじゃあこう 団体ゲーもできるし個人ゲーも
できるやつじゃないとグランド マスターにはなれないし
まあそうだね
大体違うパターンもあるだろう けど
まあまあ
そういうことだし逆に言うとグランド マスター持ってるやつっていう
のはもうデータサイエンス業界 で言うとある程度何でも任せれる
みたいな
そうだね
称号になるってことだ
たまたまゴールドメダル取れた じゃなくて5回もまずトップにいる
ってわけだからこの人は確実に 力があるよねみたいなことが一つ
証明されるのかなって
そういうことか
だからまあ市場価値的にも
グランドマスター取るともう
引っ張り箱だ
結構ありますよね転職とか就職 でもカグルの結果を履歴書に書く
みたいなのは
統一区850点みたいな
ああそう思いますねこれを何だろう な日本でカグルの称号がメジャー
になったというか
うん
きっかけがDNAのカグル枠なの かなと思って
ああはいはいはいはい
そう結構そこって
あれだってカグルだけやってれば いいんでしょ
そうそう早い段階で何年前かわかんない ですけどもう多分10年弱くらい
前からカグル枠っていうのを設置 してカグルのその称号カグルだけ
は仕事でやるんですかねあれって
だと思うしあとはまあちょっと 業務手伝うみたいなの聞いたこと
あるけど
はいはいはい
っていうのをバンと打ち出した わけなんで
あれが最初だそのなんかカグル だけでお金をもらえるみたいな
だと思いますねあれが最初で
そこからカグルの認知も広がった し何か価値市場価値もあるんだ
みたいなところが日がついて日本人 の参加者ドーンって増えたのかな
って
でかい会社がまあそうだっつってる しそうだからみたいな
でもあれ僕個人的にはなんかDNA うまいなと思ってて数年10年くらい
前からそういう枠設置したこと で何かまだ10年前ってカグルが
始まってそんなに経ってない今 ほど認知も多くないタイミング
でカグルに参加してる人ってそんな に多くないと思うんですよ人数
的に
うん
多くないでだからアーリーアダプター 的に何だろうなキャッチアップ
早い
まあ確かに確かに
そうだね
情報にこう敏感な人がやってる わけだからそういう人を囲い込む
みたいなDNAのある意味なんか作戦 的な
まあ確かにね
なのかなってフリを持ってて
そいつに1000万払ってもそれよりも 何かしらのこうバックがどっか
から入ってくるみたいな
そうそうそう
そりゃそうだよ
その昔からね情報キャッチアップ してるぐらいの人は多分今後も
30:00
その人のキャリアでも伸びるだろう し実力もあるだろうしみたいな
ところで
そう
確かに
うまい施策だったのかなという フリを持ってます
確かにね
なんかドクター取って俺がドクター 取ってで利権からじゃあどこに
転職しようかなと思って職探して た時にまあその時はデータサイエンティスト
になろうと思っていろいろ探して て
その時にデータサイエンス部署 みたいなのを見た時に結構うち
グランドマスターいますみたい なのを打ち出してるのがあったん
だけどもうなんかなんとなくこう カグルのグランドマスターやばい
みたいな引っ張りだこのなるらしい みたいなの知ってたから多分
俺入ってもこの人いねえよなみたいな の思ったしでも逆に言うとそれで
めちゃめちゃ人をアトラクトできる みたいなのは確かに総合で見たら
その人をカグルのためだけに雇 ってるのは結構費用対効果は結構
でかい気がするエンジニアとか データサイエンティストとかデータ
アナリストとかもそうだけど自分 よりすごい奴いてほしいみたいな
その自分が1位のところを好まない 性質があると思っててある程度
登り詰めたらなんか明らかに 自分よりもすげえ奴がたくさん
いるところに行きがちみたいな のがこうなんとなく性格として
あると思うからそうなった時の なんか1個指標にはなるよね
いやなりますね
お前らよりすごい奴こんだけいる ぞみたいな
いますよ 僕も会社で新卒だったり内定者
の人と面談とかする機会あるんです けど質問で聞かれますもんね
カグラーいますかみたいな
カグラーそうカグラーいますか メダル何色ですかグランドマスター
ですか
あと鼻につくな
いやいや
鼻につくなそんな
でもそういうとこ気にしてるって ことはデータサイエンティスト
としての志があったりとかやっぱり 学びたいっていう気持ちが強い
のかなというふうに思いますし 一つの指標会社のレベルデータ
分析のレベルを表す一つの指標 には今なってるのかなっていう
なるほどね
そういう意味は思いますけどね
それはすごいな確かにそう考える とやっぱカグルーまだまだ今も
まだいけるまだ流行ってる
まだまだ
あんまやるつもりはないんだけど 俺的にはねけどさこうポートキャスト
聞いてる人もそうだけど例えば 人事の人とかあとはなんだろう
なまあそろそろデータ活用もう データ活用なんて当たり前にやん
なきゃいけないけどデータ人材 いないみたいなところ全然ある
ってなったときのカグルーを今 時点でもまだ目安にしていいのか
問題があるじゃんそこだよねまだ 流行ってる
流行ってるしさっきDNAのカグル ワークの話もしたけどリストっていう
会社だったりとかアライズとか もカグルーの賞金ゴールド取ったら
33:04
賞金出すみたいなそういう施策 も出てきたんで会社として一つ
カグルーを指標として持ちたい っていうムーブメントはあるから
これからもカグルーの人気は続 くしユーザー日本人のユーザー
も増えてくんじゃないかなっていう ふうには思いますね
なるほどねちょっとじゃあ今度 グランドマスター呼びます
聞いてみたいっすねいますいます 本当ですか
呼びましょう楽しみですね
グランドマスター呼びましょう あの人がすごいのも知ってるし
特に実務上もすごいのも実感 してるからグランドマスターが
すげーのは自分の中で頭にある けどカグルー自体に俺があんまり
興味を持ったことがなくて多分 知らないんでしょ聞いてる人も
知らない人多いと思うんだよね だから逆に言うとデータサイエンティスト
採用したいってなったときの一 つの指標として同性分系のビジネス
職取るときもTOEICの点数見るでしょ みたいな感じでメダル何個かちょっと
お作法的に聞いてみるのもどうす かみたいなことだよね
そうですね そうすると転職もいけんのか
ブランド力があるから転職もできる し就職も余裕だしみたいな学生
でもいけるもんなのかね
結構学生がもう最近は多いなっていう ふうに思いますね
時間あるから
いや時間もあるし結果も結構出して るんですよ
学生限定のコンペティションとか もうカグルじゃないけど国内の
いくつかのコンペティションがあって そこで結果出してる学生がカグル
にもいたなこのアイコンの人みたいな そういるんで結構学生でも頑張ってる
人いるし優秀な人多いなっていう のは思いますね
怖いな
これからどんどん
怖くないそんなの
若手が突き上げてくる時代が来るん じゃないですか
じゃあ逆に言うとコンピューター サイエンスの学部からカグルで
実績つけてデータサイエンティスト になりますみたいなのも道として
はあるじゃん今普通にビジネス職 やってますみたいな人もデータ
分析カグル本読みますユーデミー とかでパイソンとかいろいろや
った上でカグルの実績つけとけ ばデータサイエンティストとして
の転職も割といけるよみたいな 感じだな
採用の時に履歴書に書けるって 言ったくらいデータ分析の界隈
では一つ指標になってるんで
確かに結果出していくといいと思う
前データサイエンスのデータサイエンティスト として入った時の同期のやつも
ブロンズ取ったとかそれがどん ぐらいすごいか俺にはよく分か
ってないんだけど何となくメダル 取れるのがするブロンズってこと
同メダル
そうだよね
3位なのか
参加者の上位10%
偏差的な
参加者全体の上位5%がブロンズ かなって3%がシルバー1%がゴールド
36:03
みたいなパーセンテージで決ま ってるんすよ
そうなんだじゃあ1000人参加者 いたら10人ゴールドメダルがいる
みたいな感じ
そういうことだねここのパーセンテージ 確実じゃないかもしれないけど
ググってもらって
そうそういう感じなんだ
1人2人じゃなくてブロンズは幅 がある
でもすごいよね
そうだねすごいでもうちの会社 はその人のレベルにもよるんだけど
僕は今シルバー取んないと何も メリットがない
取ったことあんの
シルバーは1回だけありますね
さすがや
いやいやいやまだまだぺいぺい ですけど
まだやってんのカグル
カグルはでもこの前も出てました ね
そうでもカグルは時間を失うん ですよ時間と体力を犠牲にしない
となかなか勝てないし
そうなんだ
健康に悪い
健康に悪い
そうかじゃあ普通のデートサイエン ティストは業務をやった上でカグル
を受ける
そうそう
けどさっきのカグル枠みたいな のがある人は業務の中でカグル
ができるからそれで生活もでき てるし
そうだね
勝てるねなんかその価値が積み 上がるよね
いやまあそこに隠れる時間という のは1つ
時間大事なんだ
大事なあれだと思うんですよ
じゃあ技術持ってる学生はマジ 強いね
マジ最強ですね
そういうことね
面白い面白い面白い
いやこれはね良かった俺普通に カグルなんかうーんみたいな
今までうーんって聞いてたから
ちょっと知りましたカグルって 何かっていうところ
知れた知れた
良かった良かったよしじゃあこんな 感じかね
ちょっとじゃあまとめだけもらって いいですか
まあそんな感じでまとめていく とカグルはデータ分析のプラットフォーム
です
データを分析するユーザーとあとは そのコンペを開設する開催者
という2つのお互いウィンウィン にできるようなプラットフォーム
でしたっていうところですね
日本だとそのコンペで獲得した メダルとかが就職だったり転職
で結構役に立つ履歴書に書ける くらいの称号っていう風に今は
なってきていてこれからもカグル の人気がずっと続くのかなと思います
なるほどねじゃあこう聞いてる 人はカグルからデータサイエンス
の入り口入るっていうのが一つ 手だよねっていうことだね
そうだねまさにやってみるっていう のがいいのかなと思います
じゃあそんな感じで今日のお話は 以上ということで隣のデータ分析
屋さん今回も面白いなと思ったら フォローレビューよろしくお願いいたします
番組の感想や質問はハッシュタグ 隣の分析屋隣のがひらがなで分析屋
が漢字でお願いしますまたは感想 とかは概要欄に貼ってあるお手紙
フォームからもお寄せいただけ ますのでじゃんじゃんいただけ
たら嬉しいですそれではまたお会い しましょうさよなら
バイバイ
38:55

コメント

スクロール