1. となりのデータ分析屋さん
  2. 29. メンタル崩壊?成果を残せ..
2023-09-13 34:41

29. メンタル崩壊?成果を残せない新米データサイエンティストの悩み

Amazon Musicで科学系Podcastを8エピソード聞くと300Amazonポイントもらえます!!この番組の過去エピソードも対象です!

https://music.amazon.co.jp/podcasts/pages/stampcard?refMarker=null


番組の感想や、質問はTwitterハッシュタグ「#となりの分析屋」もしくは、以下おたよりフォームからお寄せください!

⁠⁠⁠⁠https://forms.gle/K81TcsyiP5Dpk8fz7⁠⁠⁠⁠


りょっち

Spotify独占配信Podcast「⁠⁠⁠⁠⁠佐々木亮の宇宙ばなし⁠⁠⁠⁠⁠」はこちら!

Twitter (⁠⁠⁠⁠⁠@_ryo_sasaki⁠⁠⁠⁠⁠)

Instagram(⁠⁠⁠⁠⁠@ryo_astro⁠⁠⁠⁠⁠


たっちゃん

Twitter(⁠⁠⁠⁠⁠tatsuki_2022⁠⁠⁠⁠⁠⁠


web3 x データサイエンスメディア「⁠⁠⁠⁠⁠⁠Fungible Analyst⁠⁠⁠⁠⁠⁠」はこちら!


▼atmaCup

https://www.guruguru.science/competitions/21


▼ネットワーク科学(Albert-László Barabási 著)

https://www.kyoritsu-pub.co.jp/book/b10003149.html


▼要約 by ⁠Summary fm⁠

このエピソードでは、りょっちさんとたっちゃんさんがデータ分析の話についてアドバイスをしています。さまざまなトピックが取り上げられており、特にブロックチェーンの分析とデータセットの準備方法について話されています。また、データ分析を教える際に身につけるべきスキルや興味深いデータセットについても触れられています。これはデータ分析やデータサイエンスに興味を持つ人にとって役立つ情報が詰まったエピソードです。ぜひ聴いてみてください。


サマリー

新卒データアナリストは、資産を出す力を身につける方法や、問いを立てる力や仮説思考を鍛える方法について悩んでいます。アドバイスは、まず可視化を先にするのではなく、目的に合わせて軸を決めてから分析を行うこと、そして壁打ちして上司との合意を得てから作業に取り組むことです。このエピソードでは、新米データサイエンティストの悩みについて考えられており、データセットの選び方やデータ解析の興味深さについても話し合われました。また、新米データサイエンティストが成果を残せない悩みを抱える中、アートマカップというデータ分析コンペに参加し、興味深いデータセットを扱う経験をしました。

00:03
何の成果も、得られませんでしたぁー!
な回です、今日は。
あ、はい。
はい。悩んでるんだって。
うちのあれが。
うちのあれがあれで?
うちのあれがあれで。
うちのコワーカー調査兵団が、仕事で何の成果も得られなくて困ってるんだって。
そんなやつはやめちまえ。
ああ、そんなこと言わないで!
ちょっと。
じゃなくてね。
新卒データアナリストからね、質問来てくれるなんてめっちゃいいじゃない。
しかもね、たっちゃんめちゃめちゃ同じ悩み抱えてたっていうね。
そうっすよ、ほんとに。
やめちまえとか言ったくせに。
優しく手を差し伸べましたから、聞いてほしいっす。
しかもなんか、過去のエピソードも色々感想届いてて、お悩み相談結構あるね。
ありましたね。
しかもね、わかってるね。
バリュー中毒なコワーカーさん達だからさ。
バリューのあるコメントばっかりしてくるとね。
あとちょっといじられてますよね、僕たち。
俺でしょ?
まあ、おおむねそうですね。
そんな感じで、今回はコワーカーさん達から来た質問に回答していきながら、
データ分析とは何ぞや、データサイエンスとは何ぞや、みたいな話をしていきましたので、
ぜひそちら楽しんでください。どうぞ。
隣のデータ分析屋さん。
この番組は、隣の席に知らないことを気軽に聞けるデータ分析屋さんがいたらいいなぁ、
を叶えるポッドキャストチャンネルです。
データアナリストのりょっちです。
データサイエンティストのたっちゃんです。
今回は、コワーカーたちからのお便りコーナー。
久しぶりのお便りコーナーです。
久しぶりだよね。
めっちゃ久しぶり。
たーくさん来てるからね。
ちょっと思ったけどね。
やっぱ前回のね、俺らからのガツンが大事だった。
今回はいろいろね、質問もらってるやつを答えていきながら、
割とね、なんかね、データアナリストとは何ぞや、みたいなところとかの話が多そうな気がするから、
早速いきましょうか。
はいはい。
でも、それ僕らのエピソード1、まず見てくれって話ですけどね。
確かにね。
それでも分かんなかったら仕方ない。説明不足だった。
そうね。
じゃあちょっとたっちゃんお願いしていいですか。
いけますか。
じゃあ1つ目。
コワーカーネーム、さきごんさんからです。
ありがとうございます。
さきごん。
さきごん。
はじめまして。
最近このポッドキャストを聞き始めた。
資産を出す力を身につける方法
4月から新卒でデータアナリストをしているものです。
お二人に相談です。
集計したデータから資産を出す力を身につけるにはどうしたらいいですか。
私は統計や機械学習、Python、SQLなどデータアナリストに必要であろう基礎力はあると思ってます。
学生レベルですか。
しかし社会人になって7月から案件に入りデータの集計をしているのですが、得られた結果から資産を出すところで手が止まってしまいます。
可視化してもそれはそうだよねってことやだから何ってことしか思いつきません。
毎日意味のない集計に多くの時間を費やしているようで悲しくなります。
問いを立てる力や仮説思考はどうやって鍛えていけばいいですか。
とのことです。
ありがとうございます。
新卒ですよ。
新卒データアナリスト。
すごいね。めちゃめちゃきっと優秀ですよでも。
めちゃめちゃ優秀だよね。
アナリストって採用むずいもんね。
そうっすよ。難しいことしてるんじゃないですかねきっと。
そんな感じするね。
アナリスト側ね。
しかもデータサイエンティストではなく。
そうですね。だからクイックにデータ見て、仮説立てて、結果出して、意味のある結果を上層部に言っていかなきゃいけない。そんな仕事ですよね。
なんとなくだけどコンサルっぽいよね。
あー確かに。
いやーいいじゃないいいじゃない。
どうなの?新卒あるある?
あるあるっすよ。これ同じ悩みを僕も抱えてたんで。
すごいいいじゃん。
なんか思い出しますねこの時の気持ちが。
まあ最初には初期分析的なのをだいたいお願いされてデータからグラフ作って、ちょっとこのレポート上げてみたいなタスクがあるんですけど、悩むんすよ。
どんなグラフをまず描けばいいかみたいな。
はいはいはいはい。どんなグラフ?あ、そういうことね。
そのグラフ描いてもどこに注目すればいいかとか。
うん。
なんか筋の悪い結果をリード文で作ってしまって、まあそうだよねみたいなことがあるから悲しくなりますよ。何やってんだ俺って。
じゃあめっちゃ理解できる感じじゃん。
いやーわかりますねこの気持ちは。
いいお便りだね。さきごんもよかったね。たっちゃんいて。
どうやったらこの力が身につくかっていうところは。
問いを立てる力や仮説思考を鍛える方法
うん。
もう壁打ちしまくるしかないかなと思ってて。
誰かに分析結果をぶつけるってこと?
そうそうそう。
なんか学生の時ってグラフっていつも似たようなグラフを毎回研究とかで描いてるから、なんとなく慣れでこういうグラフを描けばいいかなみたいなのってわかると思うんすけど、
たぶんその時の作ったグラフとビジネスで求められてるグラフってちょっと傾向だったり、求められてるものが違うと思ってて。
あーなるほどね。
そこの肌感を合わせるって意味でも壁打ちしてコメントもらって、その会社その仕事にマッチしたものを徐々にこう自分の身につけていくってところで、慣れていくしかないのかなっていうのがまず一つっすね。
絶対慣れだよねこれは。けどね、可視化してもそれはそうだよねっていうところが悩みって書いてるじゃん。
はいはい。だからね問題はそこだよね。可視化を先にしてしまっていることが問題だね。
間違いないな。
そう。そこな気がする。これはまあさっきの慣れっていう話もなるかもしんないけど、もう何が知りたくてその分析をするかで、分析をやる前ももうX軸Y軸すべて決めてでスタートしないと。
課題が何で、その課題を解くのに必要な数字は何でとか、この課題解決する仮説これだから、例えばめちゃめちゃお金使ってる人の傾向を見ればいいっていうのがあったら、お金使ってる人のばっかり見ればいいし、
お金使ってる人と使ってない人の差を知りたい。この使ってない人にお金を使わせたいってなったら、この2つの違いを見ればいいとかって注目して、その違い見るためには散布図がいいのか何なのかを考えて、
軸全部決めて、あとは2行2列のデータを吐き出すだけみたいな。自分の研究室とかゼミに入ってきた一個下のやつに、このデータだけ作ってくれって言ってできるぐらいまで磨いてから動くだね。もう完璧な回答だと思ってます。
分析を行う前の準備とアプローチ
これだね。このフェーズはめちゃめちゃ大事な気がする。可視化しまくってそれはそうだよねってなんないと、可視化の手数が増えないから、可視化の手数が増えないと事前に考える軸のバリエーションがなくなってなるから、悲しくならなきゃいいっていう。意味のない集計をしまくって悲しくならない。
はいはいはいはい。意味のない集計した。うえぇ、成長。意味ない。これ多分新卒だからまだ時間に猶予があって、多分上司とかから集計お願いされて、1日かけて作って壁打ちみたいな感じでやってるのかもしれないですけど、もう少し経ってくるとそんな時間なんて与えられなくて、
もうクイックに分析しなきゃいけないってなった時に、じゃあどうするかっていうと、さっき言った軸の話を、自分はうちの会社はペーパーレスだったから紙使えないんですけど、iPadとかでApple Pencilでもう手書きで殴り書きで軸、こんなグラフ作ろうと思ってますどうすかっていうところをまず上司とかに確認して合意取って作るみたいな、そんなやり方をしてたかな。
そうね。それやんないとね、ミスる。俺こないだミスったわ。やっちゃえやっちゃえって言ったら、全然出ないの。そうなんだよね。ミスったーっつって。
何年経っても分析するっていうとまずどんなグラフ作るかのイメージを頭の中で作るなり、紙に書くなり、ポンチ絵で作るが大事ですね。
あとね、その注意してくるやつ、それ無駄打ちじゃないって注意してくるやつ絶対ミスってくる。絶対ミスってくる。最近間違いない。そうねー。偉そうなこと言ってるやつほどミスってくるからね。
無駄打ちすればいいんじゃないですか。俺結構無駄打ち多いタイプだしね。どっちかっていうと。数打っちゃうってこと?うん。だって分かんないもんな。そうなんだよね。理想はあるんだけどね。最初に作って。うちらも今偉そうに言ってるけど。全然。現場でできてるかっていうと。
あと事前に考えるの面白くねーからさ。いやー分かるー。その資料作ってる間に結果出るしみたいな。分かるわー。って思ってやっちゃうんだけど、結局ね。あれってね。事前に計画した方が早い。間違いだ。本当にそう。手を動かすの楽しいからね。そう。やっちゃう。データアナリストになってるぐらいだしね。
うんうん。先言は。あとは問いを立てる力、仮説思考をどうやって鍛えていけばいいですか。まあこれはロジカルに考えるってとこですよね。分析関係なくじゃないですか。そうなんだよねー。俺らロジックパワハラの研究室にいたからさ。間違いないね。でもあれのおかげみたいなとこもあるよ。実際。うんうん。
まあそうだよねー。あとは、よくあるビジネス書じゃないけど、ロジカルシンキング的な本をパーっと読んじゃって、こういう考え方を学ぶっていうのを学ぶ?あーそういうことー。いやー俺やだなー。先言にはそうなってほしくないなー。最低限はあってもいいんじゃないですか。
ロジカルシンキングって書いてる本のロジック崩壊してるとか、書く力とか、書く系の本の読みが進まないとか、っていう根本崩壊してるみたいなことが多々あるから。多々あるね。そう。あんまりね、俺はそういう書物に行きたくないタイプだね。
まあそうだね。え、でもこれ1個言えるのは、何か仮説1個だけ出すのはリスクあるかなと思ってて。はいはい。このデータ見るってなった時にいくつかのパターンは出せるようにしといた方がいいかなと思ってますね。絶対あるよねー。うん。だから。仮説いくつか出して筋良さそうなので、これでいきますけど、いいっすかっつって。うんうんうんうん。
前回のエピソードのサウナのデータとかで言ったら、ちょっと地域見ますけど。人気のサウナ予測するってなった時に、どういう要素が効いてるかって話で分析したけど。とかね。はい。その中で地域、地域と人気度のなんか関係性ってどうなってるんだっけっていう時に、どんな仮説立てれるかって話か。そう。
それこそ、あのツイッターのやつで、本編で紹介しなかったけど。うん。無駄な分析あったしね。ハッシュタグのとか。あーね。あの、ツイッタージャパンがね、無駄な分析をしていたって話。うん。しかも無駄分析を載せるっていうね、資料に。うんうんうんうん。
だからまあ、ざっくり言うと、ハッシュタグついてない、ついてるついてないでバズに変化があるんじゃないかみたいな、多分仮説の元をやってみたら、そもそもほとんどのツイートにハッシュタグがついてねっていう。っていうね。あれ無駄打ちだから。無駄打ちだけど仮説ありきで分析したっていう、なんか結果がにじみ出てますよね。そうそうそうそうそうそう。うん。
っていうね。だからやっぱ、あるよ。無駄打ちはまあオッケー。うんうん。仮説をね、いかに出すか。うんうん。なんか数字がイメージできると仮説立てるんだよね。頭の中で確認までできるぐらいじゃないと多分仮説ってあんま生まれなくて、フェルミ推定みたいなやつあるじゃん。ざっくり年収を予測するとかね。とか、日本に電柱何本あるみたいな。はいはいはい。
あれもさ、なんか仮説立ての繰り返しじゃん。そうだね。仮説に仮説を重ねて。そう1平方メートルあたりに、とか1キロ平方メートルあたりに何本あります。これはあくまで自分の主観で考えた仮説で、でそれを地球規模に広げてとか、っていう話だから。うん。
だからそういう訓練をするっていうのもテクニック。まあ確かに。店入ったら売り上げ予測するとか、フルで何回転したら、ああじゃあ今の間に客端3000円で座席数100で。気持ち悪いなそんなやつなー。店入ったらキョロキョロし始めるの。でめっちゃメニュー見て、平均の単価いくらでみたいな。まあ3号だな。3号で。
気持ち悪いな。それ毎日やってるやつ?そう。それでいける。まあでもそういう考え方ですよね。そう。大丈夫?回答として。いけたでしょ。オッケーオッケー。オッケーオッケー。さっきのついてこいよ。もう聞いてないかもしれない。もう聞いてない。もう。こいつらのしゃべってるのくだらねえからやめとくかーっつって。
そしたらもうさっきごはん卒業ですよきっと。さっきの卒業。キャリアアップ、キャリアアップ。この番組からの離脱のことをキャリアアップと呼びます。これから。じゃあはい。次のお便り行きますか。行きましょうか。じゃあ次ですねコアカネム、おがやんさんからです。ありがとうございます。ありがとうございます。
今回のデータから見たタイタニックの話もめっちゃ面白かったです。タイタニックか。はいはい。タイタニック回だから3つ前かな。4つ前かな。ツイッターの前だね。うん。でお二人のトークが絶妙で毎回楽しませていただいてます。
これまでデータ分析とかデータサイエンスといった分野には全く興味もなかったド文系の私がお二人のおかげでデータサイエンティストを目指して勉強を始めてしまったほどすごい影響力です。すごいですね。人生変えてもうた。
すごいな。で、統計や数学も今までとは全く違った印象を持って勉強に取り組めています。個人的にはデータサイエンティストを目指しての勉強方法の話や転職の話をもう少し詳しく教えてほしいと思っていますが、そうしたことに限らずこれからも身近な事柄をいろいろな手法で面白く楽しく分析してお話しいただきたいと思います。
週1回の更新を何よりの楽しみとしていますので、これからも末永く新しい番組を作り続けてください。よろしくお願いします。
感想ですね。ありがとうございます。
ありがたく読ましていただきました。
答えることないもんね、これね。
ないですね。
おがやんさんもう一個来てくれてるんですよ。こっち読んじゃいますね、じゃあ。
はい、もう一つですね。
質問はですね、先日はアルバート・ラズロ・バラバシ先生の成功者の法則を紹介されていましたね。
はいはいはい、しましたね。
しましたね。
バラバシ先生にはその名もネットワークという台帳もありますが、ぜひこちらの内容もりょっちさん、たっちゃんさんのわかりやすい解説で面白おかしくご紹介いただけないでしょうか。
これからも長く続けてくださいということです。
ちゃんとバリューに満ちた読んで。
あ、データサイエンスの興味関心を掻き立ててくれる面白いバリューに満ちた番組をこれからも長く続けてくださいとのことです。
大事なんだから、バリュー中毒。
そうだ、バリュー中毒ですからね。
バリューのない話は一切しない、バリュー中毒。
ということですが、バラバシ先生の話しましたね。
したね、成功者のやつね。
あれめちゃめちゃ紙砕いて書かれてたからね、あの本は。
そうですよ。
あの本はね、外で読むのが恥ずかしいぐらいのタイトルだから。
何でしたっけ?
成功者の法則ね。
そうだ、人脈と運と実力が大事っていう話ですね。
成功の法則って書いてあるからね、本の一面に。
もう、ブックカバーないと見れないわ。
池袋のルノワールとかで、マルチに勧誘されてるやつが読んでそうなタイトルしてるから。
先輩連れてくるやつね。
俺好きだったんだよ。
池袋辺り住んでた時にさ、朝から夜中までやってるカフェで、俺もそこでずっと研究してて、ずっとね、定期的に来るのよ、そいつらが。
毎回同じやつが来るんだけど、勧誘に。
で、騙されそうな大学生がポツンって座って、毎回演劇が始まるんだけど、やっぱね、ちょっとずつ上手くなってくんだよね、そいつら。
ほんとなんだね、ほんとにいるんだね。
あるよ、マジあるよ。
俺一回言ってあげたもん、二人ともトイレでいなくなったタイミングで。
騙されてるよ、つって。
でもね、もうダメだって、彼はね、浸水してたね。
いるんだ、ほんとに。よく聞くじゃないですか、ルノワールで、勧誘って。
そう、あるんだ。
途中から俺もできる気がしてきたもんね。
毎回同じなんだね。
そう、エピソードと、こんな話があって、みたいな。もう忘れちゃったけど、なんかそういうね、事例があんのよ。
成功するために一回こういう沈みがあって、そこからグッと行く、みたいな。
それなんだね、それがバラバシ先生の方に書いてるってことですか?
それはね、全然関係ない。それは全然関係ない。そんなね、そんな低俗な話と一緒にしてほしくない。
はいはいはい。
でね、この、ネットワークっていうね。これ多分ね、ネットワーク科学って本だと思うんだけど、よく知ってるよねって感じ。
大著ね。大著って言うんだと思って。ビッグ著ね。ビッグ著。
これ読み方違うのかな?大著?
大著。
ビッグ著ね。
待って、恥ずかしい、待って。大著らしい。
大著。
額のないとこが出てしまったよ。
しょうがないね。漢字で書いた、おがやんのせいだね。
しかも、ビッグブックらしい。
あー、ビッグ著じゃないんだ。
うん、ビッグブック。
で、この提案してくれてるネットワークは、無理、ここじゃ紹介できん。
ん?どういうこと?
なんかね、え、これ読んだのかな?おがやん。
おがやん、新米、データサイエンスを勉強し始めたとは思えないぐらい結構ハードルの高い本を用意してるんだけど、ネットワーク科学っていう本、500ページぐらいあんのよ。
やばいね。高次元じゃん。
いや、ほんとにそう。何でも書いてある。万物のことわりが全て書いてある。
高次元だ。
それはね、まさに。
で、ネットワーク科学っていう本があって、これね、俺はね、全部やったことあんの。勉強したことあって。
でも、カラー500ページ、一冊1万円。
すごいね。
やばいよね。
やばいね、高次元以上じゃん。
超ハードル高かった。
でもその中に、それこそね、あれがあった。六次の隔たりとかの話も入ってて。
はいはいはいはい、6人友達繋ぐとね。
そうそうそう、どんな人にも会えますよってやつ。
それだよそれ。
はいはい。
それも事例として出てたりとか。
で、あれがどういう理論になってるかっていうのを、大学院生ぐらいとか、大学4年生とかで、そういう研究室に配属されたら、まず最初に臨校でやる、みたいな。
だから、聞いてる皆さんにはおすすめしません。
だからそれを面白おかしく喋ってくれないかっていう。
そういうことね。
ちょっとじゃあなんか、一個ぐらいトピック探しとくわ、事例で。
あのね、結構あるんだよね。
その前半に出てくる事例とかで面白いのが、俳優、ハリウッド俳優のネットワークがいかに閉鎖的かみたいな話とか。
なんか共演者同士で、共演すると仲良くなるみたいなので、その俳優同士の共演履歴から仲の良さみたいなのを定量化して分析するっていうのがあるんだけど。
そこら辺話そうか、じゃあ今度。
確かに面白そう。
ネットワークの話。
ネットワーク分析は結構ね、面白いし。
結果もめちゃめちゃキャッチーなんだけど、できる人が少ないみたいな分野だから。
いろいろ紹介していきます。
ネットワークはじゃあピックアップしてね。
一冊本買うことはマジでオススメしない。
誰にもオススメできない。
じゃあまあネットワーク科学をメインに一つの軸としてここのチャンネルでは話していくで。
そうね。
ね、バリュー出せんじゃないですか。
本当に。
バリュー!
バリュー中毒!
じゃあ、いい提案でしたね。
うん、ナイス。
ナイスオバヤン。
ナイスです。
じゃあ三つ目行かせてもらいます。
おーい。
はい、コアカネム、もしもし桃太郎さん、ありがとうございます。
亀か太郎かどっちかな。
亀?
もしもし亀よ。
あ、そういうことね。
違うのかな?
亀太郎じゃなくてってこと?
もし亀か桃太郎。
何なんだろうね、もしもし桃太郎って。
まあいいか。
まあいいか。
8月中旬におすすめ欄で発見し、面白くて面白くて一気に最新話まで来ました。
うぇーい。
やった。
おすすめ欄って何だろうね。
どこのね、ポッドキャストが使ってんだろう。
ね、気になる。
うん。
教えてね、桃太郎。
もう一回お願いします。
自分は某桃太郎で有名な大学の学部4年生で。
そういうことか。
そうそう。
岡山だな。
岡山だな。
情報セキュリティ系の研究を日頃行っていますと。
データ解析の興味深さ
ですのでブロックチェーンの話題は普段はセキュリティ目線で見ているのですが、
トランザクション層のデータを解析するという発想はなかったので興味深く聞かせていただいています。
さて、私は来年度から素人ながら県内高校生や大学生向けにデータサイエンスを教えることになってしまいました。
そこで質問と言いますか、お願いになるのですが、
お二人が過去に触ってみてこのデータは面白いと思うデータセットをご紹介いただけませんでしょうか。
どんなデータを使って高校生や大学生にデータサイエンスを教えるか悩んでいましてアドバイスいただけると幸いです。
これからも更新楽しみにしていますとのことです。
ありがとう、桃太郎。
ありがとうございます。
データセット、ブロックチェーンも触れてくれてるね。
どっから話そうね。
上から行くとブロックチェーン入り口で来てくれてるのは嬉しいですね。
ね、なんかWeb3の話、ブロックチェーンの分析してアナリストとしていろいろできるよみたいな話ってあんま伸びないんだよね。
正直ね。
正直そうだよね。
そこから興味持ってくれるのはおもろいね。
でもブロックチェーンをセキュリティ面で使ってるは一番のガチ勢、ど真ん中だからね。
ブロックチェーンといえばセキュリティって。
あるよね。
ありますね。ビジネスもそうだし。
絶対俺らよりすげえよ全然。
すごいよ、いいな。就職困らなさそうだな。
ほんとそうだよね。
研究とかまでしたほうがいいんじゃない?やっぱ。
俺今大学生だったらブロックチェーンか量子コンピューターの研究室行きたいなって思うもんね。
AIじゃないですよね。
AIはもうなんか擦りすぎてるからな。
まあ全然仕事もあるし先はあるんだけど。
そうだね。
しかも研究だったらなおさらじゃないですか。
いわゆる最先端にいるわけだから研究するってことは。
そうね。ブロックチェーンの話してくる人ってほんとにね、さんくさん人いるからね。
ちょっとアンチブロックチェーンだもんね。
そう、人がね。
人がね。
だからそれは確実面とかテクノロジー面を深くしゃべれる人がいないのよ。
うんうん。
だから今やっといたらめっちゃすげえなって思うね。
15年後とかに今のAI最先端の人たちみたいになりそう。
なりそうだね。
最高だよね。
まあでもそこのデータ解析の話は興味深く聞かせていただいていますとのことなので。
久しぶりにそういう話もしていきますか。
確かにしないとね。
ね。
で、データサイエンスを教えることになったらしいですよ。
一緒じゃない。私と一緒じゃん。
データセットだって。
データセットか。
え、でもこの間のタイタニックのやついいんじゃないの?
まあ確かにね、でもどうなんだろうね。どんな人に教えるかによるけど。
高校生とか大学生に向けたデータサイエンスだから。
まあ確かに身近なものでとっつきやすい題材がいいかもね。
まあでもタイタニックのデータセットおもろいし。
なんか最近自分はアートマカップっていうデータサイエンスのコンペティションにちょろっと参加したんですけど。
アートマっていう企業かな?がやってる年一回の国内のデータ分析コンペがあって。
えー、アーデントマトちゃんの略?
アーデントマトちゃんではない。
ATMAって書いてアートマって言うんですけど。
そっちね。
アーデントマトって何って感じ。
アーデントマトちゃん知らないの?
何それ。
神奈川県の映画館でしか現れない。
絶対知らないじゃん。
アーデントマトちゃん。
絶対知らないじゃん。
アートマカップへの参加
で、アートマカップっていうのに出て国内のデータサイエンティストが集まって、何人くらいだったかな?
1000人弱くらいかな?
で、一週間くらいのガーッと分析するコンペだったんですけど。
そこで扱われてるデータは面白かったなと思ってて。
はいはいはい。
動画サイトのアニメに絞ったデータのユーザーの視聴履歴と、そのアニメに対するレビューの結果を基に、
新しいユーザーがこのアニメに対して何点つけるかっていう点数を予測するんですけど。
はいはいはいはいはい。
だから、ワンピースのアニメ、映画とかにめっちゃ高評価つけてるユーザーは、
新しいワンピースのフィルムレッドには多分高評価つけるだろうみたいな、そんな予測をしてくってイメージ。
なるほどね。
そうそうそうそう。
スターウォーズファンとか最悪だね。
全然モデルに乗んないの。
乗らないってね。
スターウォーズファンめちゃめちゃスターウォーズ好きなはずで、しかも何回も見てるはずなのに、そのエピソードにめちゃめちゃ好評するみたいな。
そういうアニメユーザー点数っていう、その情報だけで予測モデル作るっていうのがあったんですけど、
そういうデータ使ったらレコメントとかのサービス使うときに使う知識を身につけられますよっていう。
めっちゃキャッチーでいいじゃん。
うん。
それ使えないもん。
桃太郎。
このデータセットどっかで似たようなものって公開されてると思うから、探してみるっていうのも一つかもしれないな。
Googleとかだったらデータセットって無料で公開されてるから、そこから引っ張ってくるでもいいし。
確かに確かに。いいじゃん。
さすがだね。
こういう質問はたっちゃんが答えたほうがいいね。
そう、面白かったなっていうとこですかね。
だからそのデータ使って何するかによるかもしれないですね。データサイエンスを教えるっていうとき。
あーまあ確かに。最終的に教えたいあれがあるもんね。
そうそう。
事柄がね。
俺大学で教えるときとか、自然言語が一番やっぱ直感的にわかりやすいから。
はいはい。
あの感情分析のモデルとかはもうハギングフェイスとかから持ってきて。
うん。
もう自分で好きな言葉入れたらポジ、ネガとか帰ってくるみたいな。
うんうん。
のを体験させるぐらいのレベルとかの話もやったりするから。
確かにね。
あとは普通に画像だったら、俺はMニストは普遍で面白いと思うけどな。
筋?
うん。
手書き筋あれ普通にすごくない?
まあすごい。
でもやっぱそれよりもトランプの方が面白いんじゃない?
いつだっけそれ話してたの?
AIの勉強し始めたみたいな話か。
そうそうそうそう。
懐かしいね。
最初にそうだよ画像分類から始まったから自分でデータセット準備したよこうやって。
そういうのいいじゃん。やんなよ桃太郎も同じの。
トランプ。
ねえトランプを部屋中にこうばら撒いて全部スマホで写真撮ってデータセット集めるっていうやつ。
それやんなよ。
はい決定。
決定桃太郎トランプの経営。
罰ゲームみたいになってんじゃん。
違うって真面目にこれを研究でやったわけだから。
頑張ってたよね。
答えになってるかわかんないですけどデータセットはカグルから引っ張ってくるがまずはよくあるパターンかなと。
自分がオンラインスクールデータ分析を教えていたときは最後の卒論みたいなところで自分でデータセット準備するっていうのがあるんだけど
そこであっせんというか紹介されてたのはカグルからデータ持ってこようぜって書いてあったんで。
じゃあもうそれが正解だ。
カグルからデータを持ってきましょう。
それでお願いします。
幅広いね。たっちゃんはいろいろやってますね。
てなった感じですかね。
いや嬉しいじゃない。たくさん来たねコメント。
来ましたねありがたいっす。
ありがたい。しかもこれ今日の昼じゃん来たの。
うわフレッシュ。
ということでこんな感じですか。
回答になってたらいいなっていう感じと。
積極的にやっていきたい。月1ぐらいはやりたいよね。
やりたいっすね。
結構ツイッターとかスポティファイのコメントとかも嬉しいんですけど。
やっぱお便りもらうと嬉しいっすね。
確かにスポティファイの方のコメントもどんどん拾っていけたら。
スポティファイの方のコメントは結構応援的なコメントが多いからさ。
回答するようなやつだったら積極的にピックアップしていければと思いますので。
皆さんよろしくお願いします。
よろしくお願いします。
ということで今回はいろんな質問に回答していく質問回でした。
少しでもこれでデータ分析とかが身近になってくれればいいなと思いつつ今回のエピソードを以上にしていきたいと思います。
隣のデータ分析屋さん今回も面白いなと思ったらフォロー・レビューよろしくお願いします。
番組の感想や質問はハッシュタグとなりの分析屋。
隣のがひらがなで分析屋は漢字でお願いします。
また概要欄に貼ってあるお便りフォームからコメントお寄せください。
ではまた。
バイバイ。
34:41

コメント

スクロール