マニーマニーマニー
データ分析、株のデータ分析ってことだよな。
だね。
儲かる、儲からないの話で言うと、儲からなくない話だね。
間違いない。
そうね。
まあでも、最後まで聞いてもらうと、データ分析で株価予測するってどういうことなのかみたいな話とか、そういったところが抑えられるっていうので、お酒を飲みすぎた頭には難しい話でした。
はい。
ということで、ぜひ最後まで聞いていただけたら嬉しいです。
それでは、どうぞ。
隣の
隣の
データ分析屋さん
この番組は、隣の席に知らないことを気軽に聞けるデータ分析屋さんがいたらいいなぁ、を叶えるポッドキャストチャンネルです。
データアナリストのりょっちです。
データサイエンディストのたっちゃんです。
金だー!金だ金だー!
今日は、お金の話をしていきます。
マニーマニー
データ分析屋さんはね、最終着地点が、やっぱりお金の話です。
お金儲けだと思ってるんですよ。
本当にそうよ。
何のために勉強してるか。
お金のためだね。
そういうことです。話が早い。
ポッドキャスト5点立てるつもりだから、俺。
何に立てる?
ポッドキャスト5点。
5点にね。
だから今日は、データ分析でお金儲けできるんじゃないっていう話をできればなぁというところで、セミナー会だ。
怪しいセミナー。
って思われると思うんだけど、ちゃんと話を聞いてたら、
そんな簡単じゃないよってところが、分かってくるんじゃないかと。
希望に満ちた会じゃないの?
これ聞くと、投資の見え方がちょっと変わってくるかなとか。
あー。
データ分析している人にとっては、ちょっと分析の仕方気をつけなきゃなとか。
ね。
っていうところが、結構学びもあるかなというので。
じゃあ早速。
気づかせてくれるんだね。
行こうかなと。
自己啓発セミナーと。
自己啓発セミナーと。
目もとろ。
やっぱりデータ分析の究極は、
投資活用かなっていうところ。
いやらしい言い方するじゃん。
そんなことはないけどね。
そんなことない?
データうまく使えるんだったら、投資に使って、
確実に儲かるというか、株価の上がるところにお金を突っ込んだ方が、
利益は得られるんじゃないって思いますね。
確かにね。
確実に当たるなんていう話はあるんですか?
そこでも、AI、投資。
で、検索すると、めちゃめちゃ出てくるんですよ。
腕組んで斜め向いて写真写ってる人たちの絵がでしょ。
青い背景とかにね。
今みんな、この音声だけ聞いてる人、タッチャのこと今、スーツで腕組んで。
なんでこの話しようかと思ったかって話を先にしておくと、
なんかちょうどホットな話題だなと思って、
年明け新ニース始まりますとか。
確かに。
そう。どこの株買えばいいんだっけとか。
よく知らないやつだ。
そうそうそう。っていう話も最近あるなとか、
なんか自分自身もこれまで、
なんか金融業界向けのデータ分析とかやることもあって。
あら、そんな真面目な案件を。
そうなんですよ。
で、その時に結構勉強したりもしたから、
なんか話せるなっていうところで持ってきたんですけど。
お金の話なんかほぼしたことない。
お金のデータ分析とか。
あとセキュリティ厳しいし、ガバナンスとかも活躍だったりすると、
なかなか案件の話はしにくいから。
そりゃそうだよね。
そうそう。
ただ結構使う技術って面白いし、
勉強になること多いから、
話していきたいなってとこなんですけど、
もうね、最初に伝えておく。
株価は予測はできない。
あ、そう。
通説。
真理。
ことわり。
真理。ことわり。
理と書いてね。
そういうこと。
書いてことわりね。
向井治の治ね。
ありがとう。
そういうこと。
土変にしたら埋めるね。
いいのよ、別に。
いいのよ。
株価は予測できないよっていうところは、
もうね、みんなが知ってなきゃいけない常識として、
抑えておいてほしくて。
絶対なんだ。
稀に分析して利益出すことはできるんだけど、
ただ確率的にはそれめちゃめちゃ低い話だよってこと。
外的要因が多すぎるからってことかな。
外的要因が多すぎるからってことかな。
外的要因も多いし、株価の性質上、
もうなんかこれ、さらに深く話していくと、
株価ってランダムに動くっていう風に言われていて、経済学的に。
大手町のランダムウォークね。
そのまさにランダムウォーク。
あるの?
大手町ランダムウォークだろ。
なんかそういう有名なツイッターかなんかのSNSのアカウントが。
そういうこと?
そうそうそう。
でもランダムウォークって言われていて、
株価のチャートのところに上行ったり下行ったりっていうところで、
次のタイミングで、
その株価が上がるか下がるかっていうのが、
もうほぼ50%50%の確率だよっていうのが分かってるんですよ。
ランダムウォークって大学入って初めて知ったけどね。
言葉。
言葉。
なんか統計の一番最初ぐらいの時に、
出てると思うんだよね。
あ、なんかフラクタルとかそういうところで出てくる話かな。
かな。
物理実験1年。
物理現象にあるんですよね。
ランダムウォークみたいな。
あるあるある。
なんかアメーバの増殖の方向とか。
そう。
とか、
あとなんだっけ。
温度揺らぎとかもそうだよね。
揺らぎ関連。
揺らぎ関連。
そう。
一番最初に知るランダムウォークは江戸川乱法でしょ。
そう。
乱れて開くランダムウォーク。
まさにそれで、
コナン育ちだから。
映画全部見てる。
まさにそれでそのランダムに動くものを予測するっていうのはほぼ無理っていう話。
まあそうね。
だからそれにAIを使って、
次のタイミング、
上がるか下がるか株価がどうなるかってところを予測するのは相性が悪いって話なんですよ。
はいはいはい。
なんでかっていうと、
まあ機械学習とかAIって結局過去のデータの情報をもとに、
その動きとか株価の動きのパターンとかをモデリングして、
まだ未知の未来の情報に当てはめて予測するっていう形を取るから、
そもそも過去の動きがランダムだったら、
未来の情報を予測するのは難しいよねって話ですね。
じゃあどう予測する中年って話ね。
とはいえでも、
AI使って株価予測してますってみたいなツールとか、
いっぱいあるわけですよ、世には。
なんかそういうイメージあるよ。
ありますよね。
あるある。
だってもう今、
AI株価予測とか、
みんなの株価とかそういうサービスがあるぐらいだし、
なんなら…
え、じゃあそれはもううさんくさい話ってことですか?
そこをちゃんと理解してほしくて、
お、真面目かいじゃん。
株価そのものを予測はできないけど、
でも他の方法で、
株が上がるか下がるかっていうのは、
確率的に分かるっていう話。
100%ではないけど、
確率は高いよねとか低いよねっていう風に、
データをうまく使えば見れるっていう話があるんですよ。
なるほどね。
まあでもまあ、
目隠しとかして当てるよりは当たるよってことでしょ?
そうそう。
目隠しで当てるのは本当にランダムウォークと一緒。
ダーツ投げて、
新聞広げて、
そこの株買うのと一緒みたいな。
ああ、なるほど。
そうそうそうそう。
じゃあワールドカップの勝敗を当てるタコは?
オクトパスウォーク?
あれは?
オクトパスウォークは結構当たるじゃん。
だって。
でも足8本あるからね。
8個動画撮って後出しじゃんけんの可能性もあるよ、それは。
なるほどね。
そうそうそう。
それはオクトパスウォークだ。
っていう話があるから、
じゃあなんで勝ち続けてる投資家いるのっていうところ?
確かに。
ここを話していきたいんですけど、
株価ランダムと言っても、
最初に出てきたけど、
外的要因も結構あるよねってところで、
新商品発表したりとか、
ある会社が新商品発表したりとか、
プレス出したりとかで株価グンって上がるとか。
あるあるだね。
っていうのはあるじゃないですか。
不祥事を起こして下がるとか。
ああいうランダムではない要素で株価はもちろん動くんですよ。
それをもちろん最初にめちゃめちゃ早い段階でキャッチして、
株の売買すると、
それで儲かったり損しなかったりっていうのはできるんだけど、
一歩間違えたらそうやって、
インサイダー取引で捕まっちゃうっていうのもあるじゃないですか。
ああ確かにね。
ハニートラップ仕掛けて株価が落ちる前に売るとかね。
できるわけだ。
やろうと思ったらできるわけだけど。
そういうことだ。怖いね。
だからそれはインサイダー取引で禁止されてるから基本的にはダメと。
会社とか厳しいもんね。
株買うタイミングとか持ち株買いは厳しいですよね。
だから、
それ以外の方法ないのっていう。
だから抑えておいてほしいのは、
株価はずっとランダムには動いてるけど、
とはいえ外的要因で変動もするよっていう要素はあると。
データ分析の話に入っていくと、
その株価を予測するためにどうするかっていうとこは、
いくつか方法があって、
一番よくやる方法としては、
株の値動きの差分を取る。
あるタイミングから次のタイミングの差分を取ってあげるっていう、
何か、
差分系列でデータを見るっていうやり方がよくあるんですよね。
差分。
10分後の株価がどうなってるかの差分を取るみたいな。
そうそうそうそう。
傾きを取る。
微分じゃないですか。
微分もあり。
変化率みたいな。
10%下がる。
10%上がるみたいな。
変化率に置き換えてもいいし、
単純に差分の大きさを取ってもいいしってところで、
これすると何が嬉しいかっていうと、
季節的に変化するトレンド成分とか、
上昇トレンド、下降トレンドを消せるんですよ。
あらそう。
そういうもんなのか。
例えば、
次のタイミングで株価が10円上がった。
また次のタイミングで10円上がったって言ったら、
変化の量は10なんで、
常に10の一定数の値が時系列上に並ぶっていう感じ。
なるほど。
だからトレンドを除く意味での差分を取るっていう、
やり方が1個、
データ分析のテクニックとしてあって、
そういうトレンド成分があると、