VRについての勉強生活
スポーツスポットライトの木下です。前回に引き続きルイツの白紙家庭で、サッカーのトラッキングデータを使って研究しているしらとゴートさんをゲストにお迎えしています。
しらとさんの前回、引き続きです。お願いします。
はい、今週もお願いします。
前回は、しらとさんがどういう経歴で、どんな風にフランスに行って、大学を中退し、フランスで就職を取ってドイツに行ったという、ちょっと変なところのお話を聞いて、最後の方にトラッキングデータの話になったので、
今日は具体的にトラッキングデータを使って、どういったことを研究しているのか、というところをいろいろと深掘りできたらなと思っています。
僕がやっている範囲でちょっとお話できたらなと思います。
どこから話していたらいいんだろう。
大学のフランスの修士はVRだったんですよね。
そうだね。
そこはあまり絡んでいなかったんですか?
そこは全く絡んでいない。
本当にVRの基礎というか、コンピューターグラフィックスの基礎をやってから、その後、VRだとゴーグルみたいなものをつけて、
操作した時と、コンピューターグラフィックスも全般に言えると思うんだけど、操作した時と、そこに操作の結果、画面に出てくるものの遅れ、
それがどのくらいあると良いのか、あと、音とか、VRのゴーグルをつけた時の見え方がどうなるとイマーシブル、没入感が与えられるか、
その理論を勉強していった感じかな。あまり研究していったというよりは、本当に勉強した1年間というイメージで、
特にフランスだと、2年目は半年勉強したら、あと残り半年は企業でインターンするという形だったから、あまり研究をする余裕はなくて、本当にひたすら勉強していたという感じですね。
それでフランスの勉強生活を終えて、日本に帰国して、そこから日本での収支がスポーツデータを使ったものに行ったという感じですね。
トラッキングデータを使ったスペースの計算
その時はどんな研究をされていたんですか?
僕が帰国した時点でスポーツデータコンペがあって、そこでサッカーのデータをもらって、トラッキングデータで選手の位置情報を使って、どこにスペースがあるのかを計算したいなと。
サッカーだと、今だったらゴール期待値とかそういったもので、イベントデータベースのデータってたくさん、もう僕らが知っているものでたくさんあると思うけど、
その時は特にトラッキングデータを使って、例えばスペースの計算とかっていうのがまだこれからみたいな感じもあったので、トラッキングデータを使ってどこにスペースがあるかっていうのを、
気化学の手法なのかな?をベースに計算するっていうのをやってましたね。そこをサッカーデータに対して気化学の手法を使って、どこにスペースがあるかっていうものを、名前でいうとボロノイズとか空演っていうものなんだけど、それを使って計算をしてたっていう感じかな。
ボロノイズって結構、スペースの話なんで言葉で説明するのがめちゃくちゃ難しいと思うんですけど、どういう感じなんですか?サッカーの例え込み込みでいいんで、ボロノイズ的な説明をもらえるとすごい嬉しいなと。
僕は仕事さんから結構研究のタイミングでいろいろ見せてもらってて、おぼろげながらボロノイズとは何かっていうのをうっすらとつかみ始めてるので。
確かにこのポッドキャストでボロノイズ説明するのってなかなか面白い試みだよね。
その選手が最も距離的に一番近いところのエリアとか言われたりするんだけど。
例えば、それはもうちょっと身近な例で言うと、郵便局がポツポツと例えば3個あったときに、自分が住んでるエリア、どのエリアだとある郵便局に一番近いかみたいなのを、
その3点に対して地図上でここまでは郵便局Aに一番近い、ここまでは郵便局Bに一番近いみたいな線を引けると思うんだよ、この3点の間に。
その線を引いた結果がボロノイズっていう感じかな。それが3個じゃなくて、サッカーだったら、片方のチームだけだったら11選手に対してその線を引いていく。
数学で言うと、垂直二等分線っていうんだっけ。2点の間の線をひたすら引きまくっていくみたいな感じかな、イメージ的には。
確かにそうなると一番その人が近い点というか、その人がカバーするエリアみたいなのが図になっていくみたいな感じですよね。
サッカーの場合だとそこにスピードの情報とか手向きとかも考慮しなきゃいけないんで、ボロノイズだけだとちょっと不完全だよねとは言われていて。
ボロノイズと空演による選手配置の評価
僕もそのボロノイズ、修士論文のテーマがボロノイズと空演を用いたサッカーにおける選手配置の評価っていう風にしてるんだけど、
このボロノイズっていうのをベースにして選手間のどこにスペースが大きいスペースがあるかっていうのを計算するっていうのが空演、空の演って書くんだけど、
それはボロノイズをベースに計算していくっていうイメージかな。
配置的に選手のカバーできる人が一番遠い、誰もいないスペースが危ないみたいな話になっていくんですかね、この研究の方向性としては。
そこからスペースの評価。空演っていうのはサッカーより郵便局の方が話しやすいところなんだけど、点がたくさんあった時にボロノイズが引けて、そうすると各郵便局がどれくらいカバーしてるかみたいな領域が決まるんだけど、
その後に空演っていうのを使うと、空演っていうのがでかければでかいほどその空演があるところには郵便局がないっていうことになって、新しい郵便局を置くときにはその空演があるところに置けるといいですねとかっていう使われ方ができるらしいんだけど。
すごいその説明めっちゃわかりやすいですね。
なんかたぶんしょっぴに今までこの説明の仕方したことなかったね。
そうそうそうそう、郵便局、初めて聞きました。垂直二等分線とかのそういう幾何学的な説明は何回も受けたことあるんですけど、郵便局の例え初めてでめちゃめちゃわかりやすいですね。
このポッドキャストのおかげでね、一般にこう喋るっていうことを意識するっていうことが大事ですね。
かもしれないですね、なんか今までが全然優しくない説明だったんじゃないかちょっと思いますけど。
確かにそうなるとあれですよね、どの郵便局がどの地域をカバーしなきゃいけないかっていう各郵便局の担当のエリアがわかるし、どの郵便局もカバーしづらい場所に新しく郵便局を建てようみたいな話になってくると思うんですね。
サッカーの場合は新しく郵便局は建てられないけど、その郵便局が動くことができたり、あとその郵便局の間にある空円を相手の敵郵便局が攻めてきたりして、そこの駆け引きみたいなのが多分あると思うんだけど、それのベースになるモデルを一応提案したっていう感じかな、終始過程では。
それで先行研究とかあったんですか?
いや空円は調べた限りはなくて、正直僕もこれ終始でやって博士でしっかり研究したいなと思ってたら、ちょっと今の指導教員にしっかり説得することができなくてこれ進めてなくて、ちゃんとなんかパブリッシュできてないんでどこにも。
だからちゃんとこうオープンには、公開したものとしては自分の名前では残ってないんで、ちょっと早くやんなきゃなと思ってた。
これを聞きつけて誰かが先を越す可能性もありますかね?
そうだね、まあでもそしたらそれでやってもらって構わないんだけど。
面白いっすね。
まあでも確かにボロノイズそうっすね。
でなんかさっき話でちょっと言ってた、郵便局だったら例えば周りの人口密度とか、そこの労働環境とかが多分考慮されるように、さっからとやっぱ体の向きとかスピードとか選手の質っていうんですか?
郵便局がメッシなのかフォークなのかだったら全然そのボロノイズ、ボロノイズは変わらないかもしれないですけど、持たせる意味合いは変わると思うので、その辺折り混ぜた論文が今執筆中ということですね。
そうですね、今それを折り混ぜたいなと思ってやってるところだね。
ちなみにそこはそれでドイツで今研究してる内容ってどんな感じなんですか?
ドイツでは、分野で言うとビジュアルアナリティクスっていう分野があって、そこはデータをどういう風に可視化していくかとか、
可視化するところに際しての、どういう風に絵を描くかっていうところだけじゃなくて、その絵を描くために必要なツールとか、コンピューターで言うと、
そこに関するアルゴリズムの開発とかいろいろ必要だと思うんだけど、その全般の研究分野があって、それの研究をしています。
時系列データの解析とビジュアルアナリティクスの研究
僕がやってるのが、ちょっと作家から若干離れて、時系列データの解析っていうのがあって、いろんなもの、例えば株式とか数値が、何個もの数値が同時にいろいろ変化していったときに、
それって解釈するのがすごい難しい。1個のものを追うだけだったら、その1個のものがどういう風に変化していったかっていうのを見たりできるけど、その追うべき指標が複数あったときに、それを全部統括して理解したりしていくのは難しかったりするっていうのがあって、
そこをある分野があったとき、例えばサッカーだったらデータアナリストの人とか株式のアナリストの人とかに対して、多次元の時系列データっていうんだけど、そういう複数の指標がある時系列のデータを、
そういうものを解釈しやすいようなツールを開発するとか、そういう計算方法を開発するっていうのが研究であって、その一環でサッカーのアナリストの人向けにサッカーデータを解釈しやすいようなものの研究を、
ツールだったりの開発を、ツールというかフレームワークかな、その考え方とかの開発をしているっていう感じかな。
なんかよく複雑系の本とかを、サッカーとか離れて複雑系とかのシステム理論とかの本を読むと、やっぱり人間って比例のグラフしか直感的には理解できないっていうじゃないですか、要素がまず二次元でかつ非線形であるっていうのが理解の大事であるけど、
ただ非線形のロジスティック回帰みたいな曲線とかになると途端に理解が難しくなって、次元数を増えるとさらにって感じですよね。
僕今の話聞いて時系列データ複数って言われたら、俺線グラフいっぱい並べるしかできることなくねって思っちゃう。
だから多分それを使って予測をしましょうとかするってなると、ディープラーニングのものとか使った方が精度高かったりはすると思うんだけど、最終的にそれを人間に理解してもらうって風になると多分それぐらいまで分解をしなきゃいけなかったりするのかなと思ってて、
そこを使ってどういう風に人間がとりあえず理解できるところで、そういう制約がある中でうまく理解してもらえるものを作るかみたいなところは難しさもある中でやりがいもあるかなっていうところかな。
ビジュアルアナリシスの歴史的なところって、今ディープラーニングの言葉が出たのでちょっと気になったんですけど、ディープラーニングってよく言われるブラックボックスになってるって言うじゃないですか。
ネットワークともそういう有名な話ですけど、結局中がガッチャガチャになっちゃって、予測は分かるけど、仕組みもある程度分かるけど中がどうなってるか分からないって話が出るからね。
それのアンチテーゼ的に生まれた分野なんですか?それとも元々あって、最近昨今ディープラーニングが注目されてるから注目を浴びてるみたいな感じですかね。
もともとずっとあるものだとは、もともとっていうのがどれくらいのスパンかちょっとあれだけど、ここ20年もっとかな。
これ僕の主導権が起きてたら怒られちゃうかもしれないけど、もっと30年40年くらいではあるのかもしれないですね。
どこからをビジュアルアナリティクスって呼ぶか色々あると思うんだけど、最初の単純にグラフ可視化でいうとそれこそナイチンゲールが戦争での死者の割合みたいなのを出したときに感染とかから来る死者がすごく多くなったみたいなのをデータで示したりとか、
あと有名なやつだとナポリオンがロシア遠征するときのやつを上手く地図と地図上の行く経路みたいなやつと、
可視化とデータ分析の研究
違うデータ複数がっちゃんこしたものを使ったりみたいなので、そういうデータの可視化みたいなのはずっとされているから、そういうところから繋がっているっていう意味だとまた機械学習とはまた別だとは思うし、
あと機械学習のブラックボックスになるようなところっていうところも全てではないかもしれないけど可視化できるっていうところはあるかなと思う。
もちろんアナリスト、いわゆるスポーツアナリストっていう意味ではなくて、アナリストでデータ分析をする人ってどうしてもブラックボックスになりがちで、どっちかというと分かりやすいグラフを作るのでコンサルの人とかそんなイメージがあるんですけど、そこを研究している分野があるってすごい面白いですね。
特に複雑なものを人が直感的に分かるようにしていくっていうのは。
説明するときに、さっきも郵便局の例とかでもあれだけど、自分が例えばボロノイズを説明するってなったときに、その元の要素をいかに崩さない、元の意味合いをいかに損ならないようにしながらでもちゃんと分かりやすく伝えるとかっていうのは、
一般の、普通に説明するときも大事じゃん。特にその分野が専門的であればあるほど。で、それをちょっと、なんだろう、専門的な技術とかそういうのを使ってやってるっていう感覚はあるかな。
だから、普通に説明するときとかも意識はするようになったね。この研究をしてるからこそ、一般の人にどういう見せ方をしたら分かりやすく伝わるだろうとか、認知的な負荷を見たときにパッと分かってもらえるだろうとか、負荷がなく分かってもらえるだろうとかっていうのは結構考えるようになったなと思います。
興味深いですね、なんか。
しらたさんの話を細かい研究内容を具体的に聞いていきました。
多分これ以上の中身はおそらく難しくなるので、いろいろとリンクを貼っておくので、細かい研究内容とかそういうところに関してはそっちのリンクからいろいろと覗いていただければなと思います。
はい、お願いします。
はい、ではまたちょっと、次回またお願いします。
はい、ありがとうございました。
また来週。