結局、誰が得するかっていうと、このCO2排出を削減できたよね、っていう事業が今後伸びるよね、っていうところに対する投資が今増えている。ESG投資と言われるところ。
だから結局、投資家が企業のCO2削減の取り組みを評価するときに、正確に測定できた削減効果みたいなところを使うので、
ゆくゆくは投資家が良いところに投資して儲かって嬉しいみたいな、良い思いをするのがその人たちなんだなっていうのは結構調べてて思いますね。
いや、バッドエンドやん。
でも、この正確にCO2の排出の測定量を測るってところで、機械学習使われてるよとかAI使われてるよってところはやっぱりあるみたいで。
どこにでも機械学習とか使われてるはいるんですけど、こういう領域でも正しいCO2排出量を求めるためのモデルみたいなのが実在する。
そんなところで最後話したいのとは思っていたんですけど、プルームバグがちょうどいい感じの記事を出してて、
いろんなパラメータを使わないと正しいCO2って導けないんだよっていうのがあってですね、機械学習との相性はかなり良いよっていう話があって、
単純な数式では求められないみたいですね、CO2の測定量っていうのは。
どうやってやるんだろうな。最近さ、それこそもうネットワークオタクじゃないですか、私最近。
一回さ、警察の犯人特定のプロファイリングのベイジアンネットワークの話したじゃないですか。
多分今のそういう排出量とかの最適化の考えるときにベイジアンネットワークとか使うんだろうなーって。
あーなるほどね。
ちょっと思ったね。最近ベイジアンネットワークめちゃめちゃ勉強してるんだけど、
はいはい。
ライフサイクルあったときにさっきいろんなのあるって言ったじゃん。
その生産があって、配送があって、小売りのとかがあってっていうのが時系列に並んでて、それぞれで積み重なっていくから、
それぞれの起点を例えば濃度とかにして、その中で出る二酸化炭素排出量の平均値とか、
こういう正規分布に従うようとか、10でこんな感じになるよみたいなのが多分連続していくから、
連続してつながっていくそのネットワークをどこを減らしたらどこのパラメーターがどんぐらい下がるかっていうのが多分、
前後の濃度との相関関係を持ってるだろうから、
確かに。
なんかそれで求められたりはするんだろうなみたいな、
なんかなんとなく二酸化炭素排出量の見積りにベイジアンネットワーク使われてんじゃないかなって思ったね。
でもその正しくこの正しくというか、そのライフサイクルの中での情報が正しく取れていくと間違いなく使えるなと思っていて、
一方でその一つでも多分その欠点とした一つでもその情報が欠けると、
その積み上げがうまくいかなかったり求められないよねっていう問題もあると思うんですよ。
そのパターンごとにどういうデータが集められているかによって多分使う手法っていうのは変わってきて、
きれいなデータだったら間違いなくこうもっとシンプルなベイジアンみたいなシンプルな方法で求められるんだけど、
一方汚いデータ、欠損がめちゃめちゃあったりとか、
未上場企業とかはそういう情報がなかなか出してくれなかったりするから、
まあ確かに、責任がないしね。
そうなんですよ。なんで累次している企業から求めに行くとかっていう方法が必要ったりするので、
なんかそこではこの記事に書いていたのはすごい、今一般的に使われている勾配ブースティング系のモデル、
ライトGBMとかXGBOOSTと呼ばれるような、カグルとかでもよく使われるようなツリー系のモデルですね。
決定儀系のモデルを使って、なんか800個ぐらいの特徴量を使用してモデル構築しましたよというふうに書いてあって。
まあツリーにできるんだったらベイジアンネットワークも多分使えるんだろうね。
そうですね。
まあ欠損の保管の仕方とそこの扱い方と解釈性とみたいな、多分バランスなんだろうね。
まさにそうですね。いつまでずっとライトGBMでいけんだねって最近すげえ思う。
すごくない?
いやすごい、なんでもいけるっていうふうにもなってますよね。
なんなんだろうね。もうちょっとさ、LLMぐらい褒められてもいいよね。もうちょっと。
なんでもいけんじゃんみたいな。
時系列もいけるっていうのがね、結構わかってきてるしね。
あ、そうなんだ。
そうなんですよ。データの扱い方とかちゃんと工夫が必要なものを時系列データにも当てはめられるっていうところもある程度精度が出てますよって言われてたり、なんでもいけますよね。
なんでもいける、マジですごいと思う。なんかほら俺らが勉強し始めた頃ってさ、2018とかじゃん。
はいはい。
あの頃からいるじゃん。
いるいる。
あの頃も、あの頃のなんかステートオブジェアートのモデルこれだよみたいな言ってたとか、なんならもうそれよりも新しいやつ出てたような気もするけど、結局そこなんだみたいな。
いやそうですね、初手ライトGBMってありますよね。ずっと言われてる。
それで大体出るから、まあ一旦それでいいんじゃないみたいな話とかね。
そうなんですよね。これはしばらく変わらなさそうですよね。確かにLLMぐらい褒められてもいいかもしれない。
いやマジで、ほんとでそうだよね。
そうですね、こうなんか分類とか回帰っていうタスクだったらライトGBMは圧倒的に強いっすよね。
すげー。
いや言ってたもんな、もうなんか困ったらライトGBMだみたいななんか呪文のように唱えられてた気がする。
あの20万ぐらい払ったスクールで。
あ、ほんとっすか。変わらないっすよねそれは。
あのさ、そのスクールでさ、俺があのマシンラーニングの勉強してた時の講師の人。
だからこの間ツイッターでフォロー来て、その時は普通に1生徒だからさ、だから向こうは全然覚えてるわけもないんだけど。
フォローしてたらフォロー返ってきたから、あ、マジかーと思ってDMしてみたら、マジっすかーみたいなっていう感動の再会をこの間果たした。
えーすごいっすね。
もうなんかデータマイニングとかそういうなんかあのマシンラーニングとか出てくる前の世代からずっとこうデータ整形してデータ分析してとかっていう仕事をやってた系の人で、業界でも名が知れてる人なんじゃないかな。
データ可視化学とかさ、あのなんか単色、なんか2色ぐらいでさ結構シンプルなやつでシリーズ化してるやつあるじゃん。
あー絶対見たらわかるな。
あの江崎さんがリードみたいになってるやつ。アイシアソリッドとかもこの間美跡の本書いてたやつ。あのシリーズのうちの一つも確かその山田さんって人が書いてたね。
あ、そうなんですね。すごいっすね。なんかいい意味で世界狭いっすね。
ね。多分そうやって繋がってもう結構見えてきてんだろうなみたいな。まあこのぐらいの範囲の人たちだよなみたいな。
そうですよね。
多分そんな大きくない世界だろうね。データサイエンスとか。
いや、繋がりますね。
ライトGBMすげーって話からすげーそれたね。
あーいやまあでもそうですね。ライトGBMが結局使われてんじゃないかなってところですね。ここら辺の領域でも。
でもなんかあれだね。今の話ってさ、二酸化炭素のその排出量をいろんなところで例えばライフサイクル全部見て、だいたいどのぐらい出てるって見積もるとかさ。
はい。
なんか全部見積もりというかなんかちょっと機上の空論感ない。
あーその。
なんか実測定があるわけじゃなくて全部推論っぽい雰囲気ちょっとあるじゃん。
そうですね確かに実測定ではないしブレというか精緻に求められてはいないですよね。
そうそうそうそう。
うんうん。
だから実際の測定で本当に上がってる下がってるみたいなさ。
はい。
なんかその層面1個に対してここのパラメータチューニングしたから二酸化炭素ちょっと減りましたとかわかるけど。
うん。
じゃあなんか結局最終的にはさ、世界全体での二酸化炭素排出量を減らしたいわけじゃん。
うん。
けど多分その個々のちっちゃいプロダクトのちっちゃいチューニングしてたものが果たして積み上がってって世界的に。
10パートが変えるインパクトになるかで言うとそれも想像つかないじゃん。
はい。
そうだから結構むずいなと思ってて。
でなんかその宇宙話で二酸化炭素の排出量の話したことあるよっていう。
これね多分ね終焉者の連載でも書いたんだけど。
へー。
あのJAXAが打ち上げてるイブキっていう人工衛星があるのね。
はい。
イブキ1あって2もあってみたいな感じで。
宇宙から人工衛星で地球上の二酸化炭素量を常に測定し続けてるっていうレーダーで。
そうっていうのがあって結局ね20年ぐらいずっと二酸化炭素量ってやっぱ増え続けてるんだよね。
へーそうなんですね。
人工衛星だからさ低軌道確かそんな高い軌道じゃなかったはずだから低軌道で高度500キロ600キロとかってなって1日1周100分ぐらいで回りますみたいな。
1日15周して1ヶ月経ったら世界全体の結構聖地のマップできてますみたいな。
はいはい。
はいはいはい。
そりゃそうっすね。
それがどう考えてもこう支配的な要素になるわけで。
そのそうめんのライフタイムを見てそうめんのライフタイムの中のパラメーターがチューニングされたぐらいで。
そのコロナで経済活動が止まったら二酸化炭素減るみたいなぐらいのインパクトが起きるんかっていう。
世の中の二酸化炭素排出してるものの上位こう規御率で全部上から並べてって上からチューニングしてきゃいいじゃんっていう話にもなるけどそういう打ち手はしないじゃん多分。
そうっすねだからそうなんですよこの食品業界も別に全体で見たら多いわけじゃなくて全体の排出量が10%にも満たないくらいの業界なんですよね。
だからやっぱり一次産業が。
飛行機飛べろって話だもんね。
そうそうそう一次産業二次産業とかなんですかねが多いですよねその加工をしたりとかいわゆる石炭石油をガンガン燃やし続けるような業界。
そうそうそうそう。
そこに手こ入れしないとインパクトとしてはあんまり意味がないという。
そうなんかねほらデータサイエンティストの人聞いててさ機械学習のモデル作ってなんかシャップとかでさこれがすげーんだって言った後にさなんかちょっと10番目のパラメーターチューニングしたんですけどとか言って後輩に言われたらぶっ飛ばしたくなるじゃん多分。
そりゃそうですね。
けどほらなんか前のプロジェクトではこれが一番重要って言われてたんでみたいな。
そっちでチューニングしたら直るかもしれないけどこっちで見たら10番目だからみたいな。
っていうのがあるからなんかそういうのを考えるとなんかどこまで改善するんだろうねみたいな。
じゃあ何するかって話ですけどまあでも結局誰かがこう旗振っていかないといけないっていう話でもあるし経済成長国の成長を進めるためにはこう結局インパクトの大きいところを手こ入れするのは多分しないので。
そうだよね。だからなんか煙突のさっきの例はめちゃめちゃピンときたというかどう考えてもあれがこうドミナントな成分だろうっていうのはなんとなく想像つくじゃん。
さすがにあれがなんかこうそこら辺の走ってる車よりも空気を二酸化炭素出してないですって言われてもそんなことなくねみたいになりそうだから。
だから反対勢力があるんじゃないですかそういうところを言っていって嫌嫌嫌。
確かに確かに。
確かに。
俺そっちが嫌だ今。
そうでしょ。
全事業者に対して同じ例えば半減50%半減させろよっていうのはそれは違うじゃないですかって話だと思うんですよね。
そうだよね。
うん。
あいつらが50%やったらこっちは大丈夫だろうみたいなね。
そうですそうです。
だからそれが会社企業単位であるでさらに大きくなってもう国単位で今こう進行している企業からするとアメリカとか日本とかヨーロッパとかに対しては嫌々って思うんじゃないですかね。
お前らが作ってきたここ20年30年だろうみたいな。
確かに。
お前らが10%落としたら俺ら別に多分200%で稼働しても大丈夫だみたいな。
そうですよだからCO2戦争じゃないですけど確かに大変ですよね。
そういうのあれなんだろうねこうすげー綺麗にシミュレーションするとかっていう世界がデジタルツインとかそういうのなんだろうね。
そうですね確かにデジタルツインでさもうミニチュアアースみたいなのができてさその中でもう簡単に言ったら先進国の経済活動これだけ抑えて二酸化炭素減らしたら100年後地球はどうなるんだみたいなさシミュレーションパーって回してさ。
でなんかそこに最近はLLMとかが対等してきてるから個々の活動をちょっと自立エージェントに行動させてよりリアルな100年間同じパラメーターで回すんじゃなくてAIがチューニングしたパラメーターで回してった後の地球どうなるんだみたいな。
じゃあこれじゃダメだつって変えるみたいなね。
そうですよね。最近デジタルツインとシミュレーションで何が違うんだろうっていうのを漠然と思ってて。
デジタルツインって言えばシミュレーションを組み合わせたようなものなのかなっていう理解なんですよ自分。
えでもそうじゃない?
そうですよね。シミュレーションができるからそれを将来予測するようなAIとかのモデルもそこに組み合わさってきてデジタルのデータとかをうまいこと組み合わせてすごいAIが動いている世界みたいなそういう理解になってるんですよ自分の中で。
今までのそのシミュレーションっていうのの方向性が多分こういう環境下でこいつらがこういう動きをしたら最終こういう値に収束するみたいな見方だったところから多分なんかデジタルツインって言ってるやつはもうちょっと再現する世界みたいなのを作って
その中にこう実際の実際の世界の挙動っぽいものを細かく設定していってそいつらの動きが最終その計にどういう影響を与えるかみたいなのなんか流度と手法の違いとか見てる世界の違いな気がするね。
あと多分そこに加えて現実の情報をリアルタイムに反映するみたいなシミュレーションのリアルタイム性みたいなところが加わってデジタルツインになるのかなみたいな。
あとはそう中で動く自立エージェントがいてとかっていうのになって完成に近づいていくんじゃない?
次回はほらグラフラグみんなめっちゃ気になってるっぽいからさ。
はい。
グラフラグのベースになるグラフデータベースの話ちょっとしようかなと思って。
今まで話したことなかったでしたっけ。
多分ねちゃんとはねないはず。
今までの話は結構意外となんか普通のリレーショナルデータベースで扱ってもいけるよねっていう体の話し方というか。
うん。
本当にグラフラグ攻めるとか本当にグラフ構造を活用しようと思ったらリレーショナルデータベースだと力不足なんだよね。
はあ。なるほど。
でもどの会社もリレーショナルデータベースしかないじゃないですか。
ISQL叩いてデータ引っ張ってくることしかしないですよ。
そうそうそう。そうじゃなくてグラフとして持つのに特化したデータベース、グラフデータベースっていうのがあるから。
それを持った上でグラフラグとかAIとの相性いいよねみたいな話とかっていうのができればいいかなっていう。
なるほど。
もう完全にグラフオタクになってる。
いいですね。
いいっすねでも。
まさかテック側でこんなね強みみたいなのを作っていくとは思ってなかったよね。キャリア上。
1年やったら人は変わるんだな。
変わるよ。
変わってるね。だってDNA転職した時プロダクトマネージャーで何なら分析すらするつもりじゃなく入ってるのにね。
そうじゃないですか。今なんていう職種でやってるんですか。
いや一応データサイエンティストだと思うよ。
そうなんだ。
いつもデータアナリストって自己紹介してるけどさ。
はい。
この間会社のプレスリリースでもデータサイエンティストって書いたし。
そうなんだ。
まあまあまあ。データサイエンティスト2人だとちょっとさ、ないじゃん。
そうですね。
幅ないじゃん。
幅ないっすね。
幅ないから。幅作っとく。とりあえず所属はアナリティクスブッチャーだしみたいな。
元ね。
元。これからも引き続きアナリストとしていくわとりあえず。
とりあえず。
いろんなとこプレス見ても多分データサイエンティストって書いてあると思う。
そうなんだ。
まあ分かんないですよ。来年再来年何してるかそれは。
データアナリストとサイエンティストの違いみたいな。2話とかでやってるじゃん。
1話かな。
1話だっけ。
1話か。
うん。
一緒だから。結局。
いやいやいや。そうなんすか。そういう結論でしたっけ。
そうでしたっけ。ほら、前職の時はデータサイエンティストとして働いてて、結局仕事内容ほぼデータアナリストだったんじゃね。後半はみたいな感じだったけど。
会社入った時はめちゃでかいモデル作ってたけど、後半からどっちかっていうとコンサルティング的な分析もしてコンサルティングするみたいな感じのだったから。
それはアナリストじゃねって話で。でアナリストとして仕事してるけど、実態見たら今計算社会科学とかネットワークサイエンスとかやってるから、それはデータサイエンティストじゃねっていう。
まあ確かにね。
型書きと業務内容は別に合わないんだよ。
確かに、そりゃそうだ。会社にお手持ちが欲しい。
そんなこと言いつつもう。