そのクラウドのプラットフォーム自体がそういう立て付けに沿うように作られてたりもするじゃん
そうそうそういろんな商品製品があるんですよね
そうAWSのS3のパッケージがあってそこの上にとか
Googleも
うん
そういうのがあるんですよね
Googleクラウドストレージの上にビッグクエリがあるから
ビッグクエリで読みに行く間にマートみたいなのを作っておいてとか
っていうのでなんとなくこう基盤を
基盤っていう言葉がなんか今日すげえふわっとするけど
はいはい
作り上げてるクラウドのシステムである程度それが実現されるようにもうなってるような気もする
うん
まさにもう今はこのデータ基盤を作るときはクラウドを使うべしって言われるぐらい
うん
拡張ができるからクラウドのサービスを使うことでどんなデータの容量にも対応できるし
湖をでかくすることができるってことだよね
そうそう
倉庫も増築できるしね
そうなんだよね
だからクラウドの各サービスを組み合わせてデータ基盤作っていくっていう
AmazonのS3はまさにオブジェクトストレージであれはデータレイクにあたる
うんうんうんうん
使い方をすべきもの
GCPのクラウドストレージ化もいわゆるデータレイクとして使うみたいなそういうイメージですね
データレイクって一個の抽象的な概念で
そこに当てはまるサービス製品がいろいろあるよっていうそういうイメージですね
そこをうまく整理してちゃんと言葉を使わないとデータ基盤の人とコミュニケーションするのめちゃ難しくなるみたいな
あーなるほどね
そうそう
勉強になる話じゃない
データ分析屋さん意外とデータ基盤の中身知らない人も多いと思うし僕も知らなかったんで
俺ねなんかめちゃめちゃ調べたなその時
いやなんか普通に仕事で
で基盤の人とかと話す時に最初めっちゃ戸惑ってその時なんか一回全部整理した
大事ですよねこういうタイミングが
まあ困った時にやればいいんだけどね
まあそうね
けどまあ知ってるに越したことはないよね
越したことはないと思う
だしまあ自分たちが使ういわゆるデータマートの部分ってちゃんと整理できてるんだっけっていうチェックも必要だと思ってて
あー
結構ここ怪しくてデータウェアハウスとデータマート混在していて
なんかまだ整理されてないデータを使ってたり
前処理クレンジングできてないデータ
ウェアハウスの状態をそのままデータ分析に回すみたいなケースってあって
で結構非効率的なことをしてるっていう
それはその例えばSQLとかで構造データ触る時に無駄なスキャンをしてしまうような構造になってたりとか
あーそうそうそう
何回も同じような処理を繰り返し
前処理でもできるような
流しちゃってるとか
なるほどね
そうするとじゃあ実行要領もかさ増しされかさ増しして
うん
お金も無駄にかかっちゃう
あーそうそう
っていうことがあり得るから
なんかここのデータ基盤の知識必要だよねっていうのがあったり
はいはい
まああとはあのいわゆるPOC回すタイミングとか
うん
そのまだシステムがちゃんと出来上がってない時って
お客さんからとりあえず生データをもらって
そうね
うん
でその生データを直接データ分析に使うっていうケースもあるんだけど
ゆくゆくはデータ基盤にその生データを入れていくみたいなフェーズができてくるから
そこを意識してどういう前処理をしなきゃいけないんだっけっていうところを
実はデータサイエンティストが入って考えるっていう機会もあったりするんですよ
どうやって使うかを先行して考えておくってことね
そうそうそう
だからなんかどういう風にデータベースこの後作っていけばいいんだっけみたいなとこって
まあ無意識のうちに
無意識のうちに仕事としてやってるけどデータ基盤の人たちに教えてあげたりとか
ナレッジを伝えてあげるみたいな機会があるから
ここって結構大事でできる人できない人いるなと思って
基盤が整った状態で仕事をずっとしてる人には気づけないポイントってことだ
ポイントですね
でもまだまだそんなちゃんとデータ基盤整ってるところってそんなに多いとは言えなくて
まあそういうとこにITコンサルとかが入ってくるんだろうね
そうなんです
だからあの人たちは結構そういうののスペシャリストっちゃスペシャリストだよね
ああそうですね
ITコンサルというかそういう受託系のデータサイエンティスト
ブレインパッドの人とかめちゃめちゃ詳しい人多いんじゃない
いや多いと思うな
ね受託系はそうだよね
ゼロからの立ち上げプロジェクト立ち上げ一緒に入るとかはあるし
そんな中でデータ基盤の人たちとデータサイエンティスト
つなぐ間に入る仕事ってやっぱり必要だったりするよねって言われてきていて
そうだね
どういうふうにデータを保持しようかとかどう使おうかとか
まさかそれがここがデータスチュワードって言われる人
かっこよくないな響きが
いわゆるミッションなんですよね
架け橋になるような仕事
データブリッジとかの方がいいのかな
ERつけたいでしょ
ブリッジャー
そうそうそう
まあでももうなんかアメリカとかでは普通に職種としてあって
求人もあったりするような仕事で
求人まであるんだ
給料高いのかな
会社によるよね多分そのポジションってさ
そこがいないとマジで全てが崩壊するって経営人が理解してると
多分その子の給料ってめちゃめちゃ高くて
まあどうせ動けばいいからみたいな
エンジニアを前頭にしがちな会社
はい
に行くと
多分安いよね
安いねだからデータリテレラシーどんだけあるか
データのこの基盤をどんだけリッチに
リッチじゃなくてもいいのかな
正しく作るかっていうところに感度が経営者ないと
そこの必要性データスチュアードの必要性を感じないっていうところがあって
データサイエンティストデータアナリストデータスチュアードの給料のバランスとかを見ると
会社の雰囲気がわかって
ああそうかもしれないですね
選びやすいかもしれない
選びやすいかもしれない
はい
そうなんですよ
でも少なからず今後の流れとしてはやっぱデータちゃんと確保して蓄積しようねみたいな
DXしていこうって話あるじゃないですか
じゃあ必要じゃんデータを正しく管理できる人たち
スチュアードって意味を言うとお世話役執事っていう意味があって
スチュアーデスのスチュアード
スチュアーデスは女の意味が強いと思ってたけどそんなことないのか
いやその通りスチュアーデスは
女性に対して言う
フランス語なのかなもしかしたら
そうなんだ
フランス語なのかな
あじゃあスチュアードはむしろ男っぽい男性名詞なのかな
男性名詞
あじゃあ差別やん
いやまあまあね
でももうさあれじゃん看護風とか言わないじゃないですか
だから違うよ
その男性名詞女性名詞があるものをそもそもタイトルにつけるのがダメっていう流れだよね
まあ日本はそうだね
そうそうそうそう
だから看護風じゃなくて看護師にしたのは
うん
性別性をなくすわけじゃん
うんうんうん
スチュアードはだからもしかしたら
無性別なのかもしれない
無性別で使いたいっていう意図でスチュアードに統一なんじゃない
あーなるほどね
うん
じゃあデータスチュアーデスと呼んでもいいわけだ
まあ呼んでもいい
まあでもそこに女性の意を含めてしまうと
なんかあえてそう言われてる差別じゃんって思われたら
もうセクハラや
セクハラ
セクハラです
そうです
えーポリコン
これ
いやそうなんですよ
でまあスチュアードっていう言葉が
これスチュアードっていう仕事があって
あのレストランとかで使われるんですけど
まあホテルとかかな
食器を管理する人たち
うん
あのシルバーを
うん
綺麗にしたりどういう食器を使うかみたいな選んだりする食種があって
その人たちスチュアードって言われていて
へー
そうまさにでもそういう
メインの料理を
作る人たちシェフがデータサイエンティスト的な立ち位置なわけで
食材がデータって考えた時に
それをサポートする料理をサポートしたりよく見せたり
っていう周りを固めるような
へーはいはいはいはい
仕事をする人たちなんですよね
基盤だもんね
基盤
っていうまあなんか意味合い的には似てるかなって
そんな人いるんだ
そう
っていう仕事が
まあでも日本だとまだデータマネージャーとか
そうね
っていう仕事で言われてるし
データプロダクトマネージャー
データエンジニアもそうなのかな
メルカリとかLINEだったらもうデータマネージャーっていう名前で
このデータスチュアードの仕事をしてるっていうのが
へーそうなんだ
言われてるような仕事なんですけど
まあやってる内容は今お伝えしたような
データの周りサポート出自をしている
めちゃめちゃ重要な
重要な役割がありますよっていうところ
今からだからスタートからそこを目指す