1. ゆるテク
  2. #5 データマネジメントの話
2022-09-22 23:04

#5 データマネジメントの話

spotify apple_podcasts

前半は「データマネジメントが30分でわかる本」について話しました。

後半は本をどう読んでいるかの話、フィードバックのご紹介をしています。


Links:

・データマネジメントが30分でわかる本 https://www.amazon.co.jp/dp/B085W4YSZJ

・DMBOK https://www.dama-japan.org/Introduction.html#DMBOK

・実践的データ基盤への処方箋 https://gihyo.jp/book/2021/978-4-297-12445-8

・さんぽ.fm https://anchor.fm/sakura818uuu

・Middle Aged Developers https://anchor.fm/middle-aged-developers


ゆるテクは @junichi_m_ と @hacktk がゆるーく技術の話をするポッドキャストです。 感想は #yurutech をつけてツイートしてください。マシュマロから匿名でも送れます → https://marshmallow-qa.com/yuru_tech

Twitter:

・ゆるテク: https://twitter.com/yuru_tech

・@junichi_m_: https://twitter.com/junichi_m_

・@hacktk: https://twitter.com/hacktk

00:00
お疲れさまです
お疲れさまです
Urtech 第5回始めていきましょう ソフトウェアエンジニアをやっている
博崎です
エンジニアリングマネージャー をやっている三ツ永です よろしくお願いします
よろしくお願いします じゃあ早速一つ目のトピックにいきましょう
お願いします
また恒例の読んだ本シリーズなんですけど
はい
データマネジメントが30分で分かる 本っていう本を読みました
この本はその名の通りデータマネジメント とは何ぞやみたいなのを30分で分かる
理解というか説明してくれる分量 の本ですね
はい
データマネジメントって自分的には そんな聞き慣れない単語だったんですけど
結構有名なものがあるっぽくて
そうなんですね
データマネジメント知識体系っていう 日本語でDinBock
へえ
PinBockのデータ版なんでしょうねきっとこれは
そんな感じしますね
データマネジメントの知識体系ですね これはボディオブノリッジだから
っていうものがあってそれが第1版と2017年ぐらいに第2版が出てるらしくて
そちらの要約ですって書いてありました
なるほど
で中身はデータマネジメントっていうのは何なのかとか
あと知識体系なんでいくつか領域があって
こういうのがあってそれぞれはこういうものですって説明がしてあるって感じがざっくり全体感ですね
なるほど
この本の特徴としては読み手をちょっと考えてくれている感じで
それぞれの章に30秒コースとか
本当一言で説明してあるんですよ
データアーキテクチャとはこういうことみたいなとか
3分コース30分コース3時間コースかなそれぞれに説明がしてありました
3時間コースの時点でもう30分じゃなくなるやつですね
その通りですねだから一応自分は全部読んだんですけど
2,3時間くらいかかった感じでしたかね
そうなんですね
30分コースのとこだけ読んでいけばきっと30分で終わったんじゃないかな
ちなみにその博多圭さんデータマネジメントっていう言葉は知らなかったってさっきおっしゃってましたけど
なんかこちらの書籍を読むきっかけというかモチベーションとかって何だったんですか
これもまたすごい前から積んであった本ではあったんですけど
そうなんだなるほど
特に著者の人つながりというか著者の人がこの本出しましたよっていう紹介があったので読んでみたくなったっていうやつですね
なるほど
でまあなんだろうな企業でデータ分析とか分析の前にもデータを集めたりとかいろいろあると思うんですね
03:09
その辺をちゃんとできるようになりたいなって思いは前からあったので
確かに確かにはい
その辺で積んであってようやく順番が来たので読んだって感じです
なるほどですね
一応この本はケーススタディもあるんですねそのディンボックの説明だけでなくて
そうなんだそれは嬉しい
具体的にその著者の方の体験というかコンサルティングをされている方なので
はい
こういう事例がありますみたいな紹介もありましたね
ただその割と使っている技術要素がTCPとかビッグクエリとか
ああはいはい
あの辺よりだったのがあったので
例えば自分とかAWS主軸ですし
はい
水澤さんも多分Azureだと思うんで主軸は
そうですねはい
なのでまあ直接は使えないかもしれないですけど概念というか考え方としては全然参考になったなという感じはしました
でもいいですねその概念があってそのケーススタディが用意しておいてもらえると
なんだろうこの概念をじゃあどういう風にエンジニアリングに落とし込んでいくんだろうっていうイメージも湧きやすいので
得意な技術スタックではないものの非常に参考にはなりそうだなって印象ですね
そうですねなんかその特有のやつというわけでもなかったので
例えばオブジェクトストレージとかはまあまあどのIaaSにもあるでしょうしね
そうですね確かに確かに
ただそのHowの説明みたいなものはそんなにやっぱり詳しくはないので別の書籍を読んだ方がいいでしょうし
これはこの本の中でも書いてあったんですけど
この網羅的に書いているわけではありませんっていうのは書かれてたんですね
なのでこの本を読んだからといってこのディンボックを完全理解したにはもちろんならないんでしょうね
おそらくそのディンボックに対して全く土地感がない状態で一度読めば
まあそのうすらとなんとなくこういうものがあるんだなぁがきっとわかる状態に少しなって
そこから例えばちょっと深めていきたいなって思ったらもうちょっとその辺の書籍読んでいくみたいな感じですかね
そうですねだから地図を手に入れたぐらいの気持ちでいます
確かに確かに
で感想なんですけど
あれでしたね読み始めて一番最初がこの領域の一つであるデータアーキテクチャのショーなんですけど
もうその説明がですねまず既存のデータアーキテクチャを書き出す
現状ハーフから始めます根気よくヒアリングしましょうって書いてあって
06:02
遠いな
この作業を想像するにもうって感じじゃないですか
なんかちょっとやってみようでできるものじゃない感じがすごいしてきますよね
データを生み出している部署とデータを使っている部署にヒアリングする
その時抑えるべきポイントはどこからデータを取ってどこに保存してどのビジネスに使っているか
これをヒアリングしまとめてメタデータとして保存しておきましょうって書いてあるんですけど
これはなかなかパワーがいるなって気持ちになります
そこに対して何かわかるかもしれないぐらいのモチベーションだと多分あんまり頑張れないなってすごい今聞いてて思って
ここを改善したいとかここに対してアクションを起こしたいとかそういう強い改善のモチベーションがないと
ヒアリングしている最中にやめちゃいそうですねもはやね
折れそうですね
トップダウンでデータ周りをちゃんと整備するぞみたいな号令がかからないとちょっと厳しいかもしれないですね
特に他部署も巻き込むので
協力してもらえないことにはどうしようもないですね
そうですねって思ったのとだからその近道はないんだなっていう感じだったのと
あとそのデータの品質ってすごい広い言葉で品質って何やねん的な感じになりがちだと思うんですけど
そうですねデータに限らず多分アプリケーションを作る人たちにとっても色々品質って意味が多いよねみたいななりますもんね
なりますよねそこ認識が合ってないと話が噛み合わないんで
ここに高品質なデータを定義するっていう章というか段落があってその定義にですね
まず高品質なデータとは利用者の目的に合致するデータって書いてあって
なのでまずニーズを知る必要がありますねって書いてあるんですけど
でそのこういうデータですこういうデータですって例が書いてあって最後に
暗黙の期待がありますっていう説明があるんですね
暗黙の期待
データ品質に対してこういう暗黙な期待がありますっていう例で
一般消費者がスーパーで食品を買う時に消費期限は切れてないことを期待する
うーん
なんかあのすっと手に取った商品がまさか消費期限が切れているとは多分思わないみたいな
だからあれかなちょっと別の話違う視点になっちゃうかもですけど
09:05
よく可能モデルとかで出てくる
当たり前品質に近い感覚なんですかね
おそらくそうだと思いますね
うんうんうんうん
確かになーと思いましたねデータをだから
自分の過去をちょっと振り返ってみると本番にも不正なデータがあったりとか
それこそテストデータみたいなものが存在していたことはあったなと思って
はいはい
それは使えないんで除外してくださいみたいなことを言ったこともあるんですよね
なるほどなるほど
っていうのがあることを普通その利用者は想定しないので
あーそこが
じゃあこの暗黙的な期待っていう部分で言うとそこのフィルタリングというか
されたきれいなデータっていう表現が正しいかわからないですけど
きれいなデータなんでしょっていうのがもう暗黙な期待ってことなんですかね
だと思っています無効なデータがない
例えば購買のデータだとしたらこの商品が100円です
でその商品を1個売りましたっていうデータがあります
だったらそのそこに記述されている売上と価格は100円で絶対一緒になっているでしょっていうのはきっと暗黙な期待になった
なるほどなるほど
そこが違うみたいなのは品質が低いと思うんですよね
うんうんうんうん
っていう感じですかねさっきも言った通りそしてこの本は具体的なハウはそんなには載ってないので
うん
いくつかまた読んでみようかなーって思ってます
同じ著者の人で
なるほど
単調じゃないんですけど3名の方で書かれているのかな
うんうんうん
実践的データ基盤への処方箋ってやつが
おなんか面白そうなタイトルだ
データ基盤
データ基盤か
読んでみるかって感じではあります
うんうんうん
でもあれなんですよねデータ基盤とかって個人でやるの難しいんですよね
難しいですよね
データがないから
そうまあいろいろ揃わないと難しいですよねその
例えば機械学習用のなんか実験データとかって割と公開されて自由に使っていいってものになってるんですけど
なかなかじゃあ個人でこういう多分今博多家さんが読んだようなことをやってみたいって考えた時に
そのデータってあんまりマッチしてないのかなとかってなりますよね
そうですねあのML用の学習データとだからこの業務用のデータはまたちょっと違う気がしますよね
そうそうでも多分そういうの公開してるところなんてないでしょうしみたいな
12:02
本当授業のコアでしょうかね
そうそうそう
難しいですね個人でやるには
なんか三長さんのところでこういうデータを分析やっていくぞみたいな取り組みって何かありました
やっていくぞっていう声自体は何度か聞いたことがありますが
結局のところその例えばデータエンジニアとかサイエンティストとかもいない中で
あんまりこうやっていくぞの号令の後にリーダーシップを持って進む人はいなかったですね
確かにな難しいですよね
難しいですよね
かつこういうことって例えば業務の合間にちょっと時間使ってちょちょっとやってよっていうものでもないじゃないですか
そうですね役に立つものはできそうにないですねそれだと
結構集中した時間を覚悟してやるってなった場合に
あまりこう多分まだそこに対しての期待値もやっていくぞって言ってる人も見えてないところがあるから
思い切ってじゃあ少し期間とってやってみましょうになってないんだと思うんですよね
だから逆にそれを自分たちが説明とか提案できればやれるのかなと思ってますけど
でも今あれですよねスプレッドシートとかで簡易的に多分そのデータをいろいろ集計したりとかはしてますよね確か
そうですね簡易的に
それがまあそうですねスプレッドシートとかエクセルとか使ってる人もいますけどそういうのはありますがってぐらいですね
多分それをじゃあデータ基盤とかビッグデータで分析してある程度確証も得られてますってものかって言われるとそんなほどないだろうなって思いますね
なんかそれを足掛かりにして今こういうことができてるからもう一段階上のことをやりたいねってなった時がチャンスなんですかね
じゃあ整備が必要ですねってなるね
確かに
なるほどなそういうふうにやっていくしかないんだなやっぱり
でも専門の人を置けるかどうか問題ってありますよね
ありますねあります
いや難しいな
専門の人か
そのなんだなお金的なところもあるしそもそもそういう人がいない問題もあるでしょうし
そうなんですよねまだ多分そんなに多くないのかなって勝手に思ってますが
育てるしかないというか頑張って勉強していくしかないんですかねやっぱり仲の人で
まずはそうなのかなって思いますよね
いやそうだよなちょっと自分もそんな感じで自分も勉強しようかなと思い立ったわけです
15:06
すごい前衛なんですけどね
やろうやろうと思ってもその今言った通り直接そのすぐに業務で行かせない系なんでこれ
うんうんうん
なんかちょっと優先度が上がらなかったんですけど
ついに
読みました
このじゃあ実践的データ基盤への処方箋はあれですか一旦積み本リストに入って
あのキューイングされていく感じですか
いやこれはですね今このデータマネジメントが30分で分かる本読んだので
こいつは次の給に
割り込みですね
最優先になりました
素晴らしい素晴らしい
そうですねだから今週末恐らくこれを読むと思います
いいですね
その代わりあれなんですよ先週三長さんが話してくれた
エンジニアリングマネージャーの仕事
あの変化だからどんどん後ろに下がっていく
知りたいこととか勉強したいことってなかなかこうつきないから大変ですねマジで
いや本当も最近もうなんかそのそうは言うてもそれでは読めないから
もうなんかパワープレイで夜に読むようにしてるんですよ頑張って
ほうほうほう
けどですねもう眠いしついでに起きれないし大変なんですよね
そうなんですよね夜夜更かしして読むとだいたい次の日同じことできなくなっちゃうんで
きついですよね体力的にね
そんなこんなでちょっと気合で読んでいこうかと
ちょっとあれですねこういう場所こういうとこでその話を聞くと自分もこれ読んでみたいなってなっちゃいますね
いやー三長さん他にもあるんでね
そう他とりあえずエンジニアリングマネージャーの仕事は読み終えて
はい
あの何でしたっけ
NUXの第3版を読むか組織を真からアジャイルにするを読むか悩んでるぐらいですね
おーそっか3版出たのか
はい第2版は読んだんですけど3版も読んでみたいなって思って買っちゃいましたね
なるほどいいですね
はい
よしじゃあ次のトピックというか
次ちょっとあのこれ今揺れてく5回目なんですけど
はい
4回目までのあの聞いてくださった方がいらっしゃってフィードバックを
おー
ツイッターで
ありがたい
あのフィードバックくれた方がありがたいですいらっしゃるので
えーと紹介っていうかちょっとこんな感じでしたっていうのを
うんうん
紹介してみようかなと思うんですけどまず一つ目がさくらさんですね
はいはい
えーとすごいちゃんとあのゼロから聞いてくださったそうで
18:02
ありがとうございます
ありがたいですね
はい
音声が聞きやすいってことで
ありがとうございます
あれですねフルリモートとアンラーニングの話が興味が引かれたと書いてあって
自分は環境を変えたり時間を寝かしたりすると過去のあれやっちゃったなとか
すればとふとなるこれ偶発的な衛星だということで
分かりますね
確かに確かに時間を確かに時間を寝かしたりするっていうのはありますよね
その時間が経ってちょっと落ち着いて見れるようになったとかあるいは環境を変えた時に
違う角度であの時の出来事を見れるようになるみたいなことだったりするんですかね
そうですねそれだったら自分も結構あるなーって感じがします
特にその時間が経った時とかってもしかするとその頃の自分よりもレベルアップしてることもあるでしょうから
なんかちょっと引き出しも増えてあああの時ああすればよかったとかに繋がってくるんですかね
そうですねふとした時にそういうのがなんか繋がっちゃって何かのきっかけでああって思い出されるみたいな
確かに
ありそうだな
なるほどなるほどありそう
ありがとうございます
ありがとうございます
もう一つがこれはホッチミさんですね
雰囲気が良くない会議の話
はい
はいこのテキストを理解してないけども
ドックをしっかり作って事前にフィードバックを募るっていうのを自分はよくやりますと
なるほどなるほど
ファシリテーターの人は問いかけの作法を読んでおくと言い回しが広がって良さそう
ありがとうございます
ありがとうございます
問いかけの作法をね
読みましたね最近ね
私は積んであります
悲しい読んでみたいんだよな
もういいですねその会議の前に会議の前にドックをまとめてっていう
ドックにまとめてっていうところが多分
自分のためにも言語化できるのですごく役立つし
それを例えば何だろうなその会議の場ですぐ言われてすぐ考えて答えを出せる人もいれば
結構じっくり考えてからじゃないと何だろう
言葉を出せない人もいるでしょうからそういった意味だとすごくフェアな感じで会議に参加できそうな気がしますよね
そうですね事前に心の準備がしたい人は見ればいいし
そうそうそう
なるほどな
事前に作っておくのが良さそうっすね
あとあれかフィードバックを募るのか
こんなこと考えてますけど何かあればコメントくださいじゃないですか書いてみてくださいとかそういう感じなんですかね
21:04
そうですねたまにやってるのは見ますけど頭出しで
先にこういうことを話そうと思ってますってなんか議事録兼アジェンダみたいなの
ありますね
あれをしっかり作るって感じなんでしょうね
ですねしっかり多分話すことを書いてというか
なるほど確かにそこまでしっかりその会議のドックを事前に作ったことはなかったので
なんか一回やってみようかな
良さそうですね
という感じでした
いいですねこうやってフィードバックが来ると嬉しすぎますね
嬉しすぎますねなんかにっこりしちゃいますね
あとそうだあのこれ一つ目のあとさくらさんもあと二つ目のほっちゃみさんもですねどちらもあのポッドキャストやってらっしゃって
えー
さくらさんは散歩FMというポッドキャストで
あとほっちゃみさんの方はあの竹山さんという方と2人で
はい
あの我々みたいにですね2人であのポッドキャストミドルエイジドデベロッパーズというポッドキャストやってらっしゃいますね
えー聞いてみよう
自分もずっと聞いてます
特にあのミドルエイジドデベロッパーズはですね結構揺れてくとなんか雰囲気というか話す内容が同じかもしれないです結構
なるほどなるほど
はい
いいですねそれは
そんな感じですかね今回は
はい
よしじゃあ終わっていきますかね
えーと質問や感想はマシュマロで投げてくださいお待ちしています
お待ちしています
でTwitterでは#ゆるテクですねあのローマ字でゆるテクですをつけてツイートをお願いします
よろしくお願いします
はいじゃあ今日はありがとうございました
ありがとうございました
ありがとうございました
23:04

コメント

スクロール