1. 思ったら即アウトプットするプログラマー
  2. #9 「データ関連の本4冊」 約3..
2023-02-22 05:45

#9 「データ関連の本4冊」 約370冊積読中【みるみる積もる積読術】

spotify apple_podcasts youtube

● 画面付きの動画はこちら https://youtu.be/iriKsUX3NCc

● 1冊目「Data Mesh」 https://learning.oreilly.com/library/view/tragic-design/9781491923603/

(サービスが複雑化しすぎて従来のデータサイエンスでは分析が困難になってきているのに対し、分散型のアーキテクチャをベースに新しいデータ分析の形として「データメッシュ」というものを提案している模様)

● 2冊目「Data Pipelines Pocket Reference」 https://learning.oreilly.com/library/view/data-pipelines-pocket/9781492087823/

(データパイプライン入門書。ゼロからパイプラインを構築できるようになるまで各手順が示されている(データベース構築、AirflowなどによるDAG構築&運用)。各手順を深く理解したい場合は個別の本を読んだ方がよさそう)

● 3冊目「Data Structures the Fun Way」 https://learning.oreilly.com/library/view/data-structures-the/9781098156602/

(色んなデータ構造の特徴を学べる本。基本的なコンセプトは「A Common-Sense Guide to Data Structures and Algorithms, Second Edition, 2nd Edition」と同じ模様。ただ、こちらの方がコンパクトにまとまっていてとっつきやすそう)

● 3冊目の参考書「A Common-Sense Guide to Data Structures and Algorithms, Second Edition, 2nd Edition」 https://learning.oreilly.com/library/view/a-common-sense-guide/9781680508048/

(データ構造に注目したアルゴリズム本。結構評価が高い)

● 4冊目「Database Internals」 https://learning.oreilly.com/library/view/database-internals/9781492040330/

(B木の構造などデータベースの内部がどのようになっているかを説明しているマニアックな本。いつかは読めるようになりたい)

●【オライリー本サブスクについて】  https://zenn.dev/mossan_hoshi/articles/20230128_oreilly_learning

●【積読本リスト】https://1drv.ms/x/s!AqxcPJT01sLlgdsJJ2-wA9mRn1dimA

●【Twitter @mossan_hoshi】 https://twitter.com/mossan_hoshi

●【Youtube @mossanhoshi7158】 https://www.youtube.com/@mossanhoshi7158

●【Zenn @mossan_hoshi】 https://zenn.dev/mossan_hoshi

●【Qiita @mossan_hoshi】 https://qiita.com/mossan_hoshi

00:01
はい次、データメッシュですね。この本なんかちょくちょく上がってくるんで気にはなってはいるんですが、
評価が高かったり低かったりなんかいまいちよくわかってないですね。
データメッシュに関しても、私としてはちょっとだけ遠慮いんで、
まあ知識としてこういうもんだよっていうところだけ知っとけばいいのかなというふうに思いますね。
まあとはいえ、そもそもどういったもんだのって話なんですが、
基本ターゲットとなる分野がデータ分析ですね。
サービスのデータを抽出してきてそれ分析して、
洞察を得て意思決定に使うっていうところですけれども、
そこでシステムというかサービスが非常に複雑になって、
データ操作もめっちゃ増えてますよと。
それでシンプルにデータサイエンティストがAI分析して、
そこから貸して見つけようみたいなところがもう限界に来てるよというところにある。
それに対するアプローチとしてのデータメッシュ。
データメッシュというぐらいですから、
そういった分散的なアーキテクチャからデータを引き出すっていう社会技術パラダイム。
恐々しいですね。
ちょっとそういうふうな、そもそもアーキテクチャから変えていって、
データの分析の仕方も含めて変えますよっていうなんか壮大な話ですね。
なので正直、壮大すぎてよくわからない。
逆に言うとバズワード化してるなって感じはしなくもないですね。
その意味でちょっととっつきづらいんですが、
しっかりと384ページもあって説明してくれているだろうと思いますので、
ちょっと読んで理解したいなと思います。
こんなところですかね。
次、データパイプラインポケットリファレンスですね。
こちらはタイトルの通りデータパイプラインのやつかなと思いますが、
特に具体的なデータパイプラインツールについてどれっていうふうには書いてないですかね。
ポケットリファレンスというふうにはなってますが、
そもそもデータパイプラインって何ぞやっていう、
そういう基本的なところから始まるんで、
データパイプラインについて学び始めようっていう人にも向いてるのかなっていう気はしますね。
ちょっと具体的なツールをどれが想定しているのかは確認したいですね。
ちょっと本書の方を確認してみましたが、
ツールとしていくつか言及をされてましたが、
DAGの書き方とか書かれてたのはAirflowでしたね。
一応Kubeflowについても言及はされてましたが、
パッと見なんか書かれてはないっぽいですね。
なので本当にデータベースをそもそもどういうふうに作るとかですね、
そういったところが書かれているので、
実際にゼロからスクラッチでパイプラインを築いていくというところを学べるというところが
価値なのかなというふうに思いますね。
なのでこれでデータパイプラインという全体を理解したら、
その具体的なツールの詳細な使い方は、
それ専用の書籍で見ていただくという中で、
03:01
そっちの方がいいのかなという感触を得ました。
こんなところですかね。
次、楽しいデータ構造というところで。
タイトルの通りデータ構造がどういうふうなもので、
どういうふうなアルゴリズムに影響するかというところですね。
そこら辺を紹介した本っぽいですね。
書立に関してもですね、それぞれのデータ構造ごとに各章があって、
それの説明といった感じっぽいですね。
この表紙の方からなんとなくわかるかと思いますが、
とつきやすい系のシリーズですね。
これ何シリーズというのか今一部私わかっていませんが、
結構ですね、とつきやすい本が多い印象のシリーズなんで、
そういう意味ではまあまあとつきやすそうな雰囲気はありますね。
似たようなところだとですね、
データ構造とアルゴリズムのコモセンスガイド、
コモセンスガイドかっけな。
常識みたいな感じの本で、
これが結構有名どころ、
データ構造系のアルゴリズムで有名な本で、
レビューも25件5つ越しみたいな感じなんで、
いい感じですね。
だいたいデータ構造って言うと、
これをちょっと思い出すんですが、
ただこちらの本ですね、
500ページくらいあってですね、
まあまあ重めではあるんで、
そういう意味でこういうちょっと重いやつと合わせてですね、
こっちの軽めなやつをちょっと併用するとですね、
効率的に学習できるのかなという気はしますね。
まだちょっとレビューがついてないのが寂しいですね。
こんな感じですかね。
はい次。
データベースの中身。
データベースインターナルズってやつですね。
タイトルからなんか想像できる通りですね。
データベースの中身ってどういう風に動いてんの?
っていうところを、
多分いろんな手法あるんで、
それぞれごとに紹介してるっていうような書籍っぽいです。
小立てから見ても分かる通り、
B3の構造ですね。
そういったものがどういう風になってんのって。
B3結構長いですね。
使えてるやつなんで。
分散システムですね。
ノーSQL的な観点から見た時のですね、
トランザクションどうなってんのだとかですね。
そういったところがですね、語られているっぽいですね。
すいませんちょっと100%ってなってますが、
いつものようにそんなちゃんとは読んでません。
正直雰囲気しか知らないんで、
いつかちゃんと読めるようにはなりたいなと思ってます。
こんなところですかね。
みるみる積もる積読術。
この番組ではエンジニアのモスさんが、
日々積読リストに積み上げた本や、
読み終わった本を紹介していきます。
紹介する本のほとんどは、
オライリー本サブスクリプションで読むことができます。
05:45

コメント

スクロール