1. 思ったら即アウトプットするプログラマー
  2. 354冊(±0冊)「プロメテウス?..
2023-02-05 05:04

354冊(±0冊)「プロメテウス?グラファナ?遅いわ!!」 【 みるみる積もる積読術】

●「Building Real-Time Analytics Applications」 https://learning.oreilly.com/library/view/building-real-time-analytics/9781098146597/

●「Apache Druidhttps://druid.apache.org/

●【オライリー本サブスクについて】  https://zenn.dev/mossan_hoshi/articles/20230128_oreilly_learning

●【積読本リスト】 https://onedrive.live.com/view.aspx?resid=E5C2D6F4943C5CAC!28041&ithint=file%2cxlsx&authkey=!ACdvsAPZkZ9XYpg

●【Twitter @mossan_hoshi

●【Youtube @mossanhoshi7158

●【Zenn @mossan_hoshi

●【Qiita @mossan_hoshi

00:00
海で積もる積読術。この番組では、エンジニアのモスさんが日々、積読リストに積み上げた本や、読み終わった本を紹介していきます。
紹介した本のほとんどは、オライリー本サブスクリプションで読むことができます。
2022年2月4日の積み上げですが、新刊がなくいいので、最近読んだ本を紹介したいと思います。
昨日紹介した本で、リアルタイム分析の本がありました。本というかレポートですね。
34ページしかないやつでしたが、それをサクッと本当に読めたので、その内容を軽く紹介したいなというふうに思います。
この本の概要はどういうものだったかというと、アパッチドルイドというものがあるらしくて、使ったことないですが、
こちらの本でした。
予約するとですね、サイトの分析ですね。
プロメテウスとかグラファナとか使うっていうのが、サイトの分析の一般的な使い方かと思いますが、それじゃ速度足んないんで、
もっとリアルタイムでメトリクス収集して解析して、解析結果をサイトに反映したいよみたいな、
リアルタイムの分析のためのツールがあって、それの紹介って感じでしたね。
なんですが、書籍の紹介のところを見てもですね、あまりなんかドルイドをしている感じ、一応ですね、なんかドルイドについて言及しているところが、
一応ドルイドについて言葉があったんですが、これがメインの本だとは思いませんでした。
だいたい半分ぐらい本当にドルイドの紹介で終わってました。
この本については、そういうドルイドってもんがあるよっていうところを紹介するのが価値かなというふうに思っててですね、
ドルイドの中身に関しては公式ページでわかりやすく紹介されてますし、あとは普通にググればいろいろ出てくるのかなと思いますが、
一応軽くですね、どういうもんかというところをですね、共有して終わりにしたいと思います。
さっき言ったようにですね、リアルタイムでそういう統計情報をですね、ゲットしてきますよという話でした。
なので、だいたい目安としては1秒未満でですね、メトリクスが入ってくるようというような感じになっていますよと。
ただ、クエリでですね、ちょっと必要なデータだけにアクセスする。
結局リアルタイムでどんどんたくさんメトリクスゲットしてると、まあそんだけ高負荷になってくるんでですね、大変なんで、
そこら辺をですね、効率化させるための技術も適用してるらしいです。
クエリに必要なデータ以外はアクセスしないようにだとか、まあそもそもですね、次元数がすごい高くてですね、
複雑なデータベースからメトリクス収集するってなってきた時に生データを持ってくると、
まあそれだけでも幸福になっちゃうんで、もういわゆるエッジ側というかですね、各サーバー側でですね、
事前に次元下げといてですね、それで送ることによってですね、効率化しますよと。
03:04
まあここら辺、ETLとかELTとか、まあそこら辺の話に近いのかなーって感じはしなくもないですが、
まあそんな感じでですね、事前にですね、ギュギュギュッとしておくことによって効率化してるらしいです。
でさっき言ったようにですね、リアルタイムに解析できるよと。
であとあれですね、ここで利益って書いてますが、従来型のレポート形式のですね、メトリクスともですね、
比較したりだとかですね、分析したりすることができるので、まあそこら辺を組み合わせることも可能になってますよという感じです。
基本的にはですね、まあこのリアルタイムのデータを使うってなってくると、まあSQLが一般的なんで、
まあそういうSQLでのクエリ的なものをですね、使うっていう感じらしいです。
はいですね、であとはさっき言ったような内容と、あれですね、このDroid自体のサーバーですけれどもですね、
これをですね、いわゆるクラスター上にですね、構成できるらしいです。
で、そのDroidのサーバー間の通信はHTTPSとDLSで繋いでみたいな感じらしいですね。
なんかプロメテウスが複数台運用は結構大変ですよっていうのがあったりしますが、
まあそこら辺はやっぱり信頼性、こういうそのリアルタイムでですね、いろいろゴリゴリやる。
特にこういうのを使うところっていうのが、まあこの本の中で例としてですね、
ネットフリックスとオールマートが挙げられてましたが、まあそういうですね、大規模なサービス、
そうなるとそのこういう分析ツール自体の信頼性っていうのも重要になってきますんでですね、
そいつ自体もクラスター組んであげてですね、ちゃんと信頼性高めるっていうところがやっぱり技術として必要になってきたって感じですね。
結局クラスター組んでるんで、ダウンタイムなしでソフトを更新したりとかですね、
まあそういったいろんなメリットがあるらしいです。
まあそんなところですかね。
まあ多分使うことはほぼないかなとは思いますが、
こういう世界もあるんだなってところを知っておくのはいいかなというふうに思いました。
以上、アパチド・ルイドの紹介本を紹介しました。
05:04

コメント

スクロール