1. となりのデータ分析屋さん
  2. 93. AI・分析でデカコーン企業..
2024-12-04 34:27

93. AI・分析でデカコーン企業「Databricks」がヤバいけど知ってる?ワールドツアー参加レポ【ローソン発注自動化】【データブリックス

りょっちの初単著「やっぱり宇宙はすごい」の予約ページが公開されました!


番組の感想や、質問はXから「⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠#となりの分析屋⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠」もしくは、以下おたよりフォームからお寄せください! ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://forms.gle/1Qq3cfqYgVXgs5Qr6⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠

=========================

▼Databricks Data + AI World Tour Tokyo https://dataaisummit.databricks.com/flow/db/wt24nrt/reg/page/landing

=========================

▼書籍の購入はこちらから 超入門 はじめてのAI・データサイエンス(培風館)⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://amzn.to/3R3aI9g⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠


=========================

▼りょっち 第3回Japan Podcast Awards受賞Podcast「⁠⁠⁠⁠⁠佐々木亮の宇宙ばなし⁠⁠⁠⁠⁠」はこちら! X (⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠@_ryo_astro⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠) Instagram (⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠@ryo_astro⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠)

▼たっちゃん X (⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠@⁠⁠⁠⁠⁠tatsuki_2022⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠)

サマリー

データブリックスに関するエピソードでは、ローソンが自動発注システムを導入した事例や、ワールドツアーでの最新技術についての情報が紹介されています。また、データブリックスの高い企業価値やその存在意義についても触れられています。今回のエピソードではデータブリックスがデカコーン企業として成長していることや、その背後にある技術的な基盤が掘り下げられています。さらに、ローソンの発注自動化システムや需要予測におけるAIの活用方法が紹介され、ビッグデータ処理の重要性が強調されています。データブリックスはローソンの発注業務の自動化を支えており、ビッグデータとクラウドを活用した効率的なシステムが進化しています。企業価値の向上やIPOへの期待が高まっているデカコンとして注目されています。

ローソンとエルチキの話
エルチキの袋の点線のところにテープを重ねる定員さんが絶対許せないんですけどどう思いますか?
引っかかるやつだ。マジで許せない。俺あれ、なんか自分の近い人が定員でやってたらブチギレるかもしれない。許せない。
ローソンヘビーユーザーですもんね。エルチキ大好き。大学のいつも言ってた。毎日。
本当に。そうだよ。大学の近くのローソンで俺が一番多分エルチキとドーナツ買ってたんだから。
言ったっけ?あそこのローソンのドーナツ入荷の数減らすときに定員さんから謝罪されたの。
なんでドーナツ減ってるんですかって言ったらすいませんって言ってお客さんしか買わないんですよねって言われて。
俺のために残しといてくれてた。ゼロにしないで。
そうだったんだっていうぐらい買ってた。
っていうのできっと俺のこのドーナツへの貢献もローソンの仕入れのデータのどこかには刻まれている。
そういうことに繋がってくるんですね。
そうです。なので今回はローソンの話っていうよりはデータブリックス。
もうデータサイエンスとかデータ分析してる人だったら絶対知ってるんじゃないですか?
絶対知ってるんじゃない?デカコンスからね。
でデータブリックス使って発注の最適化をしたのがローソン?
そうだね。全ての商品全国のローソン。
すげーマジで。それがあってもだからうちの大学の近くのローソンのドーナツは多分自動発注されても入ってたよねきっとね。
そうだねちゃんと売れる。1個は売れるっていうのがAIがちゃんと認識できてるから。
俺というくさびが常にAIモデルをハックし続けてたよきっと。今だとしても。
そうだね。
っていう感じでちょっとねそういった実例も含めながらデータブリックスの存在がマジやばいっていう話を今回はしてるんでぜひ最後までお付き合いください。どうぞ。
データブリックスのワールドツアー
隣のデータ分析屋さん。
この番組は隣の席に知らないことを気軽に聞けるデータ分析屋さんがいたらいいなぁを叶えるポッドキャストチャンネルです。
データアナリストのりょっちです。データサイエンティストのたっちゃんです。
データブリックスの話をしていきますよ今日は。
知念度はどうなんだろうね。どうですかね。
ただ11月の14日にあったこの話をするきっかけでもあったデータブリックスのワールドツアーの東京行ってきたんですけど人はすごかったですよ。
ワールドツアー。
正確に名前を言うとデータプラスAIワールドツアー2024in東京っていうデータブリックスがやってる。毎年やってるんですよねワールドツアー。
それの今年のやつですね。どのくらいいたんだろうな。
のべ1万くらいなのかな。
すごいね。
いましたね。
やった場所もANAインターコンチネンタルホテル東京の赤坂にあるところで。
インターコンチだすごいとこでやるね本当に。
そこでいろいろなデータブリックスの最新技術の話とか導入している企業のうまくいった事例データ活用の事例とかAI活用の事例とか
っていうのがこう共産企業とか導入企業が話してる。
熱量は高かったしやっぱりデータブリックスの面白い機能をいろいろ出してるなーっていうのがあったんで今日はその話をしたいなと思いますね。
データブリックスがマジどれくらい知られてるかっていうのが結構道数っちゃ道数で。
正直勢いの割に国内の知名度は低いんじゃないかなとは思ってるんだよね。
そうっすよね自分も正直今の会社のプロジェクトやってない限りデータブリックスに会うことはなかったから本当に使ってる人以外は正直どんなサービスかってパッと分かんないんじゃないかなと思います。
でももうユニコーントップクラスのユニコーン企業じゃないですか。
いわゆるデカコーンって言われる。
スペースXの次ぐらいじゃなかった?
あもうそこまで言ってんのか。
え多分ね。
多分ね企業価値で5兆6兆の世界なんですよね。
多分データブリックスは結構スペースXに次いでぐらいの感じだと思うんだよな。
いわゆるデカコーン企業ですよね。
だから世界的に見てかなり注目されてる企業価値の高いいわゆるシリコンバレーとかにある会社になってくるんですよね。
サンフランシスコで毎年このデータブリックスのワールドツアーの前にAIサミットかな。
いわゆるカンファレンスがあってこれは年一回やってるんですけど。
それもものすごい盛況で自分のチームのメンバーも行ったりしていてかなり盛り上がってたよって言ってたんですけど。
同時期にスノーフレークって言われるデータブリックスの競合にあたる会社も同じサンフランシスコでイベントやってて。
そうなんだ。
バチバチになってるようなどっちもお互いユニコーンでデカコーンに値するかなり注目されてる会社なのかな。
そうだよね。スノーフレークとデータブリックスってそんながっつりか。
データ管理とかいわゆるデータ基盤みたいなところだと結構被ってくるような。
まあでもそうだね。俺両方使ったことあるわ。
そうなんですね。自分スノーフレークはなくてデータブリックスだけですね。
そうなのよ。どっちも使ったことあるからなんとなくは分かる。
でもまあ確かにそうだね。ついにはなるか。
そうなんですよ。ここがやっぱり今何で注目されてるかみたいな話からしていこうかなと思うんですけど
データを扱う事業者ってこれまではクラウド事業者みたいな感じでAWSとかAzureとかGCPっていわゆる三大クラウドみたいなところが
クラウドでインフラ作るみたいなところが注目されてガーッと伸びてきたんですけど
今ってそこを超えてデータブリックスとかスノーフレークみたいな
データをどう活用していくかみたいな技術がすごく伸びていて
データレイクハウスの概念
これなぜかっていうとデータそのものはさっき言ったクラウドに置いとくんだけど
そこに置いてるデータをデータブリックス上で加工したり分析したりAIを作ったりとか
そういうことができるようになってくるつまりそれぞれのクラウドをつなげてそこからデータ吸い上げて分析できるよみたいな
そういう使い方をするのでクラウドに寄らず使える技術ってところがすごい注目されてるのが一つポイントなのかなと思いますね
そっかだから多分俺が使ってた環境だとたまたまその恩恵を受けてなかったからその使い方のイメージがないのかな
単一クラウドとの接続だけの範囲で使ってる人もいるよねきっとね
全然いると思いますねむしろその事例が一般的かもしれないまだ
でもまぁどうだろうなグーグルクラウドとかだったらもちろんグーグルクラウド内である程度完結するように作ってあるじゃん
バーテックスAIワークベンチあってまあノートブック開けるしそこからねあのソフト化もできるしみたいな感じになっているから
まあ単一だったらもしかしたらクラウド内で完結しててもいいのかもしれないよね
その方がもしかしたらコストがかからなかったりデータ読み書きのスピードみたいなところのがボトルネックになることはないから
小規模中規模でプロダクトを作ったりしているような会社だったらもう単一クラウドにデータを置いて
そのクラウドのAIとかデータ活用のサービス使って開発してるっていうケースが多いかもしれないですね
今回このデータブリックスの事例紹介みたいなところで結構老舗の事業者が発表していて
なるほどなと思ったのが何十年もやっているようなデータ活用の事業者って実は各部門が独自にクラウド契約をしていて
それぞれのクラウドにデータが置かれているストレージにデータが置かれているみたいなのがあると
そのデータを繋いで分析したいみたいなところがようやく最近このAIの発展というか
AI活用みたいな文脈で出てきてじゃあどうやってやればいいんだろうみたいな
っていうところのソリューションとしてデータブリックスが使えましたっていうユースケースがあったので
そういう時にはかなり使いやすいサービスなんだろうなっていうのは結構納得感がありましたね
そうなんだだからクラウドを全部まとめるような動きをした時のスイッチングコストよりも
データブリックス入れて別にどこのストレージに入れていても
一元管理というか一括分析できる場所が作れるんだったらその方がいいかという話
そういうことなんですよ
まあ確かになAWSベースでやってたのにいきなり
じゃあちょっと会社の方針でGoogleクラウドにしますとか言って
映したら使える呼び出しのコマンドも全部ここ変えなきゃいけなくて
パスも変えなきゃいけなくてとかってなるぐらいだったら
今後の開発はデータブリックスですって言われた方がまだまだ
ああなるほどね
データブリックスもそこそういう需要ニーズに対してちゃんと技術の開発をしていて
データの所在は各クラウド例えばAWSだったらS3とか
AzureだったらBlobストレージとかそういうところのストレージに置いといて
そのデータはそのままでデータブリックスって
新しいデータレイクハウスっていうデータ管理の概念を作って
データの実態は持たないんだけど
メタデータみたいなどこに何のデータがあるかみたいな情報だけ
管理してすぐ読み書きできるような仕組みを作ってるんですね
だからデータの入出力にかなり時間がかからずにすぐ
データブリックス上で分析ができるっていうのがあるので
あんまりストレスにならずにクイックに分析できるみたいなところが
すごい使いやすいポイント
データレイクハウスは言葉としては認識してて
めっちゃややこいの出てきたわって思った
そうなんですよね
前なんかpodcastで話したよねデータレイクと
データウェアハウスかな
ウェアハウスとみたいな
ありましたねデータ基盤の話をしたときに
生データをどこに置いて一旦加工して使いやすいデータを
どこに置いてみたいなときにデータレイクデータウェアハウス
データマートみたいなそういう3つの階層でデータ持つのが
今ここ最近だと終了になってくる考え方です
って話したんですけど
なんだよレイクハウスってみたいな
データブリックスはデータレイクとデータウェアハウスをくっつけちゃって
データレイクハウスっていう概念を
これ我々が作りましたってすごい強調してたんですけど
イベントの中でも
一般概念の言葉じゃないんだあれ
多分今は一般概念になったのかもしれない
データブリックスが言い始めたことで
すごいな俺も作りたいわオリジナルの言葉
組み合わせで生み出すみたいなイメージですかね
だからこのデータレイクハウスっていう概念を作ったことで
データの所在はどこであれ
すぐにデータブリックス上でデータを呼び出すことができるようになったっていう
そういうメリットがありますよっていうところ
SQLとかで簡単にクエリを叩いてデータ引っ張ってきて
データブリックス上で可視化したりグラフ作ったり
あとはAIのモデルを作ったりとか
っていう使い方これが一つ
クラウドが先に出てきて
みんな使うようになった後にどう
この状況を使って
データ活用のサービスを作ったかみたいなところを
後から作ってうまくいった自衛の会社なのかなっていうイメージですね
そうだね
日本の会社とかだとさ
普通に各部署で契約しちゃったみたいなケースになると思うんだけど
多分それこそでかい会社とかで
ある程度まで自社のサービスで上がっていった後って
買収とかのペースも上がってくるじゃん
で買収した後が多分問題なんだよね
買収先のデータ構造ってさ
それはそのサービスが回るように作ってるから
データブリックスの成長
別にそこの会社に買われるってことも分かってないから
別に使い勝手のいいように使ってて
その中を整えるっていう作業もしかしたらするかもしれないけど
やっぱクラウドを移行するってなかなかだから
確かにな
しかも最近のスタートアップとかって
当たり前にデータ活用みたいなところをして
データを貯めることをしてるから
買収とかになっても各クラウドに置いてるデータが
サイロ化みたいなのが当たり前にあるんでしょうね
そうそうだから多分
キメラみたいな状態になっちゃうわけだよね会社の中で
いろんなクラウドがくっついた
一個の集合体みたいになるから
そいつを制御するブレインとしてデータブリックスを使おう
っていう発想なんじゃない
そこらへんの課題感とかも全部吸い上げて
サービスとして作ったっていう可能性も全然ありますね
さすがにこんぐらいまで伸びる会社っていうのは
そういうのを考えてるんじゃないですか
スパーク技術の中心性
さすがすぎるな
もう一個クラウドっていう観点と
これは多分どういう風に事業を作ってるかみたいな
ポジションの取り方だと思っていて
でもデータブリックス使うときに
コアになる技術がすごいよねっていうところの観点もあって
結構自分はデータブリックス使うとき
こっちの観点の方が注目したんですけど
それがアパッチスパークって言われる
分散処理技術ですね
使ってました
やりますよね
このスパークが裏で動いてることが
このデータブリックスを使う上ですごい重要なポイントというか
このデータブリックスの技術の中心になっているところなんだよね
っていうのがあって
ここの話をしたいんですけど
どっかで分散技術の話しましたよね
確かエピソードの中でどこかで話していて
細かいところはそこを聞いてほしいんですけど
どこだっけね
いくつものコンピューターをつなげて
データもそこに分散させて処理させるから
すごいビッグデータでも
効率的に処理できる技術があるんですよっていう紹介をしていて
最初のボケのネタに使った気もする
そうかもしれない
でもスパークの技術もそのもので
今この巨大なビッグデータみたいなところが
当たり前になってきてるから
一つのコンピューターのリソースだけだと処理できないから
いくつものコンピューターを裏で立ち上げて
そこにデータ流して
それぞれ処理させて後でまたまとめるみたいな
これがいわゆるスパークの分散処理技術っていうのがあるんですけど
これを作った人がデータブリックスの今現CTOなんですよ
そうなんだ
だからスパークっていう分散処理が
データブリックスの中心にあるのは当たり前で
この作った人がマテイザハリアっていう人なんですけど
インド人
ルーマニアか全然違いました
ルーマニアです
ルーマニア出身の人ですねこの人は
でこの人が大学院の時代に
当時マップリデュースって言われる
いわゆる同じような分散処理技術に対して
スパークっていう新しいオンメモリで動くって言われる
よりスピードが速いんですけどその方が
方法で分散処理技術を発明して
それで博士論文を書いている人なんですけど
すごいね
でこの人がデータブリックスを複数人で創業して
データブリックスの中心にスパークを置いて
開発をしているという話で
ローソンの発注自動化
そういうことなんだ
なるほどね
俺は結構ねスパークネイティブっちゃスパークネイティブなんだよ
そうなんですかね
俺ら独自でさ色々機械学習のモデルこうやって作れるみたいなさ
やってたところからちゃんとシステマチックに開発しようっていうのを
初めて覚えた時にもうスパークがあったからその中に
だからこうやってやるんだって思ってた
そうなんですね
スパークがあると正直どんな大きなデータサイズのものでも
処理って流れるじゃないですか
流れる
あれって結構革新的というかすごい感動的じゃないですか
びっくりした
ですよね
おえーと思って
それでもこんなかかるんだっていうのも思ったしね
逆にね
確かに確かに
コンピューターがフリーズとかせずにちゃんと
コンピューターの数だけ確保すればどんなデータでも
時間はかかるけど処理は動いていくっていうものだから
これすごいよなと思っていて
で今はそのスパークの技術を使いつつ
データブリックする上だと構造化データだけじゃなくて
画像とか音声もちろん文字自然言語も一括で
管理しつつ全部分散処理のスパークを使って
処理を流せるっていうようになっていて
なるほどね
そうだからこれもさっき言ったデータレーカーハウスと
スパークの組み合わせで
どこに置いたデータでも早く呼び出して
それを処理させるっていうところが
かなりスムーズにできるっていうところが
やっぱりデータサイズが大きくなってきている状況でも
処理ができるってことはかなり有用というか
開発者目線だとやりやすいポイント
なんかやっぱこう
データでビジネスをスケールさせるっていう言葉に
ぴったりの機能だよね
そうですね確かに
データ量がスケールしない仕組みでやってるところって
結構あると思うんだよね
データの量が増えてしまったら
もうこれ以上立ち行かなくなるみたいなことですよね
そうそうそうそう
あると思うなあ
まあその壁にぶち当たる前段階のサービスが多い
っていう話でもあると思うけど
なるほどね
分散処理でがっつりやらないといけないぐらいのデータ量を処理する
例えばモデル構築のタスクが
必要なビジネスが世の中にどれぐらいあるかっていうのもあるじゃん
確かに確かに
実際なんかそのもちろん
中規模のサービスであっても
スパークでちゃんとが噛んでいる状態で
分散処理させてやる方が
効率化はしてるかもしれないけど
それじゃないともう成し得ないっていうレベルのビジネスって
結構限られるじゃん
そこまで必要ないっていうケースも全然あるってことですよね
CWX使わずとも
極論なんかデイリーで更新されるデータに対して
学習時間が24時間かかります
みたいなものって最悪もあるじゃん
別に分散させなくても
エラーが入った時に修正する時間のマージンが欲しいとかで
短縮しなきゃいけないけど
極論でもそういうことだから
24時間でさばききれない学習とかモデル構築のプロセスが
必要な業務が一体どれぐらいあるか
みたいなところを考えると
本当にスケールさせなきゃいけないレベルのものなのかな
っていう話もあるよね
間違いないですね
やっぱり中小企業とか
そこまで事業の大きさがない
そこまで大きくない企業は使わなくていいんですけど
一方でもう本当に全国民
全世界中がユーザーみたいな
いわゆるでかいサービスになってくると
必要になってくる技術だと思っていて
データブリックス使っている
データブリックス側から見たいわゆるお客さん
っていうのはやはり日本でも
名の知れた企業がゴロゴロいるんですよ
今回のワールドツアーの東京のやつでも
公演するお客ユーザーっていうところが
かなり名の知れたところで
一つはローソン
あーはいはいはいはい
みたいなコンビニエンス事業をやっている人たちは
かなりのお客データを持っていたり
商品データを持っているから
そうだね
ポスデータの量やばいよね
そうなんですよ
ここくらいの規模までいくと
そりゃまあ使わないとやっていけないよねっていう
データブリックス使わないと処理回んないよねっていうのは
確かになると思っていて
確かに他どんなとこいるんだ
あとはコンサルティング会社で
デロイトが公演してましたね
あとはQTポイント
今もうVポイントになっちゃってるんですけど
はいはいはい
を運営している
CCC
CCCですそうです
俺インターン行ったことある
あそうなんですね
行ったことあるよ
大学生の時に
マーケティングのインターン行った
でもまさにそのマーケティング活用のデータとして
そのVポイントを持っているユーザーのデータを
一元管理して分析してっていうのに
データブリックス使ってたり
へえそうなんだ
って考えると日本の中だけでも
数千万ユーザーみたいなオーダーで
ユーザー数抱えているような企業が
使ってるからやっぱ話してる内容もインパクト大きいし
面白いんですよね聞いてても
へえちょっと登壇者リスト見たいな
ぜひぜひ概要欄に貼っとくんで見といてください
どんな企業が出てたかとか見れると思うんで
通信系もそうじゃない
通信系はドコモが協賛というかスポンサーになってたんで
使ってますねNTT系の事業の
何に使ってるか自分は公開見れてないんであれなんですけど
面白いですよローソンの事例とかは
取りだったんですよ今回の
へえ
愛子って言われるシステムを
今年の4月からリリースしていて
これがいわゆる需要予測と
あと発注業務の最適化をやるシステムで
あ俺それなんかで見たかも
本当ですか
ローソンの発注自動化がめちゃめちゃおもろいみたいな
記事どこかで見たな
めちゃめちゃおもろいですよ
全国14000店舗に対して各店舗の商品だいたい400商品くらいに対して
1時間単位でどの商品が売れるかっていうのを予測して
でどれくらい補充をしなきゃいけないかっていうところまで
すべてAIが出してるっていうシステムなんですけど
へえ
これをどういう風に発注したら一番在庫切れがないか
機械損失がないかみたいなところで最適化かけるんですけど
ここのシミュレーションを何万回何千回何万回かけて回していて
これ1時間単位でやってるんですよ
なのでかなりの計算量が必要で
これはデータブリックしないとできなかったっていう
開発担当者の人も言っていて
確かに
あーじゃあそれはもうさっき言ってたまさに
分散処理で高速化させる
させた先にある時間要求が1時間だから
絶対に高速化させなきゃいけないタスクだね
いやそうですそうです
はえー
いいコメント残してたな俺
でもそうですよ
伏線だ
本当にデータフリックスじゃないとできないような
いわゆる分散処理技術があるからできたサービス
それは鳥だわ
ですよね
規模も大きいですし
そこに至った現場の人とのやり取りだったりとか
難しさ発注業務の難しさとかって話ももちろん
公演の中で言ってたんですけど
ローソンの自動化システム
まあいずれにしてもこのシステムが
全国でリリースされていて
ローソンの店舗ではどんな商品が
補充しなきゃいけないかっていうところが
もうすでに動いてるんで
すげーうわーすげーそれ
人いらなくなっちゃうねまたね
そうですよね確かに
またかー
AIに奪われるなー仕事
ローソンコンビニがそこまでやってるってことは
おそらく他のコンビニもやるでしょうし
スーパーとか
もう徐々に当たり前になってくるから
全国規模で展開してるチェーン店とかは
こういう仕組みがデータブリック使って
実現できていくんじゃないかなっていう
すごい期待感を感じましたね
データだから
棚入れとかが
例えばまだ人ですとかってなっても
無人コンビニとかはさ
Amazon Goとかでさ
技術的には可能なわけじゃん
そうですね
データからそれであれか
ローソンの裏で別に
Google Cloudで持ってるんですってなっても
AWSのAmazon Goで使ってるシステムは
こっちで使って
みたいなこともできるし
発注は自動化されるから
裏に発注して受け取ったものを
裁くロボットがいて
店頭には1人だけいれば
オペレーションもあるみたいな
でもそうですよ
ワンオペでコンビニ回るのは
当たり前じゃないですか
ローソンとかもセルフレジ当たり前ですしね
そうだよね
そっかでもすごいね
だからAmazonのシステム借りてえとかってやって
そっちにデータ蓄積されても
データブリックス上で処理できるっていう
メリットもあるし
まあとにかくいいな
それはめちゃめちゃいいな
そうなんですよね
各店舗やるだろうな
やると思いますよ
1店舗あたりで
1日何千何百回の
シミュレーション回してるって聞いただけ
マジかって思ったんで
コスパ
コスパ見合いがあるってことだもんねきっとね
やってるってことは
そうですねデータブリックス導入して
その処理を前足してるってことは
相当なお金かかってるとは思うんですよ
確かに
開発もそうだしラーニングコストもそうだし
でもローソンほどの大きな企業であれば
そこのROIはちゃんと計算して
ペイできるっていうことなんでしょうね
各店舗のスコアあれなのかなぐらいだったら
夜中の発注にかかってる人件費ぐらいで
1学習
でもまあ1店舗数千円とか
人件費かかってるって考えたら
別にそれぐらいは余裕か
そうだと思いますよ
その店長とか発注担当者の業務が
かなり大変だって話もしていて
そうだよね
人件費が高いからね
やっぱ1日数時間は使うもんね
いやそうですよ
データサイエンスの導入と展望
発注業務2時間だとしても
2千円
いや今の時期は高い
3千円だ
ざっくり2千5百円とか3千円だとして
じゃあ1日の発注の24回回したとして
学習コストとモデルのランニングコストみたいなやつが
1店舗あたり2千円いくかで行かないね
そうしたら余裕で採算取れるな
めっちゃフェルミスイッピンする
なるほどね
なんかさ
俺も1回やったことあるんだけどさ
データサイエンスと呼ばれるものが
いかなるものかっていうのをさ
学生とかにさ
ちょっと頭を使って考えさせるときに
コンビニの事例を使うことがあるのよ
コンビニの売り上げを最大化する
っていうタスクが来たときに
駅地か住宅街それぞれにある店舗で
発注の量とか売り出す時間とか
っていうのって変えなきゃいけないよねみたいな
売れるものも違うよねみたいな
そういうのってどういう条件があって
どういう商品が少なくなるから
どういうのいっぱい出した方がいいと思いますか
みたいなのを
それを考えるのって
突き詰めていったらデータサイエンスになっていくわけじゃん
っていうので
一回大学の授業をスポットで持たせてもらったときに
そういうオリエンテーションみたいなのやったことがあって
それがだからもうローソンでは自動化されてるよっていう話までできるわけだ
そういうことですね
ちゃんとデータを使ってやってるんでデータサイエンスの
すげー
今度事例で紹介しよう
ぜひぜひ
おもろいな
アイコっていうサービスですねこれは
いずれにしてもデータブリックスっていうのが
かなり大きなデータに対して
それを使ってデータ活用して
事業を貢献してるっていう事例がどんどん出てきているので
今のこの時代ビッグデータの時代で
かつパブリッククラウドをいくつも使ってるような
事業者にとってはすごく使いやすいサービスになってきてるんだろうな
っていうところとそれで
企業価値は爆上がりのデカコン
IPOも目前みたいなニュースとか出てたり出てなかったりなんで
かなり注目されてる
事業者ですね
さっき見たらオープンAIスペースX
ストライプに次ぐ4位だったよ
そうなんだ
5本の指に入ってくるんですね
やばい
触っててよかった
そうですね
多分これから使う機会データサイエンスの人たちは
使う機会全然あるんじゃないかなと思いますね
今から勉強する人は
試してみるのありだよね
そうですね
試してみるのありだと思うし
結構資格とかもあるんでそういうところから勉強するのもありかもしれないですね
いい情報ですね
はい
そんな感じで次回は
次回は
MLopsの話をします
俺MLopsあんま知らんのよね
MLopsは機械学習マシンラーニングの
オペレーションのOpsかな
そうなんだ
多分違ったらごめんなさい
本当だDevOpsのOpsだ
そうですなんちゃらOpsの中のMLOps
最近LLMOpsとかいう
生成AIの運用みたいな話もOps使われたりするんですけど
時代は一つ戻ってMLOpsの話ですね
機械学習とかAIモデルを開発したり
してるデータサイエンティストとかAIエンジニアの人が
ちゃんとその機械学習モデルを運用してますかみたいな話を
ちょっとしたいなと思っていて
もちろん普段からやってる人もいれば
やりたいけどできない人とかも全然いると思うんで
そういった人たち向けに
基本的なところから応用事例もしゃべれればいいかなと思ってるんで
今回のDatabricksでもそういうMLOpsにこういうツール使えますよ
みたいなのが結構セッションで語られていたんで
まだまだ注目されている領域なのかなと思うんで
話していこうと思います
隣のデータ分析屋さん今回も面白いと思ったら
フォロー・レビューよろしくお願いします
番組の感想や質問は
ハッシュタグとなりの分析屋
隣のがひらがなで分析屋は漢字でお願いします
また概要欄に貼ってあるお手紙フォームから
コメントを寄せてください
ではまた
ばいばーい
34:27

コメント

スクロール