16_データサイエンティストのこれから
はんなりポッドキャスト16回は、最近GoogleのGenerative AI Summit Osakaに参加したことで刺激を受けたおがわが、かいせんと生成AIとクラウドとを混ぜ込んだ、データサイエンティストのこれからについて話します。
生成AIもデータをつなぐことで、自社に適したことが出来るようになってきた今、クラウドを使うのも大事だなーという話とかを繰り広げています。あと、イベントで聞いたキーワードとして重要だったのは「非構造データが生成AIにより分析できるものにできる」とのことではないかと思っています。
2024年はクラウドも頑張っていきたい。そんなことを考えた会でした。
SHOW NOTE
データ分析とクラウドのはなし
生成AI
かなりもりあがっているような気配
OpenAIのAPIを使ってみたり、Azure OpenAI Serviceを使ってみたり
chatGPTだけではなくて他のサービスも盛り上がりそうな気はする
クラウド
Azureに入門してみたが、わりと使いやすい
コストは高めな気がする
パーツの組み合わせ、とはいうものの慣れていないと複雑なアーキテクチャは実装できないような気もしたり(苦戦中)
2024年に盛り上がりそうな話題
個人的にはデータパイプライン構築やデータ分析基盤構築に手を出したいとは思っている
Microsoft Fabricかなー
これまでやっていたデータ分析をできる限りオートメーション化する方向
生成AI以外にまた何か出てくると面白いのになー
Web3はすっかり元気がないように見えるけどどうなんだろう
参考資料
生成AI時代のデータエンジニアリング入門~Google Cloudで実現する生成AIデータエンジニアリングの第一歩~ https://cloudonair.withgoogle.com/events/generative-ai-summit-osaka-23q4/resources#
サマリー
データサイエンティストのこれからについての話題です。オフラインでの交流の重要性やGoogleの生成AIの開発などが話されています。GCPのイベントでの話から、クラウドに投げることの有用性や、生成AIの活用方法について考察されています。データサイエンティストのこれからでは、アーキテクチャパターンやクラウドの資格取得、生成AIの注目、Web3の動向について話し合われています。カイセンさんとデータ分析基盤構築というテーマで話し合われ、Web3によるデータ分析の自動化や非構造化データの分析方法など、生成AIの進化による影響について考察されています。2023年に盛り上がりそうなデータ関連の話題として、データパイプラインとデータ分析が注目されています。これらのトピックがデータサイエンティストのこれからに大きな影響を与えることが予想されます。