1. プロジェクトの秘訣を探る Project Design Room
  2. #07-1 AI時代・データサイエン..
2023-12-26 40:20

#07-1 AI時代・データサイエンティストとつくるプロジェクト | 日本プロンプトエンジニアリング協会 代表理事 黒柳茂

spotify apple_podcasts youtube

起業家や科学者、クリエイター、新時代を導く先駆者たちと膝を突き合わせながら、プロジェクトを軌道に乗せる秘訣に迫るインタビューシリーズ。番組では「プロジェクトデザイン」の視点から5つの質問を投げかけ、プロフェッショナルの原動力に迫ります。

第7回目のゲストは、日本プロンプトエンジニアリング協会 代表理事の黒柳茂さんです。

<ハイライト> #データは物事を進めるための道具だ

#マーケティングの前にデータサイエンティストと論点の整理をする価値

#KPIは因数分解で見つかるデータの快楽

#人生を変えるリスキリングの重要性

#生成AI活用の遅滞は国力の低下リスクにつながる

#データサイエンティストと産業の再設計を進める


<5つの質問> #1 VALUE : データサイエンティストはどんな活躍してる? #2 KEY : どんな目的を持っているプロジェクトが、積極的にAIに向き合うべき? #3 RISK : 生成AIを事業に導入する懸念は? #4 CHALLENGE : リスクを超えてプロジェクトを立ち上げるために何が重要? #5 COLLABORATION : どんな人と出会って、どんなプロジェクトをやっていきたい?


■黒柳 茂 日本プロンプトエンジニアリング協会 代表理事

株式会社RIM 代表取締役。データサイエンティストデータを活用した新規事業開発や、組織変革支援を行う。早稲田大学理工学部卒。日本マイクロソフト、フェイスブックジャパンなどを経て、機械学習モデル構築、データプロダクト開発、データサイエンティスト及びデータエンジニアのマネジメントに従事。

■日本プロンプトエンジニアリング協会 https://prompt.or.jp/

■Rim inc. https://rim-inc.org/

00:00
プロジェクト・デザイン・ブルーム
プロジェクト・デザイン・ブルーム
データサイエンスの根本、仮説検知、科学的なアプローチ
100万GBのテキストデータをいろいろ処理して、ダイヤの原石にした
このKPIを伸ばせば、ゴールがめちゃくちゃ伸びるみたいなものを見つけて、みんなで合意したとき、めちゃ気持ちいいです。
プロジェクト・デザイン・ブルーム
プロジェクト・デザイン・ブルームへようこそ。この番組は、企業家や科学者、クリエイター、新時代を導く先駆者たちと未来を対話するインタビューシリーズです。
プロジェクト・デザインの観点で、プロフェッショナルの原動力に迫っていきます。
ナビゲーターはコネル・チザイズカン代表で、プロジェクト・デザイナーの出村光雄です。
本日はですね、スタジオを変えまして、ミドリ・ソウ・バクロ・ヨコヤマを拠点として収録をしております。
これまでの過去の回って、今日第7回なんですけれども、第6回目までは社会的な課題とかクリエイティブみたいなところに話題を置くことが多かったんですけども、
今日は割と打って変わって、データとかAIみたいな結構テクノロジカルなところの軸を置いてディープに突っ込んでいきたいと思っています。
それでは第7回のゲストをお呼びいたします。
日本のデータサイエンス界のトップランナーというふうに言えるかなと思っています。
今年鮮やかに立ち上がった日本プロンプトエンジニアリング協会の代表理事でもある黒柳茂さんです。
ようこそよろしくお願いします。
お願いします。
ということで、まず日本プロンプトエンジニアリング協会を噛まずに言えてよかったなと思ってますけれども、
黒柳さんめちゃめちゃエキスパートなんですけど、もう言っちゃうとめっちゃ友達です。
ものすごい仲の良い寄りかんでやってたので、ちょっとこのマイクを挟んだ感じがめちゃめちゃこっぱずかしいですけど、
このまま一旦進めていきたいなということで、どれぐらいの友達かというと、
もうちょっと自分で振り返ると引いちゃったんですけど、もう20年ぐらい付き合ってるっていう。
ちょっと大学時代ってもう20年も前なんだなっていうのが若干衝撃を受けたわけですけれども、
我らが母校で言うと早稲田大学の経営システム工学科という理工学部の中で出会ったわけで、
変な格好してたなあいつとか色々青い思い出もあるんですけれども、
多分僕の中の人生では一番一緒にラーメンを食いに行ったのが茂ちゃんだったなというような。
03:03
そうかもしれないね。
いっぱいあるもんね、高田のババね。
今あるかわかんないけど千代作とか。
千代作ね。
俺の空とかね。
渡辺とかね。
今日はあそこだよねみたいなかなり細かい舌の状態で店を変えてたなっていうのが。
おかしいなあ。
めちゃくちゃ食ってるなあっていう感覚です。
どこが一番好きだった?
いや俺はね、やっぱ渡辺かな。渡辺のメンマが。
あの魚介ね。
そう魚介のね。
だいたいやっぱ濃い方に行っちゃってたね。
レンはだいたい千代作にゴマめちゃくちゃかけるタイプだったね。
そうそうそうそう。
なんかそういう微細なところまでお互いさらけ出してるっていう状態なんですけども、
今日はどっちかっていうと茂ちゃんのね、知らない世界を僕はちょっと掘っていきたいなというところで。
分かりました。
今仕事のパートナーでもあって、普通に一緒に仕事してるっていうのがね。
そうだよね。
嬉しいところだなと思ってね。
いろんな企業のリサーチを担当させてもらってたりだとか、
それこそ知財図鑑のシステムの開発みたいな感じでね、お世話になったりしてますけれども、
ちょっと前置きはこの辺にしておきまして、
じゃあ進めていきたいと思います。
はい。
今日はAIとプロジェクトデザイン、データとプロジェクトデザインみたいな観点なんですが、
茂ちゃんのこと知らない人もたくさんいると思うので、
一旦簡単な自己紹介をお願いしたいと思います。
皆さん初めまして、黒柳茂と申します。
今株式会社リムという会社をやってるんですけども、そこの代表を務めています。
2023年の4月に日本プロンプトエンジニアリング協会というのを立ち上げて、
本当に日本のビジネスマンの皆様、学生の皆がですね、
生成AIだとかLLMを活用して、もっと日本の生産性を高める、
こういった活動を支援するような協会を設立して、
地道にですね、本当にイベント企画したりだとか、
みんなで情報を共有したりだとか、そういったことをやっております。
経歴なんですけれども、前半、後半みたいな感じで、
今社会人歴どのくらいですかね。
2011年の入社とかでしょ。
そうか。13、14年ぐらいか。そうだね。
前半は結構外資系におりました。
日本マイクロソフトというところと、メタですね。
Facebook、僕がいたときはFacebookですけど、前半は外資系に勤めておりまして、
後半はスーパーシップというですね、KDDIの子会社だったりだとか、
あとは海外のスタートアップの日本支援をするようなアンカスターという会社だとか、
06:04
自分でやってみたりだとか、こういった経歴を持っています。
なんか就活のこともすごい、まざまざと思い出しましたが、
めちゃくちゃ面接の練習とか、お互いねじ込んだなみたいな。
ラウンジでね、やったよね。
なぜこのジャンプが面白いのか、論理的に説明してください。
前にやってたりしながら、いわゆる外資系のコンサルを回ったりとか、
いろいろやって、あそこが内定出たんだ、なんだ、というか、
僕は割と早めにアクセンチュアに内定が出てやめたんですけど、
意外と遅くまでやってたよね。
そうだね、意外とねじ込くやってましたね。
あの時結構外資系流行ってたよね、周りは。
早かったよね、採用がね。
そうだよね、就活長引かせたくないから早めに終わらすみたいな感じもあったし。
マイクロソフトとかに行ってね、ガンガンやってたよね。
やってましたね、ほんとなんかテックセールスみたいな感じで、
基本はテルコ、NTTとかKDDIとかソフトバンクの皆さんを相手に
マイクロソフトのサーバー製品を売ったりとか、そんなことをずっとやってました。
たぶんこの辺も知らない人からするとちょっと面白い話があるかなと思ってて、
たぶんあれだよね、プリセールスSEみたいな、そういう触手でなんそれみたいな感じだと思うんですけど、
一応僕の理解だと、エンジニアといわゆる営業さんの間に挟まっているような触手で、
両方と会話できるから、技術的にもめちゃくちゃ詳しい知識があるんだけど、
ちゃんと非技術者に解説できる人みたいな、なんかそんな雰囲気。
まさしくまさしく、そんな感じだね。
そうそうそう、なので営業の人は本当にお客さんとの関係性だけをフォーカスして、
技術的なフィジビュリティとかは、そういったところになるのがプリセールスSEっていう感じです。
だからなんか結構そのイメージが良くて、口もうまいから活躍してるだろうなみたいな、
想像がつきやすかったし、今僕らがやっぱりその知財図鑑みたいなことで、
難しいことを分かりやすく伝えるっていうのが、すごく好きでやってるんだけど、
なんかその辺は今もリンクしてるなというか、気が合うのはボロボロだよね。
なんかその後の経歴で言うと、結構どっかからのタイミングから、
データみたいなところに結構ずぶっと入っていく感じ。
そうですね、やっぱりFacebookがでかくてですね、
Facebookは本当に全てがデータなんですよ。
09:01
全てのミーティングが一番最初から始まるのが、仮説は何なのっていうことを聞かれますと。
What is your hypothesis?って言われて、それが答えられないと、そもそもミーティングが進まないし、
企画の時にも、じゃああなたの仮説は何?
その仮説をどういうふうに検証するの?っていうところまでをセットにして話さないと進まないっていうのがあって、
本当にデータサイエンスの根本である仮説検証、科学的なアプローチみたいなところはFacebookで学びました。
それはもうなんか部署関係なくそういう感じ?
基本はそうだね、みんなデータを使って証明するみたいな感じだったし、
なのでそこでグッとデータに引き込まれたというか、データを知ってるとFacebookではめちゃくちゃ強かった。
なのでもっと普通の人が知らないようなデータを取ってやろうとか、
そういった自分しか知らないインサイトをみんなに見せたいみたいな欲があって、
もうその時にすごいSQLとかPythonとか使って、みんなが知らないようなデータを持ってきてアドバイスするとかインサイトを語るみたいな、
それが評価されるのがすごい嬉しくて、みたいなことでFacebookで目覚めました。
で、その時に上司がシンガポール人だったんですけど、
そのシンガポール人が、なんかシゲルちょっとデータなんか興味ありそうだから、もう1ヶ月仕事休んでいいよと。
で、本社に行ってこいと。
で、Facebookの本社には当時データブートキャンプというですね、
Facebookの本社のデータサイエンティストが講師として教えてくれる1ヶ月のプログラムがあって、そこに参加してデータサイエンティストになってこいと。
めちゃめちゃいい環境だな。それ何人ぐらい来るの?1回のキャンプ。
そう、1回のキャンプね、8人から10人ぐらい。
だいぶ濃いっていうか、すごい密度だ。
そうそうそう。で、そこから1から1ヶ月がっつり教えてもらって、
で、帰ってきた時にはやっぱり自分はデータサイエンティストになるんだと思って、
そこでなんか人生が、第二の人生って言っていいのかわかんないですけど、そこが方向づけられたって感じですね。
じゃあシンガポール人、めちゃめちゃ感謝しないと。
めちゃ感謝。めちゃくちゃ感謝してます。
でもなんか仕事止まるの大変じゃなかった?それこそ。
そう、意外とね、いけたね。意外といけました。
なんか結構俗人的な仕事ってあんまりなくて、例えば全てのタスクがチケッティングシステムになってるんですよ。
どういうこと?チケッティングシステム。
チケッティングっていうのは、例えばこのバグを直すとか、
例えばこの人にメールを返すとか、あとは何か分析するとか、
12:06
全てのタスクがチケット管理されてるんですね。
例えばこの分析案件だったら、デムラさんにこのタスクを渡しますと。
デムラさんがこういうふうに分析をします。
分析をしたらそのチケットをクローズしますみたいな感じで、
なんかこう俗人的じゃないんですよ。
仕様もしっかりしてて、ドキュメントもしっかりしてて、ある程度誰でもできるようになってるんだよね。
なのでデムラさんが1ヶ月いなくても他の人がそれを取れるし、
っていう仕組みが結構備わってたというか。
でもそれはある意味、スタートアップが大分もてはやされるような時代かもしれないけど、
大企業、スタートアップだけど、めちゃめちゃ人数がいて共通言語があって、
スキルセットがかぶってる人が多数いるからやれる仕組みみたいな。
それはすごくいいところだよね、大きい会社の。
そうするとやっぱり一人一人の評価も見えるんだよね。
例えばバグの修正に関してデムラさんは平均でチケットのクローズが35分でしたと。
そこもデータ化されてるんだ。
シゲルはでも90分かかってて、なんでシゲルパフォーマンスこんなに悪いのってなるし、
なんでこのタスク3日も寝かしてんのみたいなことが上司から連絡してくる。
すべてがデータドリブンで回ってるような。
そのチケットの重みとかも一応カウントされてるって感じ?
そうだね、基本お客さんに対して迷惑かけそうなやつはプライオリティハイとかで来たりとかして。
でもそもそもチケットっていう単位にかなり細かく切られてるっていうところだよね。
そうだね。
ものすごい重いものが1枚のチケットになってないみたいなのはね、あるっていうところ。
いやめちゃくちゃ面白かったんですよ。
やってたんだね。
いわゆる改善方式みたいなことの世界観で生きてる人からすると看板とかね、そういうふうな言葉って言ったほうがわかりやすいかもしれないけどね。
なるほど、そういうところがあったわけですね。
そうですね。それが前半で、後半ちょっと端折りながら話しますけど、
やっぱりFacebookのデータ環境ってめちゃくちゃ揃ってたんですよ。
もっと汚いデータは実際いっぱいあるという話は定説としてあって、そういったところから綺麗なダイヤの原石にしたいなっていう思いがあって、
その時にちょうどKDDIの子会社のスーパーシップって会社があったんですけど、
インターネットの広告、皆さん見てると思うんですけど、あれって裏側ではRTBってリアルタイムビッティングっていうオークションが行われてるんですね。
15:01
そこのオークションの当時の国内シェアナンバーワンだった会社なんですけど、
もう1ヶ月、そのログだけで1PBとか増えるんですよ。
一応復習しとくけど、ギガの上が?
ギガの上がTBだね。1000GBが1TBで、1000TBが1PB。なので100万GBですね。
100万GBのテキストデータをいろいろ処理して、それをダイヤの原石にしたかったんですよ。
っていうところにすごい面白みを感じて、そこは結局5年ぐらいかけて、そこの基盤を作ったりだとか、
この人1ヶ月後に引っ越しそうだねとか、そういうものをインターネットの広告が表示されるウェブサイトの特性見ながらとか、
そういったところでセグメントを作ったりとか、いろんなことをやらせてもらいました。
その時もいろいろ仕事で絡むこともあると。
そうだよね、一緒にやったよね。
データの量が多ければ多いほど燃えてるっていうような感じなのかな。
そうだね。
汚ければ汚いほど生み出した時に褒められるみたいなところもね。
綺麗な環境にいたからっていうのもあるんだけど、汚いところから磨いていきたかったっていうのがあって。
そっかそっか。
あえてアドレナリンみたいな言葉で言ってみたいと思うけど、
世の中的に数字見て興奮できる人って少ないと思うんだよね、多いか少ないというと。
なんなら数字アレルギーですみたいなこともいると思うんだけど、
データサイエンティストの快感ってどんな瞬間に訪れる?
数字っていう観点で?
というかデータと向き合っててついにんまりしているみたいな時とか、
ちょっと俺はあんまりないんですけど、どう?
そうだね、数字っていう観点でいくと、
やっぱりいろんなKPIあるじゃないですか、ビジネスって。
利益だったり売り上げだったり、原価だったり、一人当たりの顧客単価だったり、新規獲得数、既存のユーザー数とかいろんなものがあると思うんですけど、
やっぱビジネスビジネス一つ一つにやっぱりそれって違うと思うんですよ。
そうなった時にそれを因数分解して、KPIツリーみたいに、例えば利益イコール売上げマイナス原価ですと、
売上げっていうのは顧客数かける一人顧客当たりの単価ですみたいな感じで、どんどん試測演算できるように因数分解してツリー状にするんですね。
そうしていくとだいたい20個とか30個ぐらいのKPIで、その一つのKGIって一番上の達成すべきゴールが表せるんですけど、
18:04
その20個30個の中でもコントロールできるものとコントロールできないものってあるんですよね。
例えば原価なんてあんまりコントロールできないじゃないですか。
相手あってだからね。
でも一人当たりの単価とかは自分たちのメニューの価格を上げればコントロールできたりするじゃないですか。
みたいなコントロールできるできないをまず分けて、コントロールしやすいかしにくいかみたいなところもあるじゃないですか。
逆単価上げるのってまあまあねきついというか意思決定しづらいところだったりするので、
そういったことを棚下ろししていった中で、このKPIを伸ばせばゴールがめちゃくちゃ伸びるみたいな。
それ気持ちいい。
そう。
それは気持ちいいな。
こいつだみたいなものを見つけてみんなで合意したときめちゃ気持ちいいです。
まあ確かに結構なんかだいたいこう、例えば経営会議とかって10回やって9回ぐらい雰囲気悪いみたいな。
ずっとその時間じゃないかもしれないけど、やっぱこういろんなこととにらめっこしなきゃいけないようなやっぱつらいところってやっぱあるけど、
やっぱその原因って割と分解しきれてない課題についてみんなで意見を出し合ってて、
そもそもなんかぶつかってるようで観点が違うことを言ってたりすることってたくさんあるよね。
めちゃくちゃあると思うんだよな。
なんかそのこの人はこのKPIについて話してるけど、この人はもっと上位のことについて話してるとか、
そもそも会話がずれている、目的がずれてるからずれちゃうみたいなあると思います。
それはマジでいてほしい。だから結構やっぱ経営会議とかに仕事として入っていくみたいなのある?
そうですね、やっぱりそういったところを突き詰めると、経営会議でここのKPIが一番重要ですよねみたいな話ももちろんしたりします。
予防、またたまに来てください、それは。
ぜひ。
こんがらがってるからね、だいたいね。
そうなんですよ。
ありがとうございます。じゃあもう少し話を進めていこうかなと思うんだけれども、データサイエンスとAIみたいな。
今日は2つキーワードを掲げてるんだけれども、ぶっちゃけ全然意味が違う言葉じゃないですか。
でもAIって必ずデータでできてたりするし、データをすごく極めていくとAIもとても回転が良くなったりみたいな。
なんかそういうふうによく一緒にキーワードとして出てくることが多いと思うんだけど、
実際はどう区別してるとか、どう頭の中でつなげてるみたいなことをちょっと話題に挙げてみようかなと。
21:02
了解です、了解です。
そうですね、まずAIでいくと2つまずあって、生成AIか生成AIじゃないかみたいな。
まずそこが今結構ごっちゃになってるかなと思ってます。
生成AIってチャットGPTとかミッドジャーニーとかテキストから画像を生成するとか、テキストからテキストを生成するみたいなAIなんですけど、
それと従来型のAI、特に機械学習をして、6ヶ月の売上げのデータから次の1ヶ月の売上げを予測するとか、
例えばニュースのこの最初の100文字を見て、それを経済ニュースなのか政治のニュースなのかに分類するみたいな、
そういったところがまずAIの中での分類としてありますと。
ここは結構今ごっちゃになっちゃってるんだけど、しっかり分けて話した方がいいかなと思ってて、
結構今のAIって生成AIを含んじゃってるんだけど、データサイエンティストの僕からすると、いやいやそれだけじゃないよね。
9割以上のAIってやっぱり従来型のAIなので、そこの部分はすごい区別してたりしますと。
AIとデータサイエンスの関係みたいなところなんですけど、やっぱりデータサイエンスってデータをサイエンスする人なんですよ。
なので、科学的なアプローチを取らないと、そもそもデータサイエンスではないというところがまず一つあります。
例えば、じゃあ仮説がなくて、そもそも分析してる人は、僕の中ではデータサイエンティストじゃないですね。
で、例えば精度もわからない状態で、なんかこの生成AI、なんか精度良くなったから、なんかビジネスで使えばいいじゃん。
これもデータサイエンティストじゃないんですよ。
しっかり精度は何パーセントあるべきか、どういうふうに検証するのか、どういう風なリスクがあるのか、
こういったものをしっかり事前に設定して、それに対してちゃんとサイエンスできる人、こういった人がデータサイエンティストかなという感じです。
なるほどな。意味が違うよって話はよくよくわかったんだけど、
でもデータサイエンティストは絶対AIを使えた方が強いと思う。
あーね。やっぱり今のAIの市場規模とか見ると、やっぱり使った方がいいと思う。
でも仮説を立てるとか、科学的なアプローチ方法を決めるみたいなところは、別にAIじゃなくてもいいんですよね。
24:04
回帰分析の話でもいいですし、単純な数学の話かもしれないし。
なので使えた方がいいけど、AIを使って科学的アプローチできない人よりかは、僕はちゃんと仮説を作って検証する人の方がデータサイエンティストとしての価値は高いかなという風に思います。
ちょっとロマンの話もあるよね。
先端すぎると、なかなか言葉で伝わりにくいこともあるかなと思うんだけど、
10年前ぐらいの話で言うと、いわゆるインターネット広告がテレビCMの取引量を上回りましたみたいな話ですよね。
バーンって出た時とかって、広告業界の中で流行った言葉がABテスト。
入りましたね、めちゃくちゃ。
ABテストと言いながらAからZぐらいまで試すみたいな、赤のバナーと青のバナーと黄色のバナーとどれがいいんだろうみたいなことをやってると。
あの時って、とにかく仮説がなくてもいっぱい作って、そこから仮説を生むみたいな。
なんならその過程を自動化していくみたいな。
そこにAIがあるかないかみたいなことは当時はあんまり語られなかったような気がするけど、
ちょうど昨日見たニュースで、アクセンチュアが広告業界と戦を始めるみたいな。
もうとにかくデジタル広告に生成AIを持ち込んで、その場で良き広告を作っていくみたいな。
そんなタイムラインを見てたんだけど、仮説を作るためにAIを使うっていう方法だと結構ハッピーな関係になってくるのかなとかね。
ちょっとその辺がちょっとすごく複雑な話してるんだけど。
確かにな。
すごいやっぱり仮説ありきで科学的なアプローチでっていうのは、
やっぱり理想的すぎるっていうのはすごい分かりますと。
実際のビジネスではデータが物事を動かすために使われてるし、
本当に数字としてこっちの方が効果高いっていう以外の使われ方も結構あるじゃないですか。
特にさっき出村さんが言ってた、
ABテストしてから仮説を後々作るとか、こういうアプローチってまさしくそういうことだと思うんですよ。
27:01
でも物事動くからいいじゃんっていう。
そっちはそっちでめちゃくちゃ大事だと思うんですけど、
それはなんなんですかね。
理学の話なのかな。
ただ俺もめっちゃ割とそっち寄りなんです。
今意見があったなって思ってるんですけど、
AからZまで試して一番良かったやつが正解ってことで良くないみたいな話って、
あんまりクリエイティビティはそこにないというか、
もしかしたらこのAからZの話じゃなくて、
やっぱりあいうえおのうの方が良かったみたいな答えにたどり着けなかったりするし、
やっぱりその仮説を生み出すところって、
次元の違うところには結構たどり着きにくいみたいなことがあるから、
これはちょっとクリエイター目線かもしれないけれども、
いわゆる全部試して決めるみたいなやり方には、
まだちょっとなじめないなっていうのはあるんだけど、
でもやっぱり未来を見ていくとそういうことを、
いわゆる仮想現実の中でシミュレーションしていくみたいなことだったら、
一応一回回しておきましたみたいなこととか、
その上でまた仮説考えますとか、
なんか十分ありえそうだから、
結構この手段と目的がぐるぐるしながらやっていくんだろうなっていうのは。
それはすげえアグリですね。
仮説を作るための実験としてのものっていう立ち位置はすごいあるし、
それってデジタル上になってくると本当そうなってくるんだろうね。
一旦とりあえず回して、
ここが筋良さそうだから、
ここの仮説を考えます。
そのために一回回してみる。
それはあるんだと思うんですよ。
そうだよね。
ちょっと脱線するけどさ、
いわゆる機械学習の方のAIの部分と、
人工生命みたいなものってあったりして、
いわゆる人間の体っていうものをバーチャル空間上に置いて、
そいつがA地点からB地点までできるだけ早くスムーズに移動するっていう目的を作って、
そっから、でもそのバーチャル上の人間は本当に人間第一号みたいな、
アダムですみたいな状態で、
歩くとか立つみたいなことも、
そもそも頭の中に入ってない状態から、
どういうふうにこの体の気候を使うのかみたいなのを、
むちゃくちゃいろんなパターン分析して走らしていくみたいな、
いう過程を見てたことがあるんだけど、
おぞましいハイハイの仕方とか、
足2本と頭でツンノメってやっていくとか、
30:02
ほんといろんなパターンで動いていくわけですよ。
それを生命に対する冒涜だとかっていう人もいたりするんだけど、
なんかやっぱりそういうシミュレーションとか、
一旦バイアスをさておき、
同じ機能を与えてるんだけど全然違うアプローチありえるかもねみたいなことって、
実は今俺ら2本の足で走ったりしてるけど、
なんかちょっと別の手とかも使った方がより効率的に生きてるんじゃないかみたいなことも、
ありえるかもしれないよね。
そう、なんかやっぱりそこが結構データがあることで、
逆にバイアスから抜け出せるようなこともありえるのかなってちょっと思ったり。
めちゃくちゃ面白いですね。
なんか泳ぎ方とかもね、
なんか今平泳ぎとバタフライとクロールとかしかないけど、
そういう強化学習でめちゃくちゃトレーニングさせたら、
すげえ泳ぎ方出てきたりとかもね、そうかもしれないしね。
結構その以後将棋はもうAIに勝てないっていう結論が出ちゃってるけど、
意外と競技スポーツみたいなところに対する発明って起こり得るかもしれないよね。
確かに、それはそうですね。
そういう意味だとやっぱりビジネスって複雑性が高すぎるのかもしれないですよね。
なんか将棋とか以後って、とはいえ全ての通りって数学で計算できるじゃないですか。
で、競技スポーツも人間の可動域とか筋肉量の最大量とか、
そういった形である程度スコープ決まるかもしれないですけど、
ビジネスって自分もいるし、競合もいるし、ユーザーもいて、
どんどん経済が変わっていって、
そこをシミュレーションするっていうのはまだできないのかもねって思った、今の話。
できないかもねって思ったんだ、逆に。
できないかもねって思った。
でもなんか僕がさっきの話で、
データは行動を前に進めるためのものだみたいなことがね、
一ついいキーワードだなと思って。
押し進めるのは人だったりするわけじゃないですか。
なんか気持ちよく進められるんだったら、正解じゃなくてもいいんじゃないみたいなことは。
ありますよ、それはそうだと思います。
僕も何回正解じゃないことを物事を進めるために、
押してきたかっていうのはめちゃくちゃあります。
そうだよね。
どっちかっていうとそれが後から分析できるような状態に伏線を張っとくかとか、
そういうことだったりするよね。
そうだね、そう思います。
あとはそれがワンショットの案件とかだったら全然いいんですけど、
それは繰り返し今後社内で100回意思決定されるようなものであれば、
33:01
そこはあんまり許されるべきではないことかなと思う。
どういうこと?例えば100回意思決定がされるって。
例えば、AとBっていうものがあって、
Aの確率が51%で、Bの確率が49%にするじゃないですか。
ワンショットの案件で、すいません、Bって言ってくださいだったら、
Bって言えばいいと思うんですよ。
ちょっと確率が低いってことね。
そう、ちょっと確率低いけど、
Bをやることによってその案件がもっともっと先に進むんだったら、
それでいいと思うんですけど、
例えばこの51%、このAとBが今後100回繰り返されますと。
ってなった時に、やっぱり51かける51かける51かける。
福利的にどんどん増えていくものと、
福利的に下がっていくものがあった時には、
やっぱりそれは51って言うべきだと思うんですよね。
なるほどね。だからどういう意思決定をするべきかは、
プロジェクトの期間とか、そういう連続性みたいなことにも
結構よって判断が変わるよねみたいな。
そうですね。いいなあ、このすげえ抽象的な話が好きだから、
なんか嬉しいなあ。
すいませんね、なんか抽象的すぎますよね。
皆さんわかりづらいかもしれないですけど。
でも、うん、わかるわかる。
じゃあちょっと前半戦の最後、
ちょっと締めくくっていこうかなと思うんですけど、
今2023年の12月っていうところで、
あと7年ぐらいか、2030年っていう
1つの10年単位のサイクルが回っていくわけなんだけれども、
子社会の中でAIとデータサイエンティストの関係って
なんかどういうふうに変わっていくとか、
ちょっと未来的な視点で思っていることって最近ある?
そうですね。
今すごいAIの没効というか、
みんな生成AI使いたがってるし、
みんなAIAI言ってるじゃないですか。
で、いろんなサービスが増えていく中で、
とはいえ、さっきの副理的な話にかかってくるんですけど、
そのAIのモデルがどれだけサステナブルかとか、
どれだけ、なんだろうな、
堅牢かというか、
そういった力はやっぱりデータサイエンティストの力に
大きく関わってくるんだろうなと思ってて、
例えばさっきのAとBの話でも、
いや絶対これから100回試行される、
なので51%のAを取っておくべきだとか、
そういったしっかり数字に基づいたデータサイエンティストがいるチームと組織と、
とりあえずAIは今流行ってるから、
36:00
どんどんその波に乗っていこうぜっていったときに、
これから7年、めちゃくちゃ時代変わると思うんですよ。
モデルも変わるし、状況も変わるし、
こういったときにデータサイエンティストがいるかいないかで、
そこの変化の対応の迅速さとか、
本当にこっちのAを取っておくべきだったっていう助言をしてくれる、
本当にデータが好きな、データで意思決定をする人がいるかいないかで、
めちゃくちゃそこが変わる気がしてます。
大体わかったなって思いつつね、
サステナブルかどうかが大事っていうところに、
もう少しちょっと思ってきたくて、
そのサステナブルの意味はどういうことで作ったんだろう?
例えば、生成AIだと最近チャットボットみたいなので、
いろんな質問できるようになってるじゃないですか。
例えば、ユーザーの性質が変わってしまいましたと。
例えば、先月までは30代の女性が多かったけど、
広告をすごいガンとアクセル踏んで、
40代、50代の男性も入ってきました。
ってなったら、質問する種類も変わってきますよねと。
そうすると回答の精度とかも結構下がっちゃったりすると思うんですよ。
なるほど。
っていうことだとか、あとはモデルもGPT-4とかから、
これから10年かけてどんどんバージョンアップしていくと思いますし、
オープンAIだけじゃなくて、アンソロピックとかGoogleとかも出してるから、
そういったモデルが変わったり状況が変わったときに、
今のこの2、3ヶ月のスナップショットだったら、
その精度保てると思うんですけど、
これが半年後大丈夫、1年後大丈夫、7年後大丈夫っていう、
ここのクオリティを担保する人がデータサイエンティストなのかなっていう。
その意味でのサステナブルってことですね。
なるほどな。結構長い目線でそれを評価するってことだけど、
めちゃめちゃムズそうだね、それね。
めちゃくちゃムズいと思う。
何ならそういう新しい職業ができてもいいんじゃないかっていう感覚だね。
そうだね。
最近だとLLM Ops、Large Language Modelの運用のことをLLM Opsとか言うんだけど、
常に1週間に1回、精度をチェックする人間の人がいて、
これをチェックしてその精度が8割切らないかどうかを常に担保するとか、
それがまた人間なのが皮肉で面白いね。
そうなのよ。機械学習の場合って売り上げの予測を立てました。
それが本当かどうかって1ヶ月後わかるじゃないですか、実際のデータとして。
でも生成AIの場合って、カスタマーサポートの回答文を生成しますみたいな。
39:04
この生成文が本当に正しかったのかどうかって、まだやっぱり人間じゃないと評価できないんですよね。
LLM機嫌とかありそうだしね。
あるのよ。
なんそれみたいな。
昨日と全然レスポンススピード違くないみたいな。
毎回結果も違うしね。
すごいなんか想像した。
誰か監視してる人がカップ麺上からパソコンにこぼしちゃった可能性とか、
そういうどうでもいいことでクラッシュしてるんじゃないかとかぐらい急に機嫌悪くなったりとかね。
するよね。
なんかまだそこ人間が見てるっていうのも面白いなって。
逆に生成AIは人間が評価するが今多分ベストアンサーなんだと思う。
そこが難しさでもあるかなと思ってます。
そこをめちゃくちゃ深掘っていくことが好きな人は、今は割と需要が高い職業になれるかもしれないね。
そうですね。
なるほどありがとうございます。
では後半入っていく中でプロジェクトデザインみたいな観点をちょっと強めていけたらなと思いますが、
いったん前編はここまでになります。
ありがとうございます。
プロジェクトデザインルーム、この話の続きは後編で。
40:20

コメント

スクロール