Software Engineer としての AI 技術との付き合い方 (Takayuki Watanabe)

自己紹介とテックトーク

ken

London Tech TalkのKen Wagatsumaです。本日は、Asaiさんが旅行でお休み

ということで、私のほうでゲストの方を呼びして進行していこう

と思います。今日は、Takaさん、 Watanabe Takayukiさんにお越しいただいています。

今日もよろしくお願いします。

Takayuki Watanabe

よろしくお願いします。

ken

Takaさん2回目ですね、収録。

Takayuki Watanabe

2回目ですね。

ken

前回は38回目のエピソードですね。

タイトルが、マシンラーニングでテスト運用を高速化する

ロンチャブルトアという題で出ていただきましたが、結構間も空いて

しまったので、最近から聞いてくれているリスナーの方に向けて、改めて

Takayuki Watanabe

自己紹介をお願いしてもいいですか。

わかりました。Watanabe Takayukiと申します。会社とかではTakaさんとかTakaとか呼ばれている

ことが多いんですけども、 Watanabe Takayukiと申します。今はソフトウェア

エンジニア、特にマシンラーニング周りのソフトウェアエンジニア

をやっていて、マシンラーニングを使ってプロダクト開発を中心に

行っています。

ken

ありがとうございます。ということで、 Takaさんと僕はCookpad時代の同僚

でもあり、とりあえず技術のアンテナがすごい張っていらっしゃる方で、

とりあえず技術の話をしたかったら雑に話しに行く人っていう感じ

の中で、いつも参考にさせてもらっているんですが、今日はロンドン

テクトーク初めての取り組みでお便りをいただきまして、そのお便り

の内容を踏まえて話していこうと思っています。数週間前の収録

でお便り募集していますという公開をしたんですが、その後嬉しい

ことに3通ぐらいお便りがきまして、その中の1人の方、収録の中で取り上げ

てもいいということだったので、 Takeさんという方からお便りをいただき

ました。最初に読ませていただきますね。いつも楽しく拝聴しております。

ChatGPTやGitHub CopilotなどAI技術を業務でどのように利用している

のかお聞きしたいです。また、これら AI技術との向き合い方やエンジニア

の将来についての考察をお聞きしたいです。以上よろしくお願いいたします

AI技術の進化と情報収集

ken

というお便りをいただきました。ありがとうございます。ということで

今日はなんかちょっとラジオっぽくなって

Takayuki Watanabe

きましたね。

いや、お便りいいですね。自分も好きですね、こういうの。

ken

めっちゃ嬉しかったですね。タカさんラジオとか聞いてました?ラジオっ子

ですか?

Takayuki Watanabe

いや、ラジオはあんま聞いてないけど、ポッドキャスター聞いてる

から、ラジオみたいなもんなんかな。どうなんすかね。ポッドキャスター

みたいな。同じみたいなもんですね。

ken

なかなかフィードバックってもらえないので、こうやってフィードバック

Takayuki Watanabe

を入れると結構嬉しいんですよね。なんかツイッターにツイート

ken

すると。

うん、そうですよね。

そう、なんか最初の頃の方は結構聞いてくれてる友人にダイレクト

に聞きに行かなきゃわからなかったですけど、最近こういうのも増えて

きてすごい嬉しいなというところですね。ということで、タカさん

をお呼びしたのは、本業の方でも結構マシンラーニングとかをされている

し、その技術に対する雑談しててもいつも僕を面白くさせてもらってる

ということで、このトピックだったらタカさんをお呼びしたいなということで

今日呼んでますということで。AI技術って結構幅が広いので、お互い

気になってるサービスとか普段どういったことをしてるかとか、そう

いったことについて雑談していけたらなとは思ってます。

Takayuki Watanabe

そうですね。楽しそうですね。

ken

そうそう。いつもタカさんと雑談するけど、今日トピック縛りでやって

くみたいな、そんぐらいのラフな感じのイメージ。

Takayuki Watanabe

トピックだけね。

ken

トピック縛らないといつもいろんな話あっちこっちしちゃうから。

Takayuki Watanabe

そうですよね。でも一応ソフトウエアエンジニアとしてってことですよね、

ken

多分。

そうですね。エンジニアの将来についての考察みたいのもあるので、ソフトウエア

エンジニアとして何か考えてることとか意見とかがあればっていうこと

も、もしタカさんのほうであったらぜひ聞いてみたいなと思ってます。

Takayuki Watanabe

はいはいはいはい。いや、まあ何だろうな、時代の流れがすごい早い

なって感じるのは多分皆さん同じだと思うんですけど、AI、チャットGPT

とか出てき始めてから、なんかこうツイッターとか見ると毎日なんか

こう驚き話みたいなのが、今朝もそうですけど、何て読むか分かんない

けど、オープン映画ソラーってサービス流してたじゃないですか、動画を生成

する。

ken

いや、それ持ってないです。どういうやつでした?

Takayuki Watanabe

テキストインプットすると60秒ぐらいの動画生成できるっていう新しい

モデルをリリース、リリースしてるっていうか今研究中なのかな。多分

セキュリティとかその方法とか、あと安全性とか今確認してるところ

だと思うんですけど、まあそれのなんかデモみたいな、デモサイト

みたいなの、今朝立ち上げてて、なんかこうわちゃわちゃみんな騒いで

ましたね、朝。

ken

おお、じゃあ例えばテキストっていうイメージで言うとね、ステーブル

ディフュージョンとか読みですけど、じゃあそれが動画版みたいな感じ

Takayuki Watanabe

ですか?

そうですね、そうですね、そういうイメージだと思います。あとは

GoogleはGeminiっていう新しいエンタープライズっていうか、なんだろうな、Google

が推してる生成ファンデーションモデルの新しいやつ、Geminiってやつがあるん

ですけど、それのなんか1.5とか出してきてて、それはなんかこう、今まで

のOpenAのChatGPTっていうかGPT4とかだと、なんかコンテキストのサイズ

が限られてて、みたいなのあったんですけど、それはなんかこう、いき

なり100万トークン入れられますみたいになってて、だからバチバチ

火花を飛ばしてるんですけど、そういうのが毎日起きてるので、すごい早い

最新のトピックと企業間の競争

ken

ですよね、時代の流れっていうか。

進化早いですよね。そのGoogleの Geminiっていうのは、それは何を指してるん

ですか、具体的に。なんかプロダクト群みたいな感じ?それとも具体的な

Takayuki Watanabe

モデル?

モデルですね。モデルで、そのマルチモーダルなモデルで、OpenAIでいう

ところのGPT4の対コバだと思っていれば間違いないと思いますね。

画像も認識できるし、おそらくYouTube とかを使って学習してるので、画像

も認識できるし、動画も認識できるし、もちろんテキストも音声も認識

できるでしょうと思ってるんですけど、そういうGCPが出してるところの

トップのモデル、新しく出てきたモデルがGeminiってやつですね。日本語

だと何て言うのかな、Geminiっていうのか。

ken

Geminiみたいな?英語だとGemini みたいな感じですよね。

そうだと思うけど、はい。

トレーニングデータとしてYouTube とか使えるっていうのはめちゃくちゃ

デカいですよね。

Takayuki Watanabe

そうですよね。でも使ってるでしょうね、と思いますけどね、OpenAIも勝手

に。

ダウンロードしてるみたいな感じ? 規約が許せばやってるでしょうね。

だってどっから学習データ持ってきてんのって言ったら、多分そういう

ken

ことだと思うんですよね。

でもトレーニングデータ合戦みたいになってるようなところも

あるんですかね。どれだけ品質のいいトレーニングデータを大量に

ぶん回せる計算機資源があるかみたいなところ、体力勝負みたい

Takayuki Watanabe

になってたりするんですかね。

たぶん計算機資源の勝負だと思うんですよね。もちろんデータの

質っていうのもあるんですけど、データの質っていうかデータの量

で、数の暴力じゃないけど、とりあえず数回してモデルを作るみたいな

のがたぶんデカい企業がやってるところで、小さいところはデータ

の品質を上げていくみたいなのをセコセコやんなきゃいけない。もちろん

めちゃめちゃ第一だと思うんですけど、データの品質が良ければ良いほど

学習の精度も上がるっていうのはあると思うんですけど、それより

は思考停止じゃないけど、とりあえず食わせりゃいいんやっていう感じ

でデータの量を増やしてるって感じだと思いますけどね。

ken

そうですよね。それに応じて多分半導体企業とかもだいぶ儲かってる

イメージがありますね。

Takayuki Watanabe

そうですね。まさしくそうですよね。 GPUなり半導体なり、めちゃめちゃ

儲かってますね。

ken

そうですよね。普段はそういった情報をどうやって、たぶん無理に

キャッチアップしようとしなくても、例えばTwitterとか普段の雑談で入って

くると思うんですけど、信頼できるソース源とかキャッチアップで

Takayuki Watanabe

意識してたりとかしますか?

自分はTwitterで信頼できる人をフォローしてるってのもあるんですけど、

基本的にはRSSみたいなのを使って OpenAIのリリースノートとGCPのリリース

ノートと、あとAzureのリリースノートを見てますね。AWS単ながらあんまり

ないので、今のところはその3つが自分はクラウドサービスを使うことが

多いので開発で追ってますね。何か出てきたら、じゃああっちはどう

なってんだろうみたいな感じで調べていくと、大体慌てて出して

くるので、似たようなのがあるという感じですね。

ken

なるほどね。確かにその情報収集の手段ってソフトウェアエンジニア

ならではというか、モデルがどうとかリサーチペーパーがどうという

プロダクト開発に活かせるレベルのものというか、プロダクトが今

何あるかどうかみたいなところなんで、そこから入っていくっていう

のはいいですよね。じゃあ実際に出てきて、今日今週末趣味プロで

作れるかどうかみたいなのほうが多分新しい。最先端のリサーチで

何が研究されてるかを知るより、ソフトウェアエンジニアとして

Takayuki Watanabe

結構生きてくる知識だと思うので。そうだと思いますね。特にリサーチ

はもう本当に数が多すぎて多分追えないんでソフトウェアエンジニア

レベルだと。なのでどっちかっていうと、そういうトップを走ってる

企業がどういうAPIを提供しだしたとか、例えば去年とかだとマルチ

モーダルっていつできるようになるんだってみんなの関心事だった

と思うんですね。マルチモーダルっていうのはテキストだけじゃなくて

画像とか音声とかそういうのを入力して新しい言葉なり画像なり

を生成するときにマルチモーダルっていうんですけども、去年の秋

ぐらいまでは多分テキスト一択だったんですね。テキスト一択って

いうかテキストしかインプットしてもできなくて。ですが秋、冬

ぐらいからチャットGPTが画像も取り込めるようになったりとか

Googleも画像を認識できるモデルを出してきたりとかそういうの

があれですよね。あっちがどっちで来たらやっぱ慌ててこっちも

出してくるみたいなのがやっぱりあるんですよね。

ken

予想原理が働いてますよね。

Takayuki Watanabe

そうそうそう。すごい働いてるんでなのでトップの企業を追っておく

AI技術との付き合い方

Takayuki Watanabe

だけでとりあえずいいんじゃないかなと思いますけどね。ソフトウェア

エンジニアとしては。

ken

情報量が多いんでね、本当に効率よく情報収集しかないと情報の

海に溺れてしまうというか。

Takayuki Watanabe

そうですね。特に知らない領域だからどこから足を踏み入れて

いいかみたいなところあると思うんですけど、それで論文とか

言っちゃうと、論文マジで無限にあるんで、そっちは行かないほう

がいいっていう。

ken

うん。やらないこと、勉強しないことをちゃんと明確にするって

いうのも結構重要ですよね。

Takayuki Watanabe

重要ですね、たぶん。

ken

ちょうどいいリストじゃなくて、やらないことリストみたいな。

Takayuki Watanabe

あとはトップダウンというか演劇的な学習と機能的な学習がある

と思うんですけども、使ってってなじんできたらこれが何なんだろう

とか、これがどういう原理で動いているんだろうみたいなってたぶん

興味自然と持つと思うんですよね。そしたらその技術を実現してる

基本的なことを学ぶみたいなのはやってもいいかなと思うんですけど、

全ての最新リサーチペーターの骨の髄まで噛み締めるみたいな

のはたぶんいくら時間があっても足りないんで、自分だったらやらない

ですね。

ken

その考え方面白いですね。演劇的に学ぶか機能的に学ぶかみたい

なことで。

それこそ、立ち上げ一番最初はどっちを意識してやってました?

とりあえずチュートリアルとかを見て、とりあえずいろいろ書ける

ものを書いて、知りたいトピックがあったら、今度はちゃんとまとま

ってるテキストとか、ビデオインストラクションとか見に行くみたいな、どっち

でやってました?

Takayuki Watanabe

それよりもっと浅いところから始めましたね、自分は。どっちか

というと、すでにプロダクトになっているものを触るみたいな感じですね。

例えば、チャットGPTなんて一番最多のものだと思うんですけど、

すごい触りやすいじゃないですか。ウェブアクセスしてテキストを入れる

なり、画像を入れるなり、何してもいいんですけど、あれでやってる

ことができるんだなみたいなのがわかるじゃないですか。

ken

なるほど。まずはユーザーとして触れるということですね。

Takayuki Watanabe

これ何ができるんだろうを理解するっていうのが多分、メンタルモデル

っていうか、今理解しようとしている技術は何ができるんだろうっていう

のがやっぱり一番大事ですよね、最初に。

ken

なるほど、確かにそうですね。自分がユーザーとして持っている課題

の何を解決してくれるのかっていうのは、触れてみないとわかんない

ですよね。チャットGPTで面白いネタとか、例えばポエムとか作ってくれる

のは楽しいけど、じゃあ実際に普段の業務とかでどう生きてくる

かっていうのは、そこが結構大事だと思うんですけど、結構チャット

GPTが出てきて、他の人もいろんなこう使ってみましたみたいな情報

も出てきた中で、今現時点で日常ではどんな使い方してますか、業務

とかプライベート。

Takayuki Watanabe

そうですね。プライベートでも業務でも結構使ってますね、チャットGPT

は。例えば一番わかりやすいのはあれですよね、文章構成とかです

よね。チャットGPT、生成AI今出ているチャットGPTとかって、ファクト

をもとにそれをちょっと修正したりとか、新しい文章を作ったりとか

ってすごい得意なモデルだと思うんですよね。なので例えば、自分

英語で普段業務してるんですけど、バーって適当に英語を書くじゃない

ですか。その後に、もっとカジュアルにできるとか、あとは違う表現

あるみたいなのを聞いてみると、自分の勉強にもなるし、間違った

ところを指摘したりするんで、そういう使い方もできますよね。

ken

そうですよね。そっか、確かにタカさんの現場は英語環境ですもんね。たぶん

読み書きは全部英語ですよね。

読み書きも、はい。

チャットGPTの使い方

ken

なんかこう大事なデザインドックとか、大事なアナウンスメント系

とかは僕もそういうふうな使い方しますね。なるべくミスをなくしたい

文章。なんかチャット全部、わざわざチャットGPTに聞いたりはしない

ですけど、スラックのメッセージとかね。これは良い品質のアウトプット

を出したいみたいなときは、文書構成とか、あとはタイプ修正したり

Takayuki Watanabe

とか、あとは言い回しとかやってますね。

なんか、いくら勉強したところで、なんかこうネイティブ、どれだけ

ネイティブに我々が近づけるかどうか知らないですけど、チャットGPTとか

ネイティブの英語から学習してるから圧倒的に構成能力が、てか

あれですよね、そもそも出力のスピードが速いじゃないですか。

速いですね。

あのスピードでタイピングできないから、自分は。

ken

できない、できない。人間にはできない。

Takayuki Watanabe

そう、だから同じことやるとしても、例えば何だろうな、自分も書くんだけど

要を挑んで指示であたつしてあっちに書かせながら自分も書いといて

比較するみたいなのは面白いですよね。やったりしますよね、普通に。

ken

確かに確かに。英語の先生になってくれるって感じですよね。

そうそう。

みんなこうティーチャーというかインストラクターみたいな使い方

をしてる人も結構いますよね。プログラミングの学習をするとか英語の学習をする

とか、それでちょうど今日同僚がやってて面白かったのが、旦那さん

がプログラマーの方なんですけど、旦那にプログラミングのことを

聞くとすごいオピニオネイティブでオブセスのような答えが返って

くるんだけど、ちゃんとGPTはニュートラルに返してくれるから超勉強しやすい

って言っていて。なるほど、そういう考え方もあるなと思って。どんだけ

シリーなクエスチョンをしてもちゃんと丁寧に答えてくれるから

Takayuki Watanabe

ね。

ken

そうですね。

Takayuki Watanabe

丁寧にならないみたいな。面白い確かにそうかもみたいな。

あれですよね、疲れて疲れるのか知らないけど、気兼ねなく聞ける

っていうのは間違いなくメリットですよね。人間だとやっぱ時間って

あるじゃないですか。ZGPTもマシン時間はあるかもしれないけど、ある

と思うんですけど、とはいえ気軽に聞けるから、アシスタントとして

使うっていうのはすごくいいと思いますよね。チャットボートとかそうだ

と思うけど、よくある。

ken

ちなみに他のPodcastでも話して面白かったトピックとして、チャット

GPTとかモデルとインタラクトする時に、例えば質問するじゃないですか。

質問の聞き方をどこまで丁寧にしてますかみたいなのがあって、

だからこう人だったら例えばCould you please tell me somethingみたいな

感じ、もっとこう相手がロボットだってマシンだって分かってれば

すごいもっと雑に言ってもまあいいっちゃいいじゃないですか。そこら

Takayuki Watanabe

辺結構いろんな人がいるなと思って、タカさんそこら辺どうですか。

タカさんは結構丁寧に聞いてるかもしれないですね。日本語でも

英語でも。なんかあんまりそこを短くしても大差ないし、人間みたい

に聞いてますね。

ken

ねえなんかそこら辺面白いなと思って、僕どっちも試したんですけど

なんか答えに品質が変わるかっていうのはちょっとまだ分かんないん

ですけど、なんとなく会話的にやるという意味だと多分人間と接している

ようにやった方が自分も多分書くのが楽なので。僕も今のとこは

どっちかというと人間に話す的な寄りですよね。

Takayuki Watanabe

まあただ多分話し言葉も読み言葉もどっちとも使って学習してる

ken

と思うんで、どっちともあんま差はないと思うんですよね、おそらくね。

確かに確かに。なんかこう自分がタイポとかしたりアメリカ英語と

イギリス英語を混在したようなやつ打っちゃっても、いい感じにコンテキス

読んで返してくれちゃうんで、そこは自分でちゃんとしないとなと思

ってますね、英語力というか。そこはなんかこう空気かなり読めちゃう

ので、ちゃんとGPTって。

Takayuki Watanabe

そうですね。

ken

あとはなんかどんな使い方してますか、文書構成以外では。

オープンコミットの活用法

Takayuki Watanabe

そうですね、なんかまあ最近やってんのはコミットメッセージ書かせたり

してますね。

ken

あーなるほど。

Takayuki Watanabe

はい、まあ趣味のプロジェクトではオープンコミットって会社のやつ

では使ってないんだけど、趣味のプロジェクトではオープンコミット

ってやつ使ってて、それがGitのDiff とかを使って、そこからコミット

メッセージを自動生成するみたいな処理をしてくれるんですけども、

それ使ってますね。

ken

面白そう。

オープンコミット具体的な使い方としてはどういうふうに使うん

ですか、ブラウザーアプリですか、エクステンションみたいな感じ

Takayuki Watanabe

CLIですね。CLIで手元にノードか何かでインストールして、グローバル

のやつでインストールしてオープンコミットみたいなコマンドを打つ

ken

と、そのGitのDiffからコミットを生成してくれるっていう感じですね。

Takayuki Watanabe

面白い。精度とか品質はどうですか、使ってみて。

バーボースっていうか冗長な突起が結構多かったりするんですよね。

だけど使ってて、なんでこれがこんなに長いんだろうなとか気になって

その構造とかを読むと、なるほどね、こういうプロンプトワート

してるんですねみたいなのがあるんで、そういうのは面白かったですけど

そういうのはいいですよね。

ken

なるほど。それでレポジトリのコンテキストとかも読んでくれるん

ですかね。例えばオープンソースのライブラリーとかだとコミット

メッセージの規約の作ってるところとかあったりするじゃないですか。

例えば小文字で始めてねとかバーブで始めてねとかそういうところ

にコントリビュートするときにはレポジトリの過去のヒストリー

とか規約が書かれているマークダウンもしくはリントファイル

みたいなのを見てやってくれたりするかって分かりますか。

Takayuki Watanabe

いやそれはそこまで知らないけど多分オープンコミットは純粋に

diffだけですね。っていうのはコードとかを勝手にプロンプトに入れ

ちゃうとすごい量になっちゃうからお金もすごいかかっちゃう

しそれが正しい情報になるかっていうのは微妙だからdiffからそのコミット

メッセージを生成する、diffとファイル名から生成するっていうのはまあ

メイクセンスですよね。当たらずも当たらずって感じでコミット

メッセージなんて修正できるしアメンドすれば。

ken

なんかこのdiffからいろんな価値がある情報を出すみたいなのって

結構パッと思いつくネタだと思うんですけど、なかなかそれプロダクション

レベルまで持ってくるの難しいなと思って、例えばdiffプルリク

を出すじゃないですか、GitHubのボットかアクションかなんか作って

そのdiffを見て、例えばそのプルリクのリスクレベルとか、SQLが入ってる

ならスロークエリとかなんでもいいんですけど、これを本番に

デプロイするとバグにつながりそうとか、あとはこれかなりと

ソフトウェアエンジニアとAI技術の付き合い方

ken

ステージングで結構違うよみたいなのか、例えばそういうデプロイした

後の影響みたいなのを読み込ませようとするとdiffだけじゃ全然できない

というか、すごいフォルスポジティブな答えも返ってくるから、結局そう

なるとレポジトリとかdiff以外のコンテキストを読み込ませなきゃ

いけないってなって、そこら辺はまだまだこう結構頑張って作り

込まなきゃいけないシステムだなと思ってますけど

Takayuki Watanabe

そうですね、ただその効果的なクエリをかけてるかかけてないか見た

のはスキーマーとクエリを比較するだけで実行する前にもう分かる

こと、オプティマイザーがちょっと違うかもしれないけど、簡単には

分かるじゃないですか、インデックス効いてないよとか典型的にある

と思うんですけど、そういうのは多分事前にキャッチできると思

うんですよね、実行しなくても

ken

確かに、レポジトリというかサービスごとに使ってるデータベースの

バージョンとエンジンとかを渡すとそれに最適化した答えは考えて

おくれそうですね

Takayuki Watanabe

いや、それもそうだけどスキーマーでインデックスとテーブルの絡む

があって、それに対するSQLがさえあれば考えられると思うんですね

これはオプティマイザーレベルの話じゃないけど、機構造レベル

の話ではないけど、一般的にはこれは効いてないからインデックス

を貼ってくださいとか、そういうのは簡単に

ken

貼るべきインデックスを貼ってるかどうかとか

Takayuki Watanabe

うん、これで貼れますとかは出せると思いますよ

ken

インデックスの貼り方も何インデックスにするのかとか確かに

Takayuki Watanabe

そうそう、コンポジットインデックスにするとか、ユニーク性を貼って

くださいとか、そういうのはできると思いますよね

ken

確かに確かに、これぐらいだったら誰か作ってそんな感じもするけど

Takayuki Watanabe

うん、できると思いますね

ken

なるほどね、オープンコンピューター知らなかったですね、面白い、ちょっと

後で使ってみようかなと思います

Takayuki Watanabe

あとは開発、これから多分開発がこのままプログラミング原稿で続く

か知らないんですけど、もしかしたらもっと機械学習が使いやすい言語

にもしかしたら自然言語になってくるかもしれないけど、開発は生成

AI前提でテックスタックを選ぶみたいなのはちょっと考えたほう

がいい時代に差し掛かってはいますよね

確かに確かに

例えば未熟な、借りた技術と借りてない技術っていうのはすごいある

と思うんですけど、例えばなんだろうな、私AWSとかクラウドサービス好き

だからこれを一つ例に挙げるんですけどインフラストラクチャーズコード

を実現する上で、AWSでインフラストラクチャーズコードを実現する上で、とり

より選択肢って結構あるじゃないですか、プラムナイ使うとかあと

テラフォーム使うとかCDK使うとかいろいろ派閥はあると思うんですけ

ど、ただベンダーニュートリアルなのはCDKでなくてテラフォーム

ですよね

ken

そうですよね

Takayuki Watanabe

そうするとドキュメントの量も書いてるエンジニアの数も多い

じゃないですか

ken

多いですね

Takayuki Watanabe

だからGitHub行けばテラフォームのドキュメントが提供されている

ようなコードがいっぱいあるんですよね、おそらく

それで学習してるもんだからドキュメントに近い形で生成できるんですよね

ドキュメントの質が良ければテラフォームって結構ドキュメント

質いいんで、なのであのまま書いてくださいって感じなんですけど

ken

みんなにはなんですけど、生成AI も多分あのまま書くと思うんですよ

ね

Takayuki Watanabe

確かに確かに、それで学習してますもんね

だからそういう意味で言うと、自分で書くこともできるんだけど、書いて

た時に良い結果が出てきやすいとか、あるいは解説してください

みたいな時にバーってそうだよねみたいなのが返ってきやすいじゃない

かなと

ken

うん、そうですよね、ここら辺のボイラーテンプレートを書くとか

いったものは大体こう変わってくるでしょうね、ツールによって

リプレイされていくというか

Takayuki Watanabe

ですね

ken

開発が楽になっていくところだと個人的に思うんですよね

Takayuki Watanabe

うん、コパイロットとかそうですねなんかタブレンダしてたら何か

生成されると思うんですけど、あれとかそうですね、例えば何だろう

なフロントエンドで言うと、バーセルとかがこう生成AI使ってフロント

エンドのコードを生成してくれるんですけど、リアクトとかテールウィンド

CSSとかああいうのは生成AI向きに感じますよね、形を見ると

ken

確かに生成AI向きにそもそもスペックを作るみたいな考え方がもう出て

きそうな感じですよね、分かんないけど

出てくるんじゃないかなと思いますけどね

なんか他の場でも話したんですけどゴーランは生成AI系でやりやすい

コンテンツ

Takayuki Watanabe

やりやすいと思いますね

ken

スペックになってるから、例えばルビーとかよりはやっぱり精度

Takayuki Watanabe

もいいし、コパイロットも使いやすいみたいなの聞いたことありますね

なんか他の人と同じようなコードになりがちな言語ですよね、ゴー

は多分、他の言語と比べたら

ken

もう仕様がそうですからね

Takayuki Watanabe

そうそう、なんかニール、エラー、リターンみたいな、ああいうのって

ken

なんかゴーらしさがあるじゃないですか

ゴーらしさがあるね、確かに

Takayuki Watanabe

なんかトライキャッチじゃなくてエラー返すみたいな仕草が、あれ

は生成しやすいでしょうね、いや同じでしょうみたいな

ken

いやめっちゃ分かる、だからソフトウェアエンジニアとして結構楽にはなる

けど別に難易度がどれぐらい変わるのかってちょっとまだ分かってなくて

結局その読み書きの比率が変わるだけな気もしてるんですよね

今までは6割ぐらい読んで4割ぐらい書くみたいな感じだったのが

ボイラーテンプレートとか書く割合が減るけど結局そこで出して

くる生成系がAIが出してくるこのタブ補完で出てきたもののその

バリデーションっていうのは自分でしなきゃいけないんで

8割読んで2割書くみたいな感じになってくるのかなっていう印象

はあるんですけどそこら辺なんかタカさんの印象とかどうですか

Takayuki Watanabe

どうでしょうね簡単なのはそれこそコメント書いたら全部生成する

ところまでいくんじゃないかなと思うんですけど近いうちに

確かに1回のプロンプト渡して生成されるコードは限られてるんですけど

それをチェインしていくことで生成Aとかよくチェインとかエージェント

とかって言うんですけど連続でプロンプトを回し続ける生成した

やつをさらに渡して生成Aに渡してさらにそれを改善していくみたいな

開発の自動化とツールの進化

Takayuki Watanabe

そのループを回すことができるんですよねなので簡単なコードは

多分書けると思うんですねそれでだけどやっぱり仕様の定義とか

あるいは細かいところとかあとはすごいこみーって実装とかって

絶対実装できないからそういうところはやっぱり取り変わらない

かなとは思いますけど

ken

仕様確かにそうですよねソフトエンジニアがきちんとまず問いというか仕様

を理解してるかっていうところは絶対必要で仕様を理解してない

と間違ったことというか聞き方も違ってくるので間違ったこと

聞いたらもちろん間違った答えが出てくるからまず自分がコード

を書いてもともと解こうとしていた問題をしっかり理解してそれを

渡すとそれはそうすればスクリプトがいい感じに出してくれるっていう

ところなんで確かに仕様の理解は必須ですね

Takayuki Watanabe

あとはAPIとか書くのって時間かかるけど簡単みたいなときってある

じゃないですかそういうのがすごい勝手にやってくれるようになったら

小さなチームがより大きな成果を上げやすくなる時代に差し掛

かってくるんじゃないかなと思いますね

なるほど小さなチームがね

すごい今までは何十人も何百人も必要だったけどそれこそすごい

8人すごい人が8人いたらそれでできるみたいな運用はちょっと

よく分からないんですけどその時の日本は分からないんですけど

コードの量とか出てくるプロダクトとしてはいいものが出てきそう

な感じはしますよね

ken

確かに確かに典型的な技術でレバレッジしてる例ですよねなんかSRE観点

でも運用のトイルみたいなのもだいぶ自動化されていくとはや

っぱ思います普段やっていても例えばメトリクスとかログを読ませ

てそこから何かブラインドスポット当てるみたいなのは過去の障害

のパターンとか読み込ませて読ませちゃったほうが現場のエンジニア

のヒューリスティックにとかマッスルメモリーに頼るよりは頼るより

はというか結構サポーティブな答えを出してくれたりすると思

うんで

Takayuki Watanabe

そうですよね結局何というか自動化がより進むっていうより高度な

自動化が進むっていうことだと思うんですよね今までプログラミング

も自動化するために使ってるところが多いと思うんですけどもそれが

ken

なんかより新しい次元に差し掛かるっていう感じだと思うんですよね

今まで自動化できなかったものが自動化できるようになるとか

そうですよね

音声や動画の情報処理と課題

Takayuki Watanabe

より自動化できるようになるとかそういう感じですよね

画像認識とか動画認識とか音声認識とかそういうのって最たる

ものだと思うんですけど今まで人間が一個一個やってたのが音声

をベクトルに変換してそれを検索できるとかそれをあるいは動画

のここの部分同じようなことを話してるところを検索するみたいな

多分難しかったと思うんですけどそういうのもそんなに難しくなく

ken

なってきてると思うんですよね今の生成AIの技術を使えば

そうそれも今ありますよね何だっけディスクリプトだったかな

プロダクト名なんかその自分が話した内容の動画をアップロード

するとその何語っていうんですか何語違うかそれ赤ちゃんの話か

ウーとかアーとかレミフィンとかアーとか言ってるところをカット

してショートバージョンで出してくれるみたいなのもあるのでそういう

ところは自分みたいなヘイネイティブが60分話してるやつが40分ぐらい

にシュッと綺麗になってたりすると感動しますね自分は無駄なこと

Takayuki Watanabe

を20分ぐらい喋ってるのかとか思ったりして

そうですね編集するコストを肩代わりして

ken

くれてるってことですよねそれはアイアイが

ポッドキャスト系でもありますけどねどうなんすかねでも何か

それで編集されたのを見て思ったのは今後改善していくと思うん

ですけど何かこう音と動画の話している口の動きが合わなくて何か

すっごい不自然な感じで聞こえちゃうんですよねそれは多分技術

的な問題だと思うんだけどあとはポーズがないので例えばプレゼンテーション

ってあえてポーズ入れるところとかあるじゃないですか何かこう

場を盛り上げるというか何かこう話し方のテクニック的なそれが

全部消えちゃうので何かこうやつぎ早に情報が入ってくるんですよ

耳の脳の中に何かこれ勝手な偏見ですけど何かこうウォールストリート

でブルームバーグの情報が朝ずっと耳に入ってくるみたいな感じひた

すら脳内フルスキャンで何かもっとポーズあってもいいかなと個人的に

思うんですけどね

Takayuki Watanabe

まってのは大事ですよね話すの間にはでもそれも何か技術のプロダクト

の試行してるところで今話し聞いたところだとそれは単純にこのウー

とかアーとかっていうのをカットしたりとかサイレンスの場所を

それは何か普通に何か音声をこう何か波形なのでそれを見ていく

とそこがへこんでいるところはサイレントだと分かるんでそれを

数値にすれば明らかにサイレントだって分かるんでそれをブッって

切ってるだけに聞こえたのでそうじゃないでしょうねと思います

けどねアプローチは

ken

そうですねそこら辺は今後改善していくとは思いますねあともう

一つ聞いてみたいのはチャット GPT結構ようやく得意じゃないですか

サマリー

Takayuki Watanabe

得意ですね

ken

なんか例えばペーパー論文読むときに論文渡すとサマリー出して

くれるし本もまるまるはまだ渡せないかもしれないけど既に学習

してるものであればいいサマリーを出してくれるしいろんなコンテンツ

がどんどんサマリーされていってるなっていうのが思っていて

そこに対して何かお考えとかあります

Takayuki Watanabe

サマリーされてる

ken

例えばなんか本とか読むときにエグゼクティブ向けサマリーバージョン

とか売ってたりするんですよね本当は300ページの本だけど30分で

聞けるようにしましたみたいなそうするとサマリーって必ず何か

の情報落としてるわけで確かにサマリーを聞くと僕が思ってた

のはエッセンスは分かるんだけどその周りのストーリーとか肉付け

の部分が分からないものばっかりを消費すると深い思考力に対して

どれぐらいインパクトがあるのかなっていうのが個人的な悩み

だったりする確かに便利なんですけどね3時間のコンテンツを30分で読

Takayuki Watanabe

めるっていうのがすごい便利なんだけど

なんかそれで終わるって話じゃないと思うんですよね自分的にはその

話を聞いたときにいやサマリーは素晴らしいですとサマリー

はいいじゃないかと思いましたとっていうのは結構自分論文とか

読むんですけど論文ってどうやって読むかっていうと頭から最後まで

読まないんですよねみんなだいたい先頭のアブストラクトだけ読んで

あるいはコンクリージョンも読んで興味があるだったら後で読む

リストに入れるみたいな感じで読んでいくんですよね論文って

全然似た感じですよね本って要約書いてないからほとんど前書き

とかありますけど要約は多分テーブルオブコンテンツっていうか目次

が要約になっててそれパーって読んでこういう本なのねみたいな

ことはできないと思うんですけど本全体の要約が1ページにまとま

ってるみたいなことってほとんどないんで本にそれがあるのはいい

ですよねむしろやってくれって感じではありますねできるから

やってくれっていう感じではあるんですけどそれはいいと思うそれで

ken

興味があったら深く読めばいいんじゃないかな

なるほどなるほどだから最初のフィルタリングとして使うって

ことですねそれは納得ですねそうすると他に読みたいねコンテンツ

とか本とかの二作本との時間も増えるし無駄なものに損切りの

時間というかを効率化してくれるみたいな感じですよね確かにそれは

Takayuki Watanabe

すごい納得ですねあとは本の読み方も変わってきますよね例えば全部

読ませるところとかではないけど例えば臨読とかするときに臨読

のその章だけチャットGPTなり生成アイに食わせておいて自分たち

が臨読した後に最後にスーツラにチャットGPTに問題出してもらって

みんな理解してますかってちゃんと理解してますか皆さんって問題

を出すことは可能ですよねそうすると理解してませんでしたってところ

はまた勉強できるし理解してるか理解できないかしてないかみたい

なところもインタラクティブなほうが学習は進むじゃないですか

やっぱりより深くそういうところでは使いやすいと思いますけどね

ken

なるほどねそれ面白いですねそこに例えばマーケティングとかの観点

が入ってくるとパーソナライズされたサマリーとかも入ってき

たら面白いですよね

Takayuki Watanabe

いっぱいあると思いますよもうだからいろんなアイディアが出て

くるのが楽しみですね

ken

ねえなるほどねなんか他に気になってるキーワードもしくはプロタクト

ってあったりしますコパイロットとかチャットGPT以外で普段使ってる

ものとかでもいいんですけど

Takayuki Watanabe

そうですね私は画像生成と音声生成は結構興味があって調べた

ステーブルディフュージョンとか音声生成で言うとディープフェイク

みたいなボイスチェンジャーみたいなのあるじゃないですかああいう

のがあってどうやってできてるのかなとかどれぐらいの精度なの

かなみたいなのを個人的に興味があって調べてたりはするんですけ

どそれも結局基本となってる技術は興味を持って見ていくと最終的

にどうやって動いてるんだろうって興味が芽生えてくるんで調べ

たりするんですけど最終的にはいやトランスフォーマーじゃん

みたいな感じにたどり着くんですよね全部だいたいそうなんですね

最近流行ってる音声生成とか画像生成とかテキスト生成とか最終的

に全部基本はトランスフォーマーですよねっていうところに落ち

着くのでやっぱり興味があるところを抑えて基本を抑えると他のやつ

も分かるようになってくるっていう感じだと思います

ken

おだしょーそうですよね前回たかさんと雑談したときもトランスフォーマー

の話になったと思うんですけどちょっと知らないリスナーの方

トランスフォーマーの基本概念

ken

に向けて簡単に説明してもらってもいいですかトランスフォーマー

さんとは

Takayuki Watanabe

たかさん何だろうな分かりやすい例で言うと

おだしょー何かいい例があるんですかね

ステーブルディフュージョンっていう生成AIがあってそれはテキスト

を加わせると画像を入ってくれるっていうモデルがあるんですよね

それはこれはスタビリティAI社っていうのが作ってるやつだと思

うんですけどもそれの軸となってるのがトランスフォーマーの話は

エンコーダーとデコーダーって概念がありますとエンコーダーっていう

のは何か情報を入れたときにそれを数値にするものを軽く言うとエンコーダー

と言っていてデコーダーっていったのは数値をもとに何か目的

となるものを生成するステーブルディフュージョンで言うところ

は画像を生成するっていう目的を持ってるとしたらデコーダーが

それを取り扱ってるっていうところなんですね

エンコーダーステーブルディフュージョンはプロンプとつまりテキストを

エンコードするんですねそれを数値に変化するベクトルとかエンベディング

とかって言うんですけどそれをエンコードはオープン映画作ってる

クリップっていうやつがテキストと画像をペアにして似たような

ちょっと難しいんですけどクリップっていうのがテキストエンコーダー

と画像エンコーダーってのを持っててそれは猫っていうラベル

を持った猫の画像で学習していくみたいなのを繰り返すことによって

猫の画像を与えたときにテキストと猫のエンコードした値が似た

ような値になるみたいな感じで学習してるんですねなのでテキスト

を与えたときに画像に近い数値が数値っていうかベクトルが生成

できるんですねそれがエンコーダーがやってるところでそれを元に

レコーダーそれを受け取っていい感じに画像を作っていくみたいな

なので基本的にはエンコーダーがあって情報をエンコーダーに

渡してそのエンコーダーが情報を数値化してそれをデコーダー

トランスフォーマーによる生成AIの応用

Takayuki Watanabe

に渡すことによってその後に生成されるみたいなのが基本的な生成

AIのロジックなんですねもっと深いところでいうとトランスフォーマー

みたいなのが出てくるんですけどそれを忘れたトランスフォーマー

って言葉を忘れたとしたら基本的にはエンコーダーとデコーダーって

のがあってそれがメインになってるっていうところだと思ってます

ね自分は

ken

なるほどありがとうございますだからここら辺多分いきなり

使ってみた例えばプログラミングとか例えば画像をじゃあコンピューター

でどう表現してるかみたいな前提知識をない状態でStability Fusion

のWebアプリを使ってしまうとなんか魔法みたいじゃんみたいな思って

しまうけれども裏側ではじゃあテキストとか画像をどういう表現

をしていてそれが似ているということはどういうことなのかっていう

のも多分今まで研究されてきた既に数式的なモデルとかプログラミング

とライブラリーもあってそれを使い合わせてインプットとアウトプット

のところでちゃんと合わせて使ってるみたいな印象があるので

いきなり多分ChatGPTとかStability Fusion とか何でもいいですけど最近

出てきたものをいきなり見たらいきなりポッドでのすごいクリエイティブ

なイノベイティブなものが出てきたって思っちゃうかもしれない

ですけど実は過去数十年のいろんなコンピュータサイエンスの発展

の積み重ねでようやく表現できるようになったっていう印象があります

Takayuki Watanabe

ね

たぶん全て学習の過程で何でこうなるのかみたいな全ては数式で

表現できてるわけではないと思うんですね実験的にやってるところ

がすごい多いからだからいろんな研究があると思うんですけどそういう

難しさはあるものの今まであったような機械学習とか自然言語処理

だとか音声認識だとかいろんなコンピュータサイエンスの知識

が最近いろんなところでコラボレーションされてるっていう雰囲気は感じます

生成AIの進化とプロダクト開発

Takayuki Watanabe

よね

それの元になってるのはGoogleの人が開発してくれたトランスフォーマー

っていうモデルが基本的な元になってるってことが多いですね

ken

めちゃくちゃ勉強になりますねありがとうございますそこら辺を

踏まえた上で最後に聞いてみたいのが2024年今年とか今後1,2年でも

いいですけど去年まではいろんなプロダクトも出てきましたタカ

さんとしてはそこら辺の裏側もソフトエンジニアとして結構キャッチ

アップできましたじゃあ今後とかはどういう開発をしていきたい

か付き合い方をしていきたいか何をエキサイトしてるかそこら

辺って何か考えてたりしますか今までの延長でやっていくのか

とか

Takayuki Watanabe

そう自分がプロダクトを作るときには一つ破壊的なイノベーション

を起こす手段にはなり得るなとは思ってるのでそれはただの一過性

の流行りかどうかは考えたほうがいいと思うっていうか合う分野

では本当に効果的に使えば今までいけなかったことをすごいいっぱい

できると思うんですよねですし今例えばもしかしたら価格とか

あるいは与えられるインプットの量とかあとAPIリミットとかそういう

些細なリソースとか制約で実現できないみたいなことあると思

うんですけどそういうのは時期に取り払われるものだと思ってる

AI技術のポジショニング

Takayuki Watanabe

のでそこでそれがボトルネックだからプロダクトを作れないとか

って考えちゃうのはもったいないからそれすぐ多分取り払われる

から多分進んだほうがいいみたいなのはありますよね

ken

たしかに適材適所で使っていくって感じですよねWeb3とかもそう

でWeb3とか仮想通貨自体がいい悪いいけてるいけてないではなく

あれが生きるサービスとか場所ってあるし全てにおいて使える

使えないとかそういう話ではなくここら辺の技術もちゃんと使う

べきところに使っていくそのためにソフトウェアエンジニアとして

は最低限の原理とそれでどういったものをプロダクトアウトできる

のかそのコーディングの部分を学んでいくというかAI技術がちょっと

分かるソフトウェアエンジニアとしてのポジショニングだから

こその発揮できるところもあるよみたいなところですかね

Takayuki Watanabe

そうですねいっぱいある技術の中の一つだと思いますね全部に

設置してるエンジニアっていないと思うんですけどAIに知りたい

なって人がいたら今はチャンスかなと思いますねいろんなモデル

はあると思うんですけどさっき言ってた基本的なトランスフォーマー

とかそういうのを理解していればキャッチアップできるので全て

のモデルを理解する必要ないしそこで面白いなと思ったらもっと

他の機械学習の知識も培えるだろうしいろいろ活躍の幅が広がるん

じゃないかなと思いますね

ken

いやなんか綺麗なまとめになってる気がするここら辺の生まれた上で

タカさんという一種のロールモデルがどういうふうな考えを持って

キャリアを積もうとしているのかとかなくそこら辺はちょっと刺激

になるリスナーの方もいるんじゃないかなと思ってます僕みたいな

AI技術全然分からないみたいなソフトウェアエンジニアでもアプライ

できるような例えばプロダクトを使ってますみたいなのも結構

市場にマーケットに少なくとも僕の周りイギリスは結構出てきた

ので別にCSとか大学博士でAIモデルとか研究してましたっていう人じゃ

なくてもここら辺はやって飾るを得ないようなところも増えて

きたなと思いながら一つロールモデルとして聞いてましたありがとうございます

AIの活用と技術開発

Takayuki Watanabe

はいありがとうございます

ken

そうですね結構聞きたいことを話せたかなと思うんですが最後

の方にたかさんの方からこれだけは話しておきたいもしくは何か

触れておきたいみたいなキーワードあったりしますか

Takayuki Watanabe

いやどうだろうな自分はこのAI とかいっぱい結局ソフトウェア

エンジニアとしたら便利なツールが出てきたなとか便利な技術が

出てきたなぐらいにしか思ってなくてクラウドサービスが出て

きた時もそうだったと思うんですけどあれでクラウドが出てきたから

全員職がなくなったかっていうとそうではないと思うんですね

より便利でより自動化とかが進んでいろんなプロダクトが作れる

ようになったっていうところもあるんでAIももしかしたら簡単な

ところは仕事としてはなくなっちゃうかもしれないんですけどAIを使った

新しい技術開発とかプロダクト開発とかっていうのは今後楽しみ

ですよね一方で

ken

いや楽しみですねいやなんかこの竹さんの技術に対する適切なスタンス

の取り方っていうのがいつも聞いてて参考になりますありがとうございます

Takayuki Watanabe

ありがとうございますなんかリスナーさんリスナーさんっていうかオリジナル

ken

の質問の答えになってたのかなわからないですけど

もし竹さんが今回のエピソードも聞いてくれたらぜひまたお便り

お待ちしておりますはいじゃあということで今回はAI技術編ということで

竹さんをお呼びしました今日はありがとうございました

Takayuki Watanabe

ありがとうございました

スター

エピソードをシェアする

メッセージを送信

ken

Takayuki Watanabe

サマリー

目次

スター

コメント

こちらもおすすめ