2023-10-04 14:01

ChatGPTスピーチがやばい、使用感と今後の予想を話してみる

【雑談】PROJECT COMPの面談やってきた

前回の本題で話していた、MIYACHINの副業査定の、その先の話


Twitterアカウント始めました!質問やコメントなど受け付けています!

⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://twitter.com/trycatch_fm⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

サマリー

TRY-CATCH FMは、副業単価査定審査のオプションについて話しています。彼らはエージェントサービスの可能性を探っています。また、彼らはChatGPTのスピーチ機能についても感想を共有しました。ChatGPTのスピーチ機能は、使用感と今後の予想について話しています。質問回答のパターンには、UXと音声・画像の組み合わせが目立っており、AIによる新しいデバイスの可能性も話題となっています。

00:11
皆さんこんにちは、TRY-CATCH FMです。
このポッドキャストは、それぞれの企業で働くソフトウェアエンジニアとプロダクトマネージャーの2人が、
テック、キャリア、ライフスタイルなどをテーマに、 雑談形式でお送りする番組です。
行っていきましょう。
はい、よろしくお願いします。
エージェントサービスの可能性
はい、前回だっけな、先週の回でプロジェクトコンプの副業単価査定審査みたいな、
審査じゃないか、査定か、やってみたっていう話したじゃないですか。
はいはい。
それで、それのオプションみたいなので、その後面談、査定をしてくれた人と面談して、
より具体的な話を聞けますよ、みたいなやつがあって、
多分その時にその話を軽くしたかなと思うんだけど、
ちょっとそれを実際にしてみたんで、どんな感じだったかちょっと共有してみようかなと思うんですけど、
はい。
なんか、面談で話したのは、なんだっけな、
そもそも単価を上げるためのプランというか、こういう風にやると上がりやすいですよとか、
あともう少し自分の現状を口頭で伝えた上で、単価の精度を上げてもらうというか、
こういうことをしたいんだったらこういうアプローチで行ったら単価上がりやすいですね、みたいな、
そういうちょっとカウンセリングみたいなのをしてくれたんだけど、
プロジェクトコンプとしては、
これ聞いてたら面白いなと思ったんだけど、
正社員にしても副業とか業務委託とかにしても、
給与が決まるじゃないですか、契約の段階で、
そこに入ってくれるみたいな、
エージェントみたいなサービスをしようと思ってるみたいなこと言ってて、
これ要は、例えばさ、一番わかりやすい例とかで言うと、
プロ野球選手がメジャーリーグとか挑戦するときに、代理人とかついて給与交渉とかしてくれるじゃん、
それっぽいことをやってくれるみたいなのを考えてるらしくて、
なるほどね。
これって実際さ、例えば、練習がそれで50万上がりましたってなったら、
そのうち例えば、30万とかを手数料として払うとかでもさ、
明確にこっちが得してるじゃん。
そうだね。
だからそういうビジネス結構シンプルで、わかりやすくていいなと思ってたんだよね。
成功報酬型みたいになるから、確かに。
そうそう、それ例えば50万上がったとして、それ50万払ってもね、
全然その次の年とかも50万増えてるわけだから、
全然いいなと思って。
そうそう。
これ聞くと、企業側としてはちょっとやりづらい感あるじゃん。給料を決める。
そうだね。
これも結局は、エンジニアの市場価格に見合った給料にすることで、
将来的な利息率を改善できるみたいな側面もあるっちゃあるらしい。
なるほどね。
これは言い方しないみたいなところもあるかもしれないけど、
この間グレードみたいなのあったじゃん。
Gのいくつみたいなやつね。
そうそう。あれはやっぱり企業向けに開発してるものらしくて。
なるほど。
要はこれくらいの好きげのエンジニアだったら、これくらいの給料を上げるのが適切ですよみたいな。
そういうちょっとコンサルっぽいことをやって、それでエンジニアの満足度を高めるみたいなことを言ってたから、
やってることとしては市場の適正価格に給料をちゃんと合わせて、
給料低すぎるから辞めるみたいな、そういうのを事前に防ぐみたいなことをやってるっていう感じかな。
企業としてもね、ある程度目安が分かるようになったら、じゃあGのいくつぐらいの人が欲しいんだよね、
ってことはいくらいるねみたいな話ができるように。
そうそう。
だからそれ聞いてて、確かになーと思って。
自分が次転職するときは、エンジニアで転職しないと思うけど、
別にこれはエンジニアに借り出すって話だと思うから、
そういうサービスがあったかも。海外ではすでにあるっぽくて。
へー。
海外で成功したものはね、アートウェイするのは結構人としてはいいらしいから。
そういうのあったらちょっとやってみようかなーと思ったという話でした。
なるほど。
チャットGPTのスピーチ機能
はい。じゃあ本題なんですが、
はい。
チャットGPTの音声機能が何か使えるようになってたから使ってみたっていう話なんですけど。
それを知らなかったんだよね、実は。
これいつ出たやつか、いつの間にか出てて。
へー。
えー、音声。
画像の機能が何やらが使えるようになったのを知ってたんだけど、
一緒についたの?
そうかもしれない。見る聞く話すに対応っていうセットでリリースされたのかもしれないけど、
でも多分、全部同時にリリースされるんじゃなくて、
俺まだ画像を使えないから、多分その中でも段階リリースされてる感じかな。
なるほどね。
で、スピーチをやってみたんですけど、
これどういう機能かっていうと、
普通にチャットGPTのスマホアプリでスピーチモードみたいなボタンがあるから、
それをクリックすると、
そのチャットUIじゃなくて、話しかけるUIみたいな感じになって、
こっちから話しかけるんだけど、
それに対して、
答えを生成して喋りながら返してくれるってやつで、
最初は普通にチャットGPTでテキストで生成したいとそのまま喋ってるだけなんじゃね?って思ったんだけど、
答えを生成しながら喋ってるんだよね、明らかに。
だからその辺はまさに人間っぽくて、
何言うか決めてないのに喋り始めるみたいな。
なるほど。たぶんいっぺんにやるのが難しいから、
自分が今回答したことも前提に含めて次のことを生成してるんやろうな。
そうそうそうそう。
だからちょっとなんかね、
ほんとこう人間が喋ってるみたいに、
なんかこう欲望があるというか、
なんか喋っ…
しかもなんかちょっとフィラー音みたいなのも入ってた気がするんだよね。
あーとか。
あー、GPT-4って結構ゆっくり文字が出てきたりとか、
一撃で止まったりするじゃん。
あんな感じでやるのを音声でやるとそれに近いかも。
そうそうそうそう。
そうそう。
だから結構感動したね。
日本っていうかその人間に近いトーンですごい喋ってたから。
でもやっぱりこっちから喋りかけて、
いざ向こうが喋り始めるまでのラグはね、まだ結構あるっていう感じ。
あー。
10秒とかかかっちゃうときもある。
なんかそれはだんだんスピードが上がるのもそうだし、
今なんかやってるよっていうのがわかるように改善されていくかもしれないね。
そうだねー、そこさえ改善されればもうだいぶドラえもんの世界だな。
そうね。
音声でやりたい人ってあんまりそっちに目を裂きたくない人だと思うから、
ながらでなんかやってる人とかスパートスピーカーみたいに使いたい人とか、
そもそも視覚障害がある人とかっていうことになると思うから、
ChatGPTスピーチの使用感
そうなると受け取ってて、今やってる最中で特に止まってはないんだよっていうのが、
わかるようなUXにしとかないと不安になるよね。
そうなんだよねー。
そうそうそうそう、それはすごいある。
これマジでちゃんと聞いてんのかなーみたいなやつはある。
それでなんかね、あとね、回答も、
まあこれは、何なんだろうな、たぶんすぐ改善されると思うけど、
めっちゃ日本語がうまい外国人みたいな感じのしゃべり方で回答されるんだよね。
はいはいはい。
それはもうなんかまだ学習データ足りない問題かもしれないかな。
英語だとスムーズだったりするんやろうか。
あーそこ試せれてないなー。
だいぶ精度はいいっぽいけどね。
発音の仕方が違うから、なんか英語向けに作った結果、
ベースに作ってそれを調整した結果、
なんか結局英語並みみたいになっといてた感じの可能性はあるけど。
そうねー。
で、あとまあその音声の他に画像でしょー。
うん。
これまあ俺が期待してるのは、
なんだろう、システム開発関連の画像をアップロードして、
要はなんだろう、
シーケンス図とか、
テーブルの、レビューのテーブルの、
なんだっけあれ、ERダイアグラムだっけ、忘れた名前。
ER図でいいんじゃない?
ER図か、うん。
とかをアップロードしてコード生成してもらうみたいな。
うん。
あれとかできるとめっちゃ便利だなと思う。
そうだね。
このシステム作りたいんだよねって言ったら、
この設計でどうですって通達してきて、
見て、どうだったら、
ヨロッと言ったらコードが出てくるみたいなことが。
あと、フィグマでデザイン渡したらもうマークアップ自動でやってくれるとか、
これって結構ずっと前からさ、
なんかいろんなツールがやろうとしてたけど、
うん。
やっぱなんか微妙な感じがしてて、
そうだよね。
フィグマとかもなんかそういうのあった気がするよな。
あると思う。
デファクトにはなってないから。
そうだね。
だからここでね、圧倒的クオリティを見せてほしいですよね。
そうだね。
画像とかだとね、結構日常使いもできると思うんだよな。
なんか思い出せなかった。
なんか、
あれ思い出せないんだけどさ、
こういう方って日本のどこどこの都市にあるさ、
あれ?みたいなこと言ったらさ、
これですか?って画像出してきてさ、
それそれそれ、それの名前何?って言ったら答えてくれるみたいな。
そういう結構、なんか画像と音声組み合わせると、
割とそういうのが会話でパッとすごい賢い人に聞くみたいな。
賢くてググり力の高い人に聞くみたいなことができるようになる。
あとあれだね、
AIによる新しいデバイスの可能性
これもう無料アプリあんのかな。
ご飯の画像載せたら栄養素全部記録してくれる系のやつとかさ。
あー。
そうだね。
アスケンみたいなアプリに全部入れるって大変だな。
そうそうそうそう。
そうなんだよね。
とかとか。
でもなんか、やっぱり問題はさ、
その計算スピード?
計算スピードとかがやっぱり、
なかなかネックになってるけど、
まあでもそこはあれらしいですね。
サムアルトマンと、
元Appleのデザイナーのジョナサン・アイブっていう
有名なデザイナーの人がタッグを組んで、
新しいデバイス作るって言ってるから、
多分そこでめちゃめちゃローカルで計算しても耐えれるくらいの
高スペックなデバイスが出るんじゃないかなと思ってるんですよね。
なるほどね。半導体がまた。
そうそうそうそう。
救急車乗ってるな。
そうだね。
なんか、あれだね。
そのうちどっか本題で話をしようと思ってたんだけど、
次スマホじゃないもんが来るんでは問題みたいなの。
そうそうそうそう。
思ってたんだけど、そこをそういう、
AI的なところが取り柄になるかもね、やっぱり。
そうだね。
もうそのサマールとマンが作るやつでまた新しい
第2のiPhone、第3のiPhoneが出てくるんじゃないかな。
スマホの形してなくてもいいわけだから。
そうそうそうそう。
そんな感じで、AIの未来は明るいぞという話でした。
はい。
じゃあ終わりましょうか。
はい。
ではこんな感じで週2回のペースで配信しているので、
もし面白いと思っていただけたら、
Twitterのフォロー、Podcastのレビューなどぜひお願いします。
では今回も聞いていただきありがとうございました。
ありがとうございました。
14:01

コメント

スクロール