1. rel.ax
  2. #6 GoogleのAIパワーアップ:S..
bbz
bbz
Host

ポッドキャスト第6回目の紹介 ## 1. GoogleのAIによる検索体験(SGE) - GoogleがAIによる検索体験を提供していることが話題になっている。 - SGEは検索キーワードからユーザーが知りたい情報を提案する機能を持っている。 - SGEはGoogle検索の一部であり、検索エンジンの体験を向上させる役割を果たしている。 ## 2. GoogleのAI支援ツール「Duet AI」 - Google Cloud Next 2023イベントで発表されたDuet AIは、Google Workspaceの一部として提供される。 - Duet AIは、Google MeetやGoogleスライドなどのツールで利用できるAI機能を提供する。 - Duet AIは、会議の自動文字起こしやスライド作成のアシストなど、業務の効率化に役立つ機能を持っている。 ## 3. メタ社のAIモデル「コードディアマ」 - メタ社がAIモデル「コードディアマ」を発表した。 - コードディアマは、プログラムの生成に特化したモデルであり、優れた能力を持っている。 - コードディアマは、特定の目的に特化したAIモデルを作成するためのツールとして利用されている。 ## 4. オープンAIのエンタープライズ向けチャットGPT - オープンAIがエンタープライズ向けのチャットGPTを提供開始した。 - エンタープライズ向けのチャットGPTは、セキュリティや安定性などの要件を満たすために開発された。 - エンタープライズ向けのチャットGPTは、企業の業務改善に役立つ機能を提供している。 ## 5. テキスト読み上げモデル「バリー」 - テキスト読み上げモデル「バリー」が登場した。 - バリーは、多言語のテキストを読み上げることができるモデルである。 - バリーは、事前に登録した音声を元に、テキストを読み上げることができる。

※ タイトルや概要は AI にて生成させています。

放送で紹介されたニュースへのリンク

https://ainewsdev.substack.com/p/weekly-ai-news-6


サマリー

今回のポッドキャストでは、GoogleのAIによる検索体験が話題となっています。SGE検索とDuet AIについて詳しくお話ししています。Code Llamaでも注目されており、AIテキスト読み上げモデルのバリー(バーリー)Xが多言語のテキスト読み上げと翻訳が可能とされています。

GoogleのAI検索体験
この放送をリラックスは、旬なAI関連の話題を取り抜け、
りえびーぜっとこと私ばばぞなとセコンことたてのがつらつらと話すポッドキャストです。
BXで暮らしにひらめきを、WeVisionにサービス体験や組織づくりを行っている工夫AIスタジオの提供で行っています。
というわけで、今回も機械的な音声から入りました。第6回目のリラックスやっていきたいと思います。お願いします。
今回の冒頭の、たてのなんですけど、今回の冒頭のやつもまた変わった感じなんですか?あの音声が。
そうですね。ちょうど今週のニュースにもピックアップされた内容ではあるんで、後でちょっと話そうかなとは思うんですけど。
僕もひょっとしたらそうかなと思って聞いてたんで。はい、じゃあちょっとそこはまた本編中に話していきましょうか。
そうですね。ちょっとお楽しみにということで。今週というか、8月の25日から9月1日ですね。
直近1週間ぐらいの大きなニュースを、AIがピックアップしたものを中心に話していきたいと思います。
早速話していきたいんですが、まず1つというか、今週結構いっぱいあるんですけど、Google関連のニュースが非常に色々と出てきたなというところで、
その中の1つ大きいのが、AIによる検索体験ということで、略称SGEなんて言われたりするんですけど、
これの試験運用が日本でも開始されたということで、ちょっと話題になっているというところですね。
そうですね。坂本さん使ってみましたか?
これ、僕使いたいと思って結構何度か試してるんですけど、まだ僕のところは使えてなくて、順次展開って書かれているので、使えるようになるのを待っている状態ですね。
そうなんですね。僕は使っていて、ブラウザーとAndroidのChromeから普通に使えていて、いわゆるこのSGE、Search Generative Experience体験。
ちょっと一昔前に、BingのほうでBingがAIを投入し、Chat GPTがBing上で使えるようになってBingの検索結果が賢くみたいなことが
話題になったと思うんですけど、それのいわゆるGoogle検索版みたいなもので、結構便利なんですよね。
検索すると、生成AIが自動で自分が入れた検索キーワードから、あなたが知りたいのはこんな感じなんじゃないっていうのを提案してくれたり、
あとは自動が低いとそれが提案されないんですけど、その場合にはボタンが出ていて、生成AIに尋ねるみたいな感じでボタンを押すと、
ささっとまたそれで作ってくれたりっていうのがあってですね。本当に検索エンジン上で、Googleって別にこれが始まる前も検索エンジンに
検索のスニペットっていうので、例えばWikipediaの冒頭文をうまく出すことによって、ユーザーさんから何を調べたいんだっていうのに対して、
別にその先まで行かなくても簡単なことなら知れてしまうみたいなところがあったんですけど、またそれが一段階、
生成AIを入れることによって、より分かりやすい形で引き出せるようになってきたかなみたいなところですね。
そうですね。もう何というか、検索キーワードを打つと、関連する情報がもうパラパラと多分上位のウェブページから拾ってきてると思うんですけど、
もうページを開かなくても、ある程度これが欲しいんでしょ、ドンっていうのが出てきて、さらに会話的にできるっていうので、
情報検索がやっぱり楽になるなっていう感じですよね。体験が変わるというか。
そうですね。今までやっぱりそういうことをいちいちやっていたっていうところがだいぶ楽な感じになったなみたいなところですね。
本当にこの辺のところってどんどん体験、あとはいろんなところのUX、やっぱりここって新しい体験なんで、
結構またそこの部分でどういうふうに自然な形で検索体験を入れていくのかっていうところの、今一つの回なんですけど、
これはどんどんどんどんまだまだ進化しそうだなみたいなところのインターフェースなんで、今後も楽しみだったりしますね。
そうですね。それに多分ブラウザーとしてもGoogleのChromeブラウザーを使っている方が多いと思うので、
そういった意味でもビンゴは触ってなかったけど、Chromeから体験できる人もたぶんいっぱいいると思ってて、
ぐっと伸びそうな予感がしたりしてますね。
そうですね。なんか結構今、たぶん馬場どもさんの言うと、今ウェイトリスト待ちなんですかね、これ使うには。
やり方としては、機能を有効にする手順があるんですけど、ウェイトリスト的なものではなく、
今僕がその手順を試すと、エラーになっちゃうんですね。まだあなたは使えませんよって出てくるんですよ。
アナウンスのページを見ると、この機能は順次公開提供されてきますって書かれているので、
日本では使えるんだけれども、アカウントが徐々に使える人、使えない人っていうのがだんだん差がなくなって、
最終的にみんな使えるようになるっていう状態で、実際はウェイトリストがあるのかもしれないですけど、
特に自分からウェイトリストに入るっていうことはなさそうな気がしてますね。
Duet AIの概要
じゃあ使える人はいけば、ひょっとしたらすぐに使えてしまう可能性もあるっていうことだと思うので、
そうすると使ってみようかなみたいな方は、ちょっと行ってすぐボタンポチポチ押せば機能有効にする。
オンにできる人だったらすぐに体験できると思うので、使ってみると面白いかなと思いますよね。
そうですね。これ今日話した内容の記事のリンクとかもPodcastのところに貼ったりするので、
そこから有効にする方法とか書かれているので、気になったらちょっと後で見てみてくださいっていうところですね。
続いて別のニュースになっていくんですけど、これまたGoogle関連ではあるんですが、
トピックとしては、というか見出しですね。見出しとしては、
AI対応のデータベースAlloy DB AIとOfficeツールのAI支援、Duet AIが登場。
ってあるんですけれども、どちらかというと多分Duet AIっていうのは結構大きなポイントかなというもので。
そうですね。背景としては、まずGoogle Cloud Next 2023っていうイベントがちょうど開かれているんですよね。
なので、Googleのクラウド関係の話っていうのが、この1日2日すごく話題になっていて、
その中でいくつかAI機能を取り込んだよっていうような、いわゆる開発者向けサービスみたいなところの話題と、
今、馬場園さんが話そうとしているこのDuet AIっていうようなところが、
主にその2つの方向ですごく話題になっているのかなと思ってまして、
というわけで、ぜひDuet AIの説明をお願いします。
そうですね。いろいろできることはあって、まだその完全なバージョンというかではないと思うんですけれども、
立ち位置としては、マイクロソフトとかが、ちょっと何ヶ月か前に出したコパイロットみたいなイメージを持ってもらうといいんですけど、
Googleワークスペースっていう、Gmail、Googleスライド、スプレッドシードとか、
あいったところに関する拡張機能っていうのが提供されますと。
例えばどんなのかっていうと、Google Meetとかで18カ国語だったかなくらいの自動文字起こしとか、
26作成ができるようになったりだとか、あとはGoogleスライドですね。
スライドを作るのって結構大変なんですけど、こんな画像が欲しいよって言ったら作ってくれたりだとか、
アシストをしてくれるようになってくるのが、このDuet AIっていうシリーズのたくさんの機能をまとめた総称っていう感じですね。
そうですね。マイクロソフトのコパイロットって、コパイロットって副操縦士っていう意味で、
何か自分がツールを操作していると、副操縦士がこんなんどうですかとか、
この辺自動でいい感じにやってあげますよみたいなことをいろいろ提案してきて、
僕自身もコパイロットって、プログラムの行動確保パイロットはもう手放せなくなっているんですけど、
それがどんどんいわゆるリズムのオフィス365、マイクロソフトだったらオフィス365とかですし、
Googleだったら今回GoogleワークスペースのGoogleドックスとかその他いろいろなものに自然な感じで入ってくるっていうので、
これが入るとすごくいろんなところの業務改善が、
とりわけGoogleワークスペースを使っている人はすごくスムーズに進みそうだなあ感が出てきて、
そういうの面白そうですよね。面白そうというか普通に便利そう。
そうですね。ただ、確かプラン的にははっきりと明理されたのかな。
ちょっと何とも言えないんですけど、
一応月額いくらっていうプラスオプションにはなると思うんですけど、
多分相当業務効率は上がれると思うので、かなり大きな不責というか、
施策を打ってきたなあって感じですね。
そうですね。こんなことができますよっていう機能とか動画とかはいろいろ出てるんですけど、
例えばGoogle Meetのオンライン会議とかだと、
オンライン会議で話した内容の文字起こしっていうのはもちろんのこと、
Duet AIの機能
話した内容の中から、例えばトゥードゥリストを勝手に作ってくれるとか、
本当にこうなったら便利なのになみたいなところとかを、
いろいろ今の段階から意欲的に取り込んでいってると、
取り込まれてるような機能がかなりいろんな部分で見られるので、
そうすると自分たちが業務で当たり前にやっているっていうのの、
AIのアシスタントサポートがどんどんより当たり前になっていくよなみたいなことを、
見ているいくつかの機能の中では、
すごく今からでもぜひ使ってみたいものがたくさんあったりする感じなんですけど、
たださっきBBZさんが言った通り、
なかなかお高めな値段設定になりそうなので、
そこはやるなGoogleみたいに思って見てましたね。
そうですね。
でも多分一度使ったら手放せないんだろうなとかで、
うまいなって思ったりしてますね。
そうなんですよね。今個人でCopilotとか使ってますけど、
これCopilot5000円になるけどっていきなり値上げされて、
5000円でもこれは払うしかないなみたいなことになるぐらい、
僕は結構ヘビーに使っちゃってるんで、
そういう人たちにとってそういうのが割とAIのアシスタントが
当たり前になっていくってなってきたときに、
それなりにそれを使うのには気をかかるよねみたいなのは
いたしかたないのかなと思いますね。
いずれにせよ本当にGoogle周りはすごい勢いでAI周りの更新出してますんで、
Code LlamaとGPTエンタープライズ
今後も引き続き要チェックかなっていうところですね。
そうですね。
では次に行くんですが、次はGoogleじゃないんですが、
メタ社が出したCode Llamaっていうものが、これはプログラムとかですね、
コードを生成するのに特化したものを出しましたよっていうことで、
結構優れた能力を持っているということで、結構話題になっているところですね。
そうですね。これらが出てきたのって、もちろんこれでコード生成できるよ
っていうことって、いろいろな何かのドメイン、何かの目的に特化した
ファインチューンっていう、その何か目的のものを達成するための
生成系AIっていうのがすごい作りやすくなったなっていうのが背景でもあって、
もともとメタ社が公開しているLlamaっていうところのLlamaバージョン2っていうのが
つい1ヶ月前ぐらいに出たんですけど、そのLlamaのバージョン2が
商用利用可能で、かつかなり性能がいい。僕も結構試しているんですけど、
すごいモデルパラメータの割にはすごく性能がいいので、こういう感じで
いろいろなもの、この用途にはこういう生成AIを使うといいよみたいなところが、
今の段階からでもどんどん一気に広がっていきそうな予感がするんで、
すごく未来が期待されるような技術がどんどん応用されて、こういう形の
コード開発支援とかに組み込まれていってるなみたいな感じがしますね。
そうですね。コードセッションといえばGitHubのコパイロットとかが
すごく使われていると思うんですけど、あれはどちらかというと、
もう提供されたサービスを使うだけだったりしますけど、このコードLamaとかだと
自分でチューニングしてあげたりすると、自分好みのというか、コードを
作ってくれるようにもできたりすると思うので、そういった意味でも
多様性がどんどん出てきそうだなっていう感じですね。
コード生成周りについてはこのぐらい時間が押してきたので、
次行きたいと思うんですけど、これもすごく大きな話だったと思うんですけど、
企業向けのチャットGPT、エンタープライズっていうのが提供開始されましたと。
これはもうすごく反響が大きい内容で、もともとOpenAIって
特に企業向けっていうのがなかったんですが、企業向けに安全な環境を
用意しますようであったりだとか、あとはGPT4っていう一番今
性能が良いと言われているものを制限がなく使えたりだとか、
いろんなメリットがあるプランをようやくと言っていいのかな、
出してきたっていうところですね。
そうですね、なんか結構この辺のところってOpenAIのこのGPTって
MicrosoftのAzureのほうのGPTみたいなところの兼ね合いとかがあって
なかなか出せないのかなと思っていたら、結構今やっと出てきたな
っていう感じがしますよね。
そうですね、MicrosoftのAzureでも企業向けのやつとかがあったりは
するんですけど、本家本元が出してきていて、一番個人的にすごいなって
やっぱり速度が全然違うらしいっていう、まだ使えてないので
あれなんですけど、っていうのが大きいのと、ただ価格はオープンプライズには
なってないので、要は相談っていうところがちょっと面白いなと思って
入れたりしますね。
そうですね、エンプラはお金は結構かかるというのがありながらも
セキュリティだったり、あとはそういう安定運用や速度が一定以上
しっかりと出るみたいなところから、結構高くてもちゃんと使うか
みたいなところのモチベーションが働くんで、その辺をバランスとって
うまく機能をリリースしてきたなみたいな感じがしますね。
そうですね、個人的には一早く使いたいんですが、まずはちょっと
お値段とご相談ということで、何とか検証したいなというところで
ここについてはこのぐらいで、次に行こうかなと思います。
バリーXのテキスト読み上げ機能
次は、これは音声系のAIの話になって、読み方はちょっと正しいか
分からないんですけど、バリーなのかな、バリーかバーリーなのか
Xっていうのが出てきてですね、これは何かというと多言語のテキスト
読み上げモデルですね。なので、文章を打ったらその文字を読み上げ
てくれるっていうものなんですけど、もともといろいろこういうの
あるんですが、これの何がすごいかっていうと、3秒ぐらいですね、
短い誰かの音声を事前に登録しておくと、その人が喋ったかのように
いろんなテキスト文字を言ってくれる、喋ってくれるっていうのが
このモデルのすごいところですね。
そうですね、この辺のところはテキストトゥスピーチっていうところも
すごいですし、このモデルのやっぱり一番僕自身は一番大きいなって
思うのは、自分がこのモデルに数秒間声をアップロードするだけで
自分の声をやっぱり真似て発信してくれるっていうところは、
制度っていうところはさておき、すごく手軽にできるようになった
っていうところは、今後この辺のところがさらに進化が進みそうだな
っていうところをすごい感じましたね。
そうですね、本当に自分じゃない声にもできたりはするんですけど、
例えば多言語翻訳スピーチみたいなことも可能になると思います。
自分が日本語で喋ってそれを例えば英語に変換して、
自分が喋ったかのようなトーンで話せるとか、
すごい夢が広がるなっていう技術だと思ってますね。
そうですね、よくフェイスニュース的なものとセットでは
語られがちなんですけど、やっぱりそういうところの自分のこの声
っていうのの情報を認識して別の声に変換するっていうもので、
かつそれがトランスレート、翻訳もできちゃうっていうと本当に
翻訳こんにゃくの時代みたいな感じですよね。
自分が話した声がそのまま英語で、日本語でこういう風に話した声が
自動で英語に変換されて、かつ自分の発音のような感じで
変換されるっていうような技術だったりして、
こういう話をすると、使うのすごく難しいんでしょうっていう風に
思うかもしれないんですけど、実はこれはもうURL先で
デモをすぐ動かせるものが公開されているんで、
そこで本当にいじるだけで、例えば自分の声を英語で
喋らせてみるみたいなこともできますし、
そういうことがいろいろできたりするんで、気軽に試せるっていうところでも
すごいすごいなって思ったところでもありますね。
本当に今回冒頭で喋っていたのは、実はこの技術を使って
生成したものなんですけど、本当にボタンポチポチで作れるので、
あとはテキストを入力して、めちゃめちゃ手軽で、
だがしかし性能はすごいぞっていう感じなので、
ぜひこれもリンクを貼りますんで、興味ある方は
試してみてもらえたらなと思います。
ということで、毎回AIのピックアップしたニュースだけだと
時間が余って、我々がピックアップしたものを喋りがちなんですが、
今回も結構いろいろあって、ちょうどいい時間かなっていうところで、
ちゃんと1週間抑えるところを抑えてるかなっていう感じがしますので、
1週間はこのぐらいで終わろうかなと思います。
最後に先ほどのモデルのさよならの合図を作ってきましたので、
またそれを流して終わりたいと思います。
それではまた次回の放送をお楽しみに。
19:30

コメント

スクロール