2023-09-22 19:39

#9 AIの進化が止まらない！DALL·E v3、Google Bardアップデート、コパイロット新機能、YouTubeのショート動画革命

bbz

Host

ポッドキャスト第9回目の紹介 ## トピック1: OpenAIの画像生成サービス「DALL·E」のバージョン3の発表
- OpenAIが提供する画像生成のサービス「DALL·E」のバージョン3が発表されました。
- 今回の発表は、「出るぞ」という発表であり、注目を集めました。
- チャットGPTに組み込まれることで、使いやすさや期待感が高まっています。## トピック2: Googleの大規模言語モデル「BERT」のアップデート
- Googleが提供する大規模言語モデル「BERT」が大幅にアップデートされました。
- Googleワークスペースなどのサービスと連携できるようになり、利便性が向上しました。
- チャットGPTと組み合わせることで、最新の情報を取得できるようになりました。## トピック3: MicrosoftのAIアシスタント「コパイロット」の新機能
- MicrosoftのAIアシスタント「コパイロット」に新機能が追加されました。
- Windows 11にも統合される予定であり、Windowsのユーザーエクスペリエンスが向上します。
- GitHubコパイロットチャットが一般利用可能になり、個人でも利用できるようになりました。## トピック4: YouTubeのテキストベースのショート動画機能
- YouTubeにテキストベースのショート動画機能が追加されました。
- ユーザーは簡単にテキストを入力するだけで、自分だけの映像作品を作成し、公開することができます。
- クリエイターにとって使いやすいツールとなっており、動画生成が簡単になりました。

※ タイトルや概要は AI にて生成させています。

放送で紹介されたニュースへのリンク

https://ainewsdev.substack.com/weekly-ai-news-9

放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。

その他

YouTube、生成AIでテキストからショート動画背景を“創造” https://www.watch.impress.co.jp/docs/news/1533358.html

Windows 11、9月26日の大型アプデ「23H2」で「Microsoft Copilot」ビルトイン https://www.itmedia.co.jp/news/articles/2309/22/news089.html

「GitHub Copilot Chat」ベータ版が個人でも利用可能に～AIがプログラミングに助言

https://forest.watch.impress.co.jp/docs/news/1532976.html

サマリー

オープンAIが提供する画像生成のサービス、ダリーのバージョン3が発表されています。また、Googleの大規模言語モデル、Birdも大幅なアップデートを行っています。さらに、マイクロソフトのマイクロソフトコパイロットというサービスにも新しい情報が出ています。Windows11のアップデートが注目され、WindowsとインテグレートされたAIの体験が向上し、GitHubコパイロットが一般公開され、さらにYouTubeショート動画機能が登場したことが話題となっています。

ダリーのバージョン3の発表

02:15

Googleの大規模言語モデル、Birdの大規模なアップデート

07:04

マイクロソフトコパイロットの新機能

11:33

00:10

この放送リラックスは、1週間でよくネットに流れているAI関連の話題を、AIが自動でピックアップし、bbz、Koと私、ババゾノート、セコンKoとタテノがつらつらと話すポッドキャストです。

AXで暮らしにひらめきをオビジョンに、サビス体験や組織づくりを行っている、工夫AIスタジオの提供で行っています。

はい、というわけで、今週も機械音声から始まりました第9回目のリラックスになります。

セコンさん、よろしくお願いします。

よろしくお願いします。

いやー、今回の冒頭音声はいろいろ性のある発音で面白かったですね。

そうですね。ちょっとこれ、えっと、今回の11 Labっていうサービスで作ったんですけど、テキストを読み上げてくれるんですよね。

で、漢字とかだとうまく読んでくれなかったりするので、それをひらがなにしたりとか、古党典を入れたりしてむやりそれっぽく読ませてるんですけど、その関係でちょっと癖のあるイントネーションになったりしてるのかなっていう感じですね。

ですね。ですねっていうのは面白いなというイントネーションでしたね。

はい。

ちなみに、実は背景ではもう1個用意していたという話だったんですが、もう1個の音声はまた違った面白さだったんですか?

実はもう1個の方はですね、同じサービスなんですけど、そのボイスモデルをいくつか選べるんですね。

今のは何だったかな、名前は忘れたんですけど、男性のボイスなんですけど、もう1つの方は女性ボイスでちょっと読み方も異なるっていう、ただそれだけの違いなんですけど、実は今週2つ用意してましたっていう裏話ですね。

なるほどなるほど。じゃあ早速入っていきますか。

はい。ではでは今週も1週間分のニュースですね。

基本的にはAIの方でネタ上に流れた記事をですね、ピックアップして、それを我々の方で話していくという形になります。

ダリーのバージョン3の発表

ではまず1つ目ですね。これは読み方が毎回あっているのかちょっと悩ましいんですが、オープンAIが提供する画像生成のサービスですね。

ダリーというもののバージョン3、これが出るぞというのが大きな発表となっていましたね。

そうですね。なんかこの発表が面白かったのは出たぞじゃなくて出るぞっていう発表だったのが結構おお、みたいな感じでしたね。最初どこから使うんだみたいな感じになったんですけど。

そうなんですよね。あたかも出たんだと思って使おうと思ったらまだ出てないんだ。

でも使い方のデモ動画とかは出ていて、それでこんな感じになるんだってイメージはすごくついたんですけど。

細かい点はいろいろありつつも、ChatGPTにも組み込めたりとか、今までなかなか指示を聞かなかったプロンプトをちゃんと見とって作ってくれるとか、すごい期待感の高いサービスになってそうだなって感じでしたね。

そうですね。なんかこのサービス、一番やっぱり今BabazomoさんBBZさんが言った通り、ChatGPTの中にシームレスに組み込まれてるっていうのが結構楽しみだなっていうのがあって。

なんか生成系AIどころで有名なところだと、例えばMidJourneyみたいなサービスはDiscordとかのサービスを通してプロンプトを入力することで画像生成が可能みたいな感じだったんですけど。

このRally3は本当にChatGPTのあのUIから指示をするだけで画像がポコポコ作られるっていうのは、ChatGPTに慣れきらすんでる人からだとすごく作りやすい、使いやすい感じで画像生成もできそうですし、結構その画像生成をするためのプロンプトをどう作るかみたいなのに頭を悩ませたりするしたりもするんですけど、そういうところもChatGPTを通すと、そういうプロンプトのヒントとかも本当に対話型インターフェースを通してサクサクとやっていけるんじゃなくて、

そうするとまた違ったその使い勝手の良さみたいなところが生まれてきそうだなぁと期待しているところですね。

そうですね、実際ちょっと出てみないと何とも言えないんですけど、今そのOpenAIのChatGPTやりとりを共有する機能とかもあるので、そこでこうなんかこんなのできたよとかいうような活用もできるのかなぁとちょっと思ってたりしますね。

あとはそのコンテンツ生成っていうところで、著作権周りとかなんかいろいろこう考えるところがあるとは思うんですけれども、発表の中では特定のワードを含むと生成できなくしているとか、例えば除名人の名前とかですね、

クリエイターから申請があったらそのワードなのかな、をフィルターで除外して作れなくするみたいな、そういうクリエイターさんに配慮したスクリーンもなっていいそうな感じで、非常に使い勝手が良さそうだなというところですね。

この辺の著作権周りって結構センシティブというか、どういうふうに扱っていいのかっていうのを今いろんなところが現行法を整備していたり、その自分たちの考え方っていうのもどうすべきかみたいなのを謳っている中で、そういうところもちゃんとやっていくんですよっていうスタンスっていうのがある程度表明されてるっていうところも、ちゃんとその辺もやっていくぞと言っているOpenAIならではだなぁと感じますね。

もうですね、ちょっとまだプロダクト自体は触れる状態ないので、出てからお楽しみというところではあるんですが、非常に期待してお待ちたいと思います。

画像先生の話が出たので、関連するところでいくと、実際にはたくさんのネットのソースがあるわけではなかったのですが、取り上げられる回数が多かったので持ち出すと、

AI姿勢性における著作権問題の議論が盛り上がるというところで、AIのほうでピックアップされておりましたね。

そうですね、結構いつもこういうところって、毎週のようにAIのところの著作権回りどうなんだみたいなところは話として上がってくるので、今週もなかなかそこの部分が日本の著作権法に対してどうだみたいなところで、一部では盛り上がってたようですよね。

内容的にはすごく新しいというよりかは、今まで出てきた議論の延長というか、こういうところに注意しないといけないよっていうような内容になっていたと思うんですけど、

特に所要利用とかする場合には、いわゆる意図して作ったのか、意図はしていないけどできてしまったのかみたいなところで変わってくるので、

リンクをまた後ほど記載しますので、ポッドキャストの概要欄とかに詳細は読んでいただければなというところですかね。

Googleの大規模言語モデル、Birdの大規模なアップデート

はい、では続いて大きなところでいくと、Googleが提供している大規模言語モデルとしてのBirdというのがあると思うんですけれども、これが大幅なアップデートをしましたよというのが非常に話題になっておりましたね。

そうですね、ここのところがBirdが今まで多分3回ぐらい大幅なアップデートがされて、今回もアップデートはされたっていう中で、一番大きな機能としては、そもそもGoogleが提供しているようなGoogleワークスペース、Gmailだとか、Google Mapsとかの横断的なGoogleのサービスからも連携できるようになったよっていうのを大きく歌ってますよね。

そうですね、私自身もあれなんですよ、自分の個人のアカウントで試したりはしてたんですけど、例えば過去に受信したGmailからちょっと探してもらうとか、Googleドキュメントから情報を拾ってもらうとか、そういった自分が持っている情報を根拠にして生成してくれるっていうところがすごいなっていうところですね。

そうですよね、本当にGmailって言うと、僕も英語しか今は対応していないので、英語インターフェースにしてオンにする必要があるので、ちょっとそれをやってみて使ってみたんですけど、やっぱり自分自身のメールからこんな内容のメール検索して、要約して表示してみたいなことをやると、その通りにやってくれたりするので、そういうところで今までだと本当に検索窓にキーワードを入れて、自分で探して、内容を読んで要約するみたいな、いわゆるその一般的なインターネットの検索というか、検索窓にキーワードを入れて、自分で探して、内容を読んで要約するみたいな、いわゆるその一般的なインター

な体験が、BioNTechやChatGPTに置き換わったように、Googleの場合は、ただChatGPTは個人情報にアクセスするっていうのは非常に、

プラグインとかを使わない限りは難しかったのが、Googleの場合はちゃんと個人情報に配慮した自社サービスとつないでいって、さらに便利な検索体験を

提供しますよ、みたいなところは、いろいろ横断で情報を持っている組織だからこその強みを生かしたようなものをAIに組み込んできたなというので、

非常にうまいユーザー体験だなと思って使ってましたね。

そうですね、特に企業でGoogleワークスペースを対応しているところだと、もうすごい、何て言うんですかね、

さっき出たような情報の検索とか抽出、他にもいろいろ用途はあると思うんですけど、っていうのが多分劇的に変わってくるだろうなっていうことで、非常にうまいアップデートだったなっていうところですね。

そうですね、あとはそれに加えて、そのBirdっていうこのGoogleのAIモデルは、結構そのChatGPTだとやはり情報が2021年9月、最近アップデート少しされて、もうちょっと先まで読めるようになったらしいんですけど、やっぱりBirdを使っていると、かなり最新の情報までちゃんと生成AIで引っ張ってこれるっていうことが、やはり強みの一つとして打ち出していて、最近そこの部分の良さをおとびに感じることが出てきたので、結構場合によっては、

これって最近の情報だからChatGPT答えられなさそうだと思うと、結構個人的にはBirdも割と使うようになってきたんで、その辺もエンドユーザーとしては両方一緒にあって、どんどんどんどんいいサービスになってくれると使い勝手が伸びていくので嬉しいなと思って日々使ってますね。

はい。あと最新情報っていうのも大きな強みなんですけど、今回のアップデートでこのデータの操作はどこですかっていうのを聞ける機能がついていて、それを押すとこれはここの情報から取ってきましたっていうのが分かるので、いわゆるアルシネーションって言われる厳格ですかね、誤った情報とかもちょっと防ぎやすくなっているっていうのがアップデートとして含まれているより使いやすくなったという感じですね。

それはすごい大きいですよね。どこの情報本当だろうかって思って聞いて、このURLから参照しましたよっていうのがあると、実際本当かどうか賃金が気になるんだったらそこを見に行けばいいっていうのは、よりAIを補完しながら人がAIを使いこなすっていうところではすごくいいサポートになりますね。

そうですね。視覚的にも結構使いやすいので、試せる方、多分まだ英語だけなので試しにくいと思うんですけど、割と個人アカウントとかでも試せるので、ちょっと見ていただければなっていう感じですかね。

マイクロソフトコパイロットの新機能

Googleが結構パンチが効いていたので長めに話していたのですが、あとはですね、AIのピックアップの方だと、実は大体このあたりが非常に多くの割合を占めていて、その他のものが漏れていたので、ちょっと追加で足していきたいと思うんですけれども、

まず一つは、ちょうど昨日というか今日というか、マイクロソフトがマイクロソフトコパイロットというサービスに対して新しい情報を出したというのが非常に盛り上がっておりましたね。

そうですよね。次の大型アップデートでWindows11にも入るみたいな話もあり、普通に僕自身はWindowsも併用してMac、Windows両方使っていたりするので、非常にOSとインテグレートされてどれぐらい体験が上がるんだろうな、みたいなところは結構楽しみにしていますね。

そうですね。今回、9月から多分プレビューとかなのかな、提供され始めていて、いわゆるWindowsのOS、普段使っているPC上のアシスタント機能としてAIが導入されますと、それに伴ってかなりいろんな、例えばペイントだとかメモ帳だとか、いろんなソフトもですね、このアップデートで拡張されていて、

AI機能も評価されていっているっていうところで、多分、何でしょうね、ガラッとパソコンを使うっていう体験が変わってしまうのではないだろうかっていうぐらい、割と個人的には注目しているアップデートではありますね。

そうですよね。確かGoogleかどこか、Androidの全体的なログからの情報みたいなのを全部提供みたいなのを確か行っていた気がするんですけど、何を言ってるのかっていうと、要するにOSの情報をうまく活用すると、

チャットGPTが情報を検索してきて出すみたいな感じと同等に、OSに対してこんなことやってほしいんだけどって指示をすると、さまざまな情報からこの人がやりたいことってこうなんじゃないっていうところを提供できる最初の第一歩。

第一歩のところとしては、Windowsのオフィシャルの安心して使えるようなアプリケーションにご適用みたいなところが入ると思うんですけど、今後そこがどんどん広がっていくと、Windowsのソフトウェアはほぼ全部がAIに指示をするだけで、何か思っていた感じの操作してくれるみたいになると、今まで自分たちで画面のUIをクリックしてポチポチしながら何かを操作をしていたっていうのが、ある意味、指示出し一発でOS自体全部できるようになっていくみたいなところが、WindowsもそうだしAndroidも多分iOSとかも将来的にはどんどん広がっていくと思うので、

将来的にはどんどんどんどん入り込んでいくんだろうなっていうところの、最初の一歩としてどんなものが提供されるのかっていうのはすごい楽しみでありますね。

そうですね。多分結構いろいろ物を作ったりする人とかはより多分効果が出てくるのかなと思っていて、別にデモとかで示されていたわけじゃないんですけど、おそらく音声から指示をして、そこから例えば自分の撮った写真をペイントで加工して文章を書いてみたいなことも多分シームレスにできるようになってくるんじゃないかなっていうような、そういう未来がちょっと見えたなというかですね。

Windowsについては多分またいろいろと更新あると思いますので、引き続きウォッチしていければなと思っております。

あともう一つはですね、これは割とエンジニアの方向けに嬉しいニュースだとは思うんですけど、GitHubコパイロットチャットというものが個人でも利用可能になったよっていうのが今週かな、結構話題になってましたね。

そうですよね。今までここの部分っていうのがビジネス向けのコパイロットユーザーだったり、そういう方々には、あとは最初にウェイトリストに登録していたユーザーには提供されていたんですけど、そこの部分がより広く一般的なGitHubコパイロットの機能として提供されたっていう、いわゆるある意味ほぼ全開放みたいなところが割と話題になっていましたよね。

そうですね。機能自体は割と出回っていたというか、知れ渡っていたので、そこに関する大きな変更はないんですけど、一般開放されたっていうことで、例えば企業に勤めてない方でも個人利用で気軽に使えるっていうのが大きな話だったなっていうところですね。

そうですよね。チャットGPTの画面をわざわざ開かなくても、ちょっとしたものとか、あとは開いているソースコードのコンテキストを読み取って、その中ですぐ回答してくれるみたいなところは使い勝手が非常に高かったりするので、これでどんどん活用して生産性が上がる方もすごく多いんじゃないのかなと思っています。

なので、興味のある方はちょっと使ってみてくださいという感じですね。

次、サインオーラインになるかなと思うんですけど、個人的にちょっとあんまり思えてなかったんですけど、YouTubeですね。YouTubeって動画投稿サイトなんですけど、ショート動画とかも上げれるんですよね。

そのYouTubeショートっていうのをテキストで作れるような機能ができた、ドリームスクリーンだったかなというツールができたっていうのが結構面白くて。

最近そのYouTubeってショート動画がかなり最近っていうものかどうかわからないですけど流行っているらしくて、それが手軽に撮れるようになった。

TikTokとかもそういう感じだと思うんですけど、やっぱり気軽に文字を打つだけで自分だけの映像作品ができて、それが家に公開できるっていう結構すごいユーザーさんにとってはいい体験なのかなと思って、今回一度取り上げてみましたっていうところですね。

そうですね、こういうショート動画の機能ってTikTokもInstagramも始め、いろんなところを出しているっていう中で、ちゃんとその動画の編集コンテンツ、面白コンテンツを作って投稿するっていう場合もあれば、自分自身ちょっとしたことをお知らせしたいとかっていうところもあって、そういうところでわざわざ画像を探す、動画を探して生成する、自分たちで探して持ってくるっていうところの手間を、ちょっと文字を入れるだけで動画や写真がささっと生成されて投稿できる。

場合によってはその動画でなかなか面白いコンテンツを作ることができるみたいな形の、なんかこのクリエイターの方々がよりそのね、いろんな使い方ができる一つのサポートツールとして結構動画生成がサクッとできるみたいなところはだいぶ面白そうな機能ですよね。

そうですね。例えばそのテキスト打つだけとか、ちょっと自分の動画を撮るだけとかで、勝手にこう文字起こしとかナレーションとか、それこそフィルターエフェクトみたいな音楽もつけてくれるとかいう、今まで結構大変だったものがシュッとできるようになるっていうのはすごく何でしょうね、作り手も増えそうだなっていう感じですよね。

そうですよね。今までまあ人間がやったらこういう風に文字打ち込むよねみたいなところをAIが自動でこういう感じで書きたいんじゃないんですかってやると、これこれみたいなところっていうのはコパイロットとかも同等で、なんかやっぱりこういろいろやりたいことに対してAIがサポートしてくれて、どんどんそれを取り込んでいって気軽にやろう、やれるようになろうみたいなところはすごくそのサポートをするみたいなところではいい感じの見つかっていけそうですよね。

そうですね。たぶん他のプラットフォームとかもどんどん強化してくるとは思うんですけど、やっぱりYouTubeっていう大きなところを持っているバックグラウンドがあるので、今後もちょっと要注意かなと、要チェックというかですかね。

では今週も20分ほど話して重要なところは抑えれたかなと思いますので、今回はこれで終わりたいと思います。締めの言葉も今回は機械音声にしたので、それを流して終了にしたいと思います。

それでは次回の放送をお楽しみに。バイバイ。