ポッドキャスト第18回目の紹介 - オープンAIが新しいQ-Starというものを開発しているとのニュースが話題になっている
- マイクロソフトがCopilotというシリーズを公開し、Windowsでの使用が可能になった
- AWSがAIの学習に特化した新しいプロセッサを作成し、学習コストの削減が期待されている
- AWSが企業向けのAIチャットボット「Q」を発表し、簡単に作成できるサービスが提供される
- GoogleのBirdサービスがYouTubeの動画を理解し、質問に答える機能が追加された
- 画像生成技術が進化し、AIによるアニメーションや動画の作成が高品質かつ高速に行えるようになった
- Stability AIがStable Diffusionという高速な画像生成モデルをリリースし、画像生成の速度と品質が向上した ※ タイトルや概要は AI にて生成させています。
放送で紹介されたニュースへのリンク
https://ainewsdev.substack.com/weekly-ai-news-19
放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。
サマリー
OpenAIは新しいAI技術であるQスターの開発を行っており、マイクロソフトのコパイロットが正式に公開されています。また、AWSは学習に特化したプロセッサを開発し、企業向けのAIチャットボットサービスも発表されています。GoogleのBirdというサービスの新機能によって、YouTubeの動画を理解し、質問に答えることができるようになりました。一方、Stability AIのSDXLターボモデルは短時間で画像を生成することが可能であり、画像生成技術の進化や新たな活用方法に期待されています。
オープンAIのQスター
この放送、リラックスは、1週間でよくネットに流れているAI関連の話題を
AIが自動でピックアップし、bbzこと私、ババゾノートセコンことタテノが
つらつらと話すポッドキャストです。AXで暮らしにひらめきを、O-Visionに
サービス体験や組織作りを行っている、工夫AIスタジオの提供で行っています。
というわけで、第18回目、やっていきましょう。今年も残り役がつきですが、
まだまだAI関連のニュースが出てきますね。では、セコンさん、やっていきましょう。
はい、やっていきましょう。
ちょっとなんかね、日本語うまくなかったですけど、残り1ヶ月ですが、今年も残り
ニュースをつらつらと喋っていきますので、よろしくお願いします。
はい。
はい、では早速、今週のニュース、喋っていきたいなと思います。
まず初めにですね、大きなニュースいくつかあるんですけど、
先週お話しした内容については、ちょっと割愛していくんですけど、
今週もですね、前回お話ししたとおり、オープンAIのサム・アルトマンさんが
結局退任になってまた戻ったり、みたいな話があってですね、今週も引きずっているので、
そこについてはちょっと割愛しようかなと思っております。
はい、というわけでサム・アルトマン氏の騒動をうんぬんは一旦飛ばすんですが、
オープンAI関連でいうと、一つ新しい情報が出たので、ちょっと喋っておこうかなと思います。
実際、中身についてはまだ推測の域は出ないんですけれども、
オープンAI、ChatGPTを提供している会社が新しいQスターというものをどうやら開発しているようですぞ、
というニュースがちょっと無駄になりました。というのが今週ですよね。
そうですね、今回その退任とかいろいろな劇はあったんですけど、
その中で次の次世代のChatGPTなのか、それとも別のものかっていうのはさておき、
Qスターというコードネームで何か新しいことをやっているぞっていうところが結構話題になりましたよね。
そうですね、技術的なところを語るとちょっとあれなんですけど、
記事とかでよく言われているのが、割とAIって数学とか、
AIというかLLMっていう大規模言語モデルですね、数学みたいなの得の苦手なのだが、
それができるようになりそうだぞというようなところがちょっと大きなところですよね。
そうですね、そこの部分は技術的なところの話は云々というのはありながらも、
ちょっとお話しすると、教科学習と呼ばれているような、
何かそのAIがやったことによってフィードバックを戻して、
それをまたさらに理解してAIがいろんなことを試行錯誤していくみたいなところが人間と一緒で、
人間も何か自分が行動を行ったら、その行動を例えば先生からフィードバックをもらって、
その結果次の行動に生かし、その次の行動の生かし方というのも、
いろいろな考え方があって、みたいなところがあったりするんですけど、
そういうのをその学習の一個のやり方が、教科学習っていう方法でAIを学んでいったりするんですけど、
それを取り入れたまた新しい価値を持ったようなAIを作っているんじゃないか、
みたいなことが言われていて、そういうことがどんどんどんどん進んでいくと、
今までチャットGPTって自分自身が何か伝えたことによって、
フィードバック、チャットGPTが答えてくれるっていうところから、
さらにより人間にとってより良い答えだったり、
さっき馬場園さんが言ったような数学の解き方みたいな、
今までだといろいろなことをやらないと結構解かせることが難しかった課題も、
AIが勝手に学習をしていって解きやすくなるのではと、と言われていて、
そういうところでは本当にまた次の世代のAIの進化というところが、
またすぐにでも訪れそうな気がしていて、
噂話ではありながらも結構業界を盛り上げていましたね、この話が。
あまり深い話をするとあれですけど、内容的にも非常に興味深くて、
利用する人にとってもすごく有用な新しいモデルが出てきそうだなというところで、
盛り上がっていたというのが今週の一番最初のニュースとなります。
マイクロソフトのコパイロット
次はですね、マイクロソフトと近しいところではあるのですが、
ごめんなさい、間違えました、オープンAIと近しいところではあるんですけど、
マイクロソフト社が提供しているコパイロットというシリーズかな、
が正式に公開されましたね、というのがちょっとした大きなニュースですね。
そうですね、コパイロットで、その中でもとりわけWindowsでそのまま使える
マイクロソフトコパイロットというものが出てきていまして、
現状プレビュー版というので少し前から扱えていたんですけど、
Windowsの設定みたいなところをWindowsのAI、Windowsが搭載している
Chat GPTみたいなのに指示をすると、そういうことをやって、
プレビューみたいなツールが本格展開、正式リリースを始めた
みたいなところがニュースになっていました。
今は現時点だと正直なところ、できるところってまだまだ限られているんですけど、
このOSの部分に関して同じようにChat GPTに指示を出すみたいな感じで
いろんな操作をしてくれるっていうのは非常に夢が広がるなというのがあって、
将来的には本当にOSにこんなことをやってほしいという指示を出すと、
WindowsだったらExplorerを開いてファイルの移動をして、画像の編集を行って
アップロードをしてくれるみたいなところも将来は自動化されていくのでは
みたいなところにつながったりするので、今は本当にそこの部分の第一歩かもしれないんですけど、
ひょっとしたら1年後、2年後、OSに簡単に指示をするだけで
どんどんAIが勝手にいろんなことをやってくれるような未来に
つながっていくのかもしれないですね。
そうですね。単純にユーザーさんが使っている端末の情報をもとに
その場で答えてくれるみたいなのが実現できそうだなっていうのが
期待値としてすごく高いなっていうところですね。
あとちょっとややこしいんですけど、もともとサービスとして提供してた
名前がちょっと変わったりして、コパイロットシリーズに統一された
っていうのもちょっとしたポイントですかね。
そうですね。今まではいろいろコパイロットっていう名前はついていなかったんだけど
裏側ではAI系の処理をしていたみたいなのが、全部コパイロットシリーズに
統一されたりしたんで、結構ネットでは混乱を招くんじゃないのかみたいなことを
言われていたんですけど、名前的に全部そういう名前にはコパイロットつけますよ
みたいなマイクロソフトの方向性が見えてきたりしましたね。
そうですね。なのでマイクロソフト系の出すAIは大体コパイロットですよと
コパイロットの中にいくつか中身のサービスが分かれていきますよ
っていうふうに投稿されたと理解いただくといいのではないかなと思います。
AWSのプロセッサとAIチャットボット
ではオープンAIマイクロソフトときましたので、続いてはAmazon AWSの話を
ちょっとしようかなと思います。2点ありますね。まず1つはここはさらっと
いこうかなと思うんですけれども、AWSがいわゆるAIの学習に特化した
新しいプロセッサを作りましたよというのがある意味ニッチなところではあるかもしれないんですけど
大きな話題となったかなというところですね。
そうですね。AWSのイベントが今行われていて、それに応じていろいろな情報というのが
出てきているんですけど、その1つが今話されたように学習に特化したような
いわゆるGPU的な処理を行えるようなチップをAWSが出してきて
性能がだいぶ高いんじゃないのかと言われているというのが1つですよね。
そうですね。これに関して言うと詳細についてあまり話すことはないんですけど
そういった学習のコストが下がるということは最終的に提供する機械学習モデルとか
AIのコストも下がっていくよねというようなところにつながってくるのかなというので
ちょっといろいろ期待しているというところですね。
はい。では続いて2個目の。
そうですね。次はさっきしこもさんも言っていたように
今週AWS周りの発表でいっぱいあったんですけど
その中の1つとして企業向けのAIチャットボット
多分読み方はQであっていると思うんですけど
アルファベットのQですねが発表されて
会社の用途に応じたチャットボットが簡単に作れるサービスが出てきましたというものですね。
そうですね。Amazonは他のGoogleとかMicrosoftに比べて
ちょっと生成型AIで一歩競争から少し後ろ行っているみたいなイメージを結構持たれているんですけど
そこに対してどんどんどんどんそういうところにも乗ってくるよみたいなところが
結構強く打ち出されたようなプロダクトかなと思ってますね。
やっぱり実際プライベートで使うAIの使い方と
業務で使う使い方って結構違ってくると思うんですけど
そこにちゃんと特化したもので
既存の自社サービスとかそういったものがAWSに乗っかっているんだったら
割と簡単に使えるよっていうのがメリットなのかなって思ったりしてますね。
そうですね。AWSのデータ関連系でうまくAWSの仕組みに乗っかると
そんなに難しいことをせずに
例えば自分たちの持っているデータをうまくQから答えを引き出して
エンタープライズ向けとかビジネス向けに機能として実装するみたいなのが
すごくやりやすくなってきそうな感じがしますね。
あとそれに今回のニュースでは取り上げないですけども
いろいろAI系のニュースもAWSのイベントで発表されてますので
多分来週あたりにまた出てくるのかなと期待しております。
では大きな大手さんの話が続いているので
次はGoogleの話をしようかなと思うんですけれども
Googleの新機能BirdによるYouTube動画の理解
Googleさんが提供しているBirdというサービスがありますと
これはチャットGPTみたいないわゆるLLM大規模言語モデルで
いろんな会話ができるんですけど
今回YouTubeの動画を理解してしゃべってくれるっていう機能が
追加されたというのが話題になりましたね。
そうですね。実際のところAIでどこまで処理をしているのかっていうのはあったり
例えばYouTubeだともう字幕の情報っていうのが手に入るので
その字幕を組み合わせれば今までもできたりはしたんですけど
それがより簡単にGoogleのBirdっていうAI上から
どんどんYouTubeの特定動画に対していろんな質問を投げかけて
答えてくれるそんな機能が入りましたよね。
個人的にはこれやっぱり来たかっていう感じなんですけど
MicrosoftとかOpenAIとかいろんなそのAI系強いところあるんですけど
Googleはやっぱり大きいところってこういうYouTubeみたいな動画とか
データをいっぱい持ってるのがやっぱ強いなと思ってて
それが今回まだそんなに精度は高くないんですけど
自社のデータを使って新しい機能が出てきて
これは多分他ではプログラムとか裏で書けばいろいろできるんですけど
シュッと作る分には他はなかなか真似しにくいので
いい感じで使ってきたなというふうに思ってますね。
そうですね。大量の動画コンテンツを持っているみたいなのは
やっぱりGoogleのすごい強みだと思うので
それをLLM、生成AIとうまく結びつけて活用提供してきたな
っていうところを感じさせるプロダクトですよね。
プロダクト機能。
今後もちょっとこういった機能拡充が期待されるので
ちょっと要注目だなというふうに個人的には思っております。
はい。
ではですね、大手の発表は大体このぐらいにしてですね
あとは画像とかの話になってくるんですけど
まずはこっちから行こうかな。
アニメート・エニュアンっていう、これは技術名になるのかな。
何かというとですね、1枚の絵ですね。
人間でもキャラクター、アニメ画像でも何でもいいんですけど
それと動きを表すもの、これをAIに与えると
キャラクターが指示をした、動きをしたような
動画かアニメーションを作ってくれると。
もともとこういった技術はあったんですが
めちゃめちゃクオリティが高いものができるようになった
っていうのが結構話題になってますね。
Stability AIのSDXLターボモデルによる高速画像生成
そうですね。この辺の技術っていうのは結構日進月歩で
この半年ぐらいはよく動画生成を
人の動きに合わせて行うみたいなのが
どんどん進化をしてきたっていう中で
また一つクオリティが1ランク上を行くみたいなところが
今回論文発表されて
結構動いている画像の破綻っていうのが
どうしても今までのアニメーションだと見られたんですけど
その破綻っていうのがすごく少なく抑えられているので
これは本当によりリアルというのは
より本当に本物に本物として
いろんなところで活用しやすいんじゃないのか
みたいな技術が出てきたっていうところで
今結構話題になっていますね。
こちらとかは多分参照の後でURLとかに
貼ると思うんですけど
実際に動いている動画みたいなのを見てもらえると
すごくスムーズに動いているのが分かると思うので
ぜひ興味がある方は
その辺を見てもらえるといいのかなと思ってます。
こちらに関してはその通りで
100文は1件に近づくということで
見ていただくとかなり分かるので
分かりやすいので
ぜひ見ていただければなと思います。
次が今週ニュースとしては最後になるんですけれども
これもなかなかインパクトのあるもので
今度は画像の生成ですね。
もともと画像生成のモデルとかを出していた
Stability AIっていう会社が
Stable Diffusionっていうモデルあるんですけど
略称でSDXL
それのターボモデルっていうのがリリースされたんですね。
これ何がすごいかっていうと
もう画像の生成速度が異常に早いんですよね。
これがすごすぎて結構話題になってますね。
そうですね。
なんか最近この画像生成を早くするっていう技術が
たくさん出てきてるんですけど
その中でもブームを抜いて結構早いなというところがあって
本当になんか今までの生成速度が
10倍20倍の速度でポコポコ画像が作られると
現状はまだまだそのクオリティっていうところですと
正直今までのモデルよりはちょっと劣ってるな
みたいな感じてしまうところがあるんですけど
この速度っていうところは圧倒的で
クオリティもどんどんどんどん上がっていくでしょうから
その辺からまた画像生成の広がり
もしくは画像生成でまた新しい使い方とかが
どんどんどんどんされていくのではないかな
みたいな感じの圧倒的速度ですね。
そうですね。
その公式の発表とかでもリアルタイム生成と歌うぐらいの
それほどの速度になっているっていうのと
あとやっぱりその画像生成って今までどうしても
時間がちょっとかかっちゃうっていうところだったんですけど
それが素早く生成されることで
活用ケースも割と広がっていくんじゃないかな
っていうような気がしておりますね。
そうですね。
あとは先ほどのアニメーション生成の話もしたんですけど
アニメーション生成裏で行っているのは
似たような画像生成なので
このようなところがすごく早くなると
実際のアニメーション動画作成みたいなところも
どんどん速度が圧倒的に早くなっていきそうだな
みたいなところで結構今週は
画像とか動画の未来をまた感じさせるような
発表がいくつかあったかなという感じがしましたね。
そうですね。
ちょっとこう年末に向けてというところではあるんですけど
楽しみのニュースがいっぱい出てきて
嬉しいなというところですね。
はい。
今週はこれでニュースの紹介は終わろうかなと思いますので
締めの言葉をしゃべってもらって
一旦というか配信は終了したいと思います。
それでは次回の放送をお楽しみに。バイバイ。
16:41
コメント
スクロール