1. rel.ax
  2. #35 GPT-4 Omni登場:速さと多..
2024-05-17 16:08

#35 GPT-4 Omni登場:速さと多様性を兼ね備えた新世代AIモデルが変える未来

bbz
bbz
Host

ポッドキャスト第35回目の紹介 - 新しいAIモデル「GPT-4 Omni」が登場し、その進化や機能について話題になっている。
- GPT-4 Omniは速く、安価であり、テキスト以外のマルチメディア処理も優れている。
- GPT-4 Omniの音声機能やリアルタイム性についても注目されている。
- Google I/Oイベントでは、AI技術の進化や新しい動画作成AIについての発表があった。
- 日本のスーパーコンピューター「不学」を使ったAIモデルの公開や、IBMのLLMモデルのオープンソース化など、さまざまなニュースがあった。
- 画像生成技術の進化により、よりリアルなAI画像が生成される可能性がある。

※ タイトルや概要は AI にて生成させています。

放送で紹介されたニュースへのリンク

https://ainewsdev.substack.com/weekly-ai-news-43


放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。

サマリー

新AIモデルGPT4オムニの登場とその進化について話しています。 日本製の大規模言語モデルと画像の理解モデルが注目されており、IBMがモデルをオープンソース化しています。光のライティング技術を活用したAI画像生成も話題となっています。

00:10
この放送、リラックスは、1週間でよくネットに流れているAI関連の話題を
AIが自動でピックアップし、bbzこと私、ババゾノートセコンことタテノが
つらつらと話すホットキャストです。AXで暮らしにひらめきを、
オービジョンにサービス体験や組織づくりを行っている
工夫AIスタジオの提供で行っています。
はい、ということで、いつものごとく始まりました、リラックス。
今回35回目です。よろしくお願いします。
よろしくお願いします。
はい、今日もですね、1週間の間にネット上にいろいろ流れている
AI関連の記事ですね。それをAIがまとめておりますので、それについて
お話をしていく回となっております。はい、で、今週先に言っておくとですね
パンチの強い奴がいてですね、それが非常に多くの記事を締めていたりするので
何でしょうね、その話ばっかりになる可能性も気にしもあらずですが
ご了承くださいという感じですね。はい。
何でしょうね、この記事は。
そうですね、何でしょうね、もう何でしょうね、なんとなく
勘付いている人が多いような気がするんですけど
とりあえず言っておきますか。
言っておきますか、一発目のパンチのあるやつを。
パンチのあるやつを言っておきますか。
GPT4オムニの登場
はい、ダダンということで、新AIモデルGPT4オムニというものが
登場しましたと。何を言っているかというと
チャットGPT、みんな大好きチャットGPTの提供をもと
オープンAIが春のアップデートとしてですね
何だろう、紹介アップデート番組みたいなのもちょっとやったわけですね。
30分ぐらいの短い内容ではあったんですけど
非常にいろいろな大きなニュースが含まれておりましたと。
もとちょっと言いましたけどGPT4オムニ
書き方はGPT4アルファベットのOなんですけど
っていうのが賢いしかし速いそして安い
というのが一番大きなものではあるんですけど
これが話題をさらっていったというような感じですよね。
そうですね、GPT4系列も基本的にGPT4の進化というところできて
今回もGPT4の進化といえば進化なんですけど
かなりできることがまたさらに広がったみたいなところで
すごい話題でしたね。
そうですね、いろいろGPT4以外にもいろいろあったんですけど
とにもかくにも速い圧倒的な速さで回答が返ってくる
昔のチャットGPT3.5ぐらいの速度で返ってくる
しかしなかなかに性能が良いぞというのですごくいいなと思って
でもお高いんでしょって思ったら実はコストは
ちょっと前のチャットGPT4ターボの半額ぐらいで使える
これはAPIっていうものの使い方のコストではあるんですけど
いやもうとんでもないなというところですよね。
そうですね、あとはチャットGPTってプロプランっていう
上位プランに入らないとGPT4の機能を使うことができなかったんですけど
今回のGPT4オムニだとちょっと設定が必要なんですけど
無料プランでも何時間10回まで使うこととかができたりするので
ぜひこれを機会にチャットGPT3.5しか使ったことがない人がいたら
ぜひオムニの力を味わって無料で味わうことも可能なので
その辺で使ってみるっていうのもすごい大番振る舞いだなと非常に思いましたね
結局というか課金しないと使えなかったモデルっていうのが
今回無料のアカウントでも使えるようになっていて
それが一番新しい賢いモデル
かつ前までだと無料だとテキストのやり取りしかできなかったと思うんですけど
今回オムニっていうものを使えるので
いろんな音声だったり画像だったりを取り扱えることができるので
存分にお試しができるという感じになっているところですね
そうですね そしてオムニっていう名前の通りテキストだけではなくて
画像とか音声の部分で大幅に機能が強化されたと言われていて
非常に例えば画像の読み取り OCRみたいに言われる
画像から情報とか文字を読み取るっていう性能も
日本語に対してもかなりの向上みたいなのが見受けられたりですとか
すごくそういうテキスト以外のところのマルチメディア処理も
非常に優れているというところで話題になってました
そうなんですよね
基本的には騒がれた内容というのはオムニに関するものでもあるんですけど
先日のデモ発表の中でいくつか他にも発表がありまして
実際に新しいモデルが出ましたよっていうのは当然なんですけど
GPT4オムニの速さと安さ
それを使いやすくできるようなMac OS用のデスクトップアプリが出てくるだとか
あるいは既存で出ていたスマートフォン用のアプリ
これの音声機能の表現力だったりだとか
あとは会話のリアルタイム性だとか向上するとか
あとはブラウザのChat GPTの画面がちょっと使いやすくなるように刷新されるとか
モデルの改善以外の部分でもより使いやすくなっていくよっていうようなデモが披露されて
そこもなんか面白いなっていうような部分ではありましたよね
そうですよね バパ殿さん的にはすごくいつもしょっちゅうイヤホンを押しながら
Chat GPTに声をかけているっていう感じのイメージなので
そうするとこれの機能が強化されると非常にAIとの対話みたいなところも
適当じゃなくて本当に音声で会話しながらみたいなのも
非常に未来を感じさせるような動画も公開されていたりしましたよね
そうなんですよね
特に自分自身はまだ最新の機能を使えていないので試せてはないんですけど
もともと特にスマホ向けのChat GPTアプリって音声会話ができるような機能があったんですね
ただ今までは長々と話して終わったら回答でまた話したら回答っていう
一方の言うことが終わるまでは次に行けませんよみたいなところだったんですけど
最新のものではそうではなくて割と人間が喋っているような
今合図中ってもらったかのような感じで
喋っている途中に反応返してくれるそういったことが可能になっているようで
非常により愛がってが良くなって
日々の僕のQOLは上がりそうだなっていう感じですね
本当にAIと対話している感が今までだとどちらかというと
文字入力を言葉で行って対話をするみたいなところから
より自然な流れになっていきそうということで楽しみですね
そうですねちょっとこの辺りは今年まだ半年も経ってないですので
次のアップデートとかも気になっているなっていうところもありながら
今週は特にこれが話をさらに見たというところですね
ですね
タイミング良くか悪くか
今週もう一つ大きなイベントがありましてですね
そこで何かというとGoogle IoTイベントがあって
Googleさんのアップデートイベントが今週あったんですけど
そこでいくつか発表がありまして
一つ大きく取り上げられていたのが
新しい動画を作ってくれるAIですね
VIOというものが発表されていて
かなり長尺っていうんですかね
1分とかそれ以上のものが高画質で作れるっていうデモ画像が
デモ動画が流れていて
それも話題をされたかなっていうところですかね
そうですね Google Ioの方でもさまざまなAI技術が話されていたんですけど
その中で一番話題になっていたのが
こういうニュースサイトから取ってくるっていうところだと
VIOかなというところで他にもたくさんGoogleからはいろんな
さらにAIでできることが広がったよみたいな話が出ていたりするので
興味ある方はぜひぜひその辺を探してみても
いろんなものが得られるのかなと思いますね
日本製のAIモデルと画像理解モデル
そうですね 非常に多くの発表がなされていますので
Google Ioまとめとかで検索してもらうと
いっぱい出てきますので
その中の一つだけ他にも取り上げられているんですけど
画像 ビジョン言語モデルというふうに表現したりですかね
画像とテキストを理解するような新しいモデルも
パリジェマっていうのが出たよっていうのも取り上げられておりますが
詳細については皆さん見てもらったほうが早いかなという感じですね
そのほかごまとっていうほどのちっちゃなニュースではないんですが
今回パンチが大きいのがいっぱいあったので
霞んでしまうところではあるんですが
いくつかのほうでピックアップしているので
それも紹介していこうと思いますと
まず一つは不学ってパッと聞いて
分かる方 分からない方いると思うんですけど
日本のスーパーコンピューターの中に不学っていうのがあるんですけど
それを効率的に使うことによって
純日本製の大規模言語モデル AIですね
公開されるようなのがありましたっていう感じですね
そうですね こちらはすごい性能が高いとかという方向よりも
GPUみたいなのを使わず
日本の国産のものだけでもトランスフォーマーモデルを学習できるぞ
というところで結構注目されていましたね
ちょっと今までとは毛色が違うといいますか
そうですね 本当に純粋に国産のGPUじゃなくて
しかもCPUだけで学習させることができるみたいなところは
もし何かが起きたらみたいなところの話で
非常にちゃんとそういうテクノロジーを国内でも有してるんですよ
みたいなところの方向として注目されていた感じですね
ここについては日本製ということもあって
今後どうなっていくのかなっていうところは注目したいところですね
あとは これもGoogleに近いGoogleのディープマインドっていうところが
アルファフォールドっていうものですね
オープンソース化とAI画像生成技術
これもAIのモデルなんですけど
これが分子の予測制度といったらいいんでしょうか
に貢献しそうだぞというところで
医療関係の技術だとか病気とかですね
そういったものの解明に役立つのではないかというところで
非常に注目を集めていたというところですね
パッと医療とかだと応用があまりイメージがつかないんであれなんですけど
これが非常に実現できると
さまざまな医療に対して応用が効くのではというところで
非常に注目されてましたよね
ここについてはなかなか説明するのは難しいところもありますので
ご興味ある方はリンクとか載せますのでまたご覧いただければと思います
次はサクッといきたいんですけど
次期iPhoneのiOS18にChatGPTが乗るかもしれないという噂が
噂されているので別に乗るよという発表じゃなくて
ちょっと噂が話題になってきたという感じですね
なので将来のことはわからないですが
今後期待という感じで次に行きたいと思います
次はIBMさん大手のIT企業ではあるんですけど
作ったLLM Aのモデルなんですけど
オープンソース化してGitHubで公開したよというので
記事が出ておりましたという感じですね
最初はOSSじゃなかったんですけど
これを改めてOSSにしてモデルの重み等々を公開したということで
一つLLMが公開されたという感じですね
そうですね 最近の流れではないですけど
モデルが新しく出てきてオープンソース化されましたよというところですね
次ニュースとしては最後になるんですけど
これ画像系だから割と引っかかったのかなと思うんですけど
画像生成やいろいろあると思うんですけど
その絵が作成する画像の照明の
照明じゃないとの当たり具合とかですね
いい感じにしてくれる技術というか
ものが出てきたというので結構記事になってたという感じですね
そうですね もともとこの技術を作った作者が非常に有名な
コントロールネットという画像で構図とか人間のポーズとかを
AIにうまく作成させるという技術で非常に論文とか出していたり
有名な技術を作った方だったんですけど
この方がまた光のライティングっていう結構難しい表現技術を
またうまく学習させて表現できるようにする方法っていうのを公開されていて
これができると本当に現状リアルで撮ったような写真
例えばモデルの写真とかを照明の方向とかをうまく変えたり維持したりしながら
背景だけを綺麗に合成するみたいなことが可能になっていくと思うので
非常にまたリアリティがあるようなAI画像がどんどん生成されていきそうだなっていうところで
非常に話題の技術だなと思っていて個人的にも着目しているところですね
実際デモ画像とか独自にというか試せるデモ環境のところがあるので
ぜひ見ていただければなという感じですね
今週1週間の話題ですね 数としては間もあったんですけど
とりあえずオープンAIのやつがパンチが強くいっぱい出てきたというところで
今週は盛り上がっていたなという感じですね
ではまた来週も1週間分のニュースをおしゃべっていきたいと思いますので
よければまた聞きに来てくださいというところで今回のニュースは終わりたいと思います
それでは次回の放送をお楽しみにバイバイ
16:08

コメント

スクロール