#35 GPT-4 Omni登場：速さと多様性を兼ね備えた新世代AIモデルが変える未来

00:10

この放送、リラックスは、1週間でよくネットに流れているAI関連の話題を

AIが自動でピックアップし、bbzこと私、ババゾノートセコンことタテノが

つらつらと話すホットキャストです。AXで暮らしにひらめきを、

オービジョンにサービス体験や組織づくりを行っている

工夫AIスタジオの提供で行っています。

はい、ということで、いつものごとく始まりました、リラックス。

今回35回目です。よろしくお願いします。

よろしくお願いします。

はい、今日もですね、1週間の間にネット上にいろいろ流れている

AI関連の記事ですね。それをAIがまとめておりますので、それについて

お話をしていく回となっております。はい、で、今週先に言っておくとですね

パンチの強い奴がいてですね、それが非常に多くの記事を締めていたりするので

何でしょうね、その話ばっかりになる可能性も気にしもあらずですが

ご了承くださいという感じですね。はい。

何でしょうね、この記事は。

そうですね、何でしょうね、もう何でしょうね、なんとなく

勘付いている人が多いような気がするんですけど

とりあえず言っておきますか。

言っておきますか、一発目のパンチのあるやつを。

パンチのあるやつを言っておきますか。

GPT4オムニの登場

はい、ダダンということで、新AIモデルGPT4オムニというものが

登場しましたと。何を言っているかというと

チャットGPT、みんな大好きチャットGPTの提供をもと

オープンAIが春のアップデートとしてですね

何だろう、紹介アップデート番組みたいなのもちょっとやったわけですね。

30分ぐらいの短い内容ではあったんですけど

非常にいろいろな大きなニュースが含まれておりましたと。

もとちょっと言いましたけどGPT4オムニ

書き方はGPT4アルファベットのOなんですけど

っていうのが賢いしかし速いそして安い

というのが一番大きなものではあるんですけど

これが話題をさらっていったというような感じですよね。

そうですね、GPT4系列も基本的にGPT4の進化というところできて

今回もGPT4の進化といえば進化なんですけど

かなりできることがまたさらに広がったみたいなところで

すごい話題でしたね。

そうですね、いろいろGPT4以外にもいろいろあったんですけど

とにもかくにも速い圧倒的な速さで回答が返ってくる

昔のチャットGPT3.5ぐらいの速度で返ってくる

しかしなかなかに性能が良いぞというのですごくいいなと思って

でもお高いんでしょって思ったら実はコストは

ちょっと前のチャットGPT4ターボの半額ぐらいで使える

これはAPIっていうものの使い方のコストではあるんですけど

いやもうとんでもないなというところですよね。

そうですね、あとはチャットGPTってプロプランっていう

上位プランに入らないとGPT4の機能を使うことができなかったんですけど

今回のGPT4オムニだとちょっと設定が必要なんですけど

無料プランでも何時間10回まで使うこととかができたりするので

ぜひこれを機会にチャットGPT3.5しか使ったことがない人がいたら

ぜひオムニの力を味わって無料で味わうことも可能なので

その辺で使ってみるっていうのもすごい大番振る舞いだなと非常に思いましたね

結局というか課金しないと使えなかったモデルっていうのが

今回無料のアカウントでも使えるようになっていて

それが一番新しい賢いモデル

かつ前までだと無料だとテキストのやり取りしかできなかったと思うんですけど

今回オムニっていうものを使えるので

いろんな音声だったり画像だったりを取り扱えることができるので

存分にお試しができるという感じになっているところですね

そうですねそしてオムニっていう名前の通りテキストだけではなくて

画像とか音声の部分で大幅に機能が強化されたと言われていて

非常に例えば画像の読み取り OCRみたいに言われる

画像から情報とか文字を読み取るっていう性能も

日本語に対してもかなりの向上みたいなのが見受けられたりですとか

すごくそういうテキスト以外のところのマルチメディア処理も

非常に優れているというところで話題になってました

そうなんですよね

基本的には騒がれた内容というのはオムニに関するものでもあるんですけど

先日のデモ発表の中でいくつか他にも発表がありまして

実際に新しいモデルが出ましたよっていうのは当然なんですけど

GPT4オムニの速さと安さ

それを使いやすくできるようなMac OS用のデスクトップアプリが出てくるだとか

あるいは既存で出ていたスマートフォン用のアプリ

これの音声機能の表現力だったりだとか

あとは会話のリアルタイム性だとか向上するとか

あとはブラウザのChat GPTの画面がちょっと使いやすくなるように刷新されるとか

モデルの改善以外の部分でもより使いやすくなっていくよっていうようなデモが披露されて

そこもなんか面白いなっていうような部分ではありましたよね

そうですよねバパ殿さん的にはすごくいつもしょっちゅうイヤホンを押しながら

Chat GPTに声をかけているっていう感じのイメージなので

そうするとこれの機能が強化されると非常にAIとの対話みたいなところも

適当じゃなくて本当に音声で会話しながらみたいなのも

非常に未来を感じさせるような動画も公開されていたりしましたよね

そうなんですよね

特に自分自身はまだ最新の機能を使えていないので試せてはないんですけど

もともと特にスマホ向けのChat GPTアプリって音声会話ができるような機能があったんですね

ただ今までは長々と話して終わったら回答でまた話したら回答っていう

一方の言うことが終わるまでは次に行けませんよみたいなところだったんですけど

最新のものではそうではなくて割と人間が喋っているような

今合図中ってもらったかのような感じで

喋っている途中に反応返してくれるそういったことが可能になっているようで

非常により愛がってが良くなって

日々の僕のQOLは上がりそうだなっていう感じですね

本当にAIと対話している感が今までだとどちらかというと

文字入力を言葉で行って対話をするみたいなところから

より自然な流れになっていきそうということで楽しみですね

そうですねちょっとこの辺りは今年まだ半年も経ってないですので

次のアップデートとかも気になっているなっていうところもありながら

今週は特にこれが話をさらに見たというところですね

ですね

タイミング良くか悪くか

今週もう一つ大きなイベントがありましてですね

そこで何かというとGoogle IoTイベントがあって

Googleさんのアップデートイベントが今週あったんですけど

そこでいくつか発表がありまして

一つ大きく取り上げられていたのが

新しい動画を作ってくれるAIですね

VIOというものが発表されていて

かなり長尺っていうんですかね

1分とかそれ以上のものが高画質で作れるっていうデモ画像が

デモ動画が流れていて

それも話題をされたかなっていうところですかね

そうですね Google Ioの方でもさまざまなAI技術が話されていたんですけど

その中で一番話題になっていたのが

こういうニュースサイトから取ってくるっていうところだと

VIOかなというところで他にもたくさんGoogleからはいろんな

さらにAIでできることが広がったよみたいな話が出ていたりするので

興味ある方はぜひぜひその辺を探してみても

いろんなものが得られるのかなと思いますね

日本製のAIモデルと画像理解モデル

そうですね非常に多くの発表がなされていますので

Google Ioまとめとかで検索してもらうと

いっぱい出てきますので

その中の一つだけ他にも取り上げられているんですけど

画像ビジョン言語モデルというふうに表現したりですかね

画像とテキストを理解するような新しいモデルも

パリジェマっていうのが出たよっていうのも取り上げられておりますが

詳細については皆さん見てもらったほうが早いかなという感じですね

そのほかごまとっていうほどのちっちゃなニュースではないんですが

今回パンチが大きいのがいっぱいあったので

霞んでしまうところではあるんですが

いくつかのほうでピックアップしているので

それも紹介していこうと思いますと

まず一つは不学ってパッと聞いて

分かる方分からない方いると思うんですけど

日本のスーパーコンピューターの中に不学っていうのがあるんですけど

それを効率的に使うことによって

純日本製の大規模言語モデル AIですね

公開されるようなのがありましたっていう感じですね

そうですねこちらはすごい性能が高いとかという方向よりも

GPUみたいなのを使わず

日本の国産のものだけでもトランスフォーマーモデルを学習できるぞ

というところで結構注目されていましたね

ちょっと今までとは毛色が違うといいますか

そうですね本当に純粋に国産のGPUじゃなくて

しかもCPUだけで学習させることができるみたいなところは

もし何かが起きたらみたいなところの話で

非常にちゃんとそういうテクノロジーを国内でも有してるんですよ

みたいなところの方向として注目されていた感じですね

ここについては日本製ということもあって

今後どうなっていくのかなっていうところは注目したいところですね

あとはこれもGoogleに近いGoogleのディープマインドっていうところが

アルファフォールドっていうものですね

オープンソース化とAI画像生成技術

これもAIのモデルなんですけど

これが分子の予測制度といったらいいんでしょうか

に貢献しそうだぞというところで

医療関係の技術だとか病気とかですね

そういったものの解明に役立つのではないかというところで

非常に注目を集めていたというところですね

パッと医療とかだと応用があまりイメージがつかないんであれなんですけど

これが非常に実現できると

さまざまな医療に対して応用が効くのではというところで

非常に注目されてましたよね

ここについてはなかなか説明するのは難しいところもありますので

ご興味ある方はリンクとか載せますのでまたご覧いただければと思います

次はサクッといきたいんですけど

次期iPhoneのiOS18にChatGPTが乗るかもしれないという噂が

噂されているので別に乗るよという発表じゃなくて

ちょっと噂が話題になってきたという感じですね

なので将来のことはわからないですが

今後期待という感じで次に行きたいと思います

次はIBMさん大手のIT企業ではあるんですけど

作ったLLM Aのモデルなんですけど

オープンソース化してGitHubで公開したよというので

記事が出ておりましたという感じですね

最初はOSSじゃなかったんですけど

これを改めてOSSにしてモデルの重み等々を公開したということで

一つLLMが公開されたという感じですね

そうですね最近の流れではないですけど

モデルが新しく出てきてオープンソース化されましたよというところですね

次ニュースとしては最後になるんですけど

これ画像系だから割と引っかかったのかなと思うんですけど

画像生成やいろいろあると思うんですけど

その絵が作成する画像の照明の

照明じゃないとの当たり具合とかですね

いい感じにしてくれる技術というか

ものが出てきたというので結構記事になってたという感じですね

そうですねもともとこの技術を作った作者が非常に有名な

コントロールネットという画像で構図とか人間のポーズとかを

AIにうまく作成させるという技術で非常に論文とか出していたり

有名な技術を作った方だったんですけど

この方がまた光のライティングっていう結構難しい表現技術を

またうまく学習させて表現できるようにする方法っていうのを公開されていて

これができると本当に現状リアルで撮ったような写真

例えばモデルの写真とかを照明の方向とかをうまく変えたり維持したりしながら

背景だけを綺麗に合成するみたいなことが可能になっていくと思うので

非常にまたリアリティがあるようなAI画像がどんどん生成されていきそうだなっていうところで

非常に話題の技術だなと思っていて個人的にも着目しているところですね

実際デモ画像とか独自にというか試せるデモ環境のところがあるので

ぜひ見ていただければなという感じですね

今週1週間の話題ですね数としては間もあったんですけど

とりあえずオープンAIのやつがパンチが強くいっぱい出てきたというところで

今週は盛り上がっていたなという感じですね

ではまた来週も1週間分のニュースをおしゃべっていきたいと思いますので

よければまた聞きに来てくださいというところで今回のニュースは終わりたいと思います

それでは次回の放送をお楽しみにバイバイ

スター

エピソードをシェアする

メッセージを送信

bbz

サマリー

目次

スター

コメント

こちらもおすすめ