1. 耳で学ぶAI、ロボシンク
  2. #5 君はGeminiを知っているか..
2024-02-14 17:49

#5 君はGeminiを知っているか?Googleが投入した生成AIについて語る回👨‍💻

Googleの生成AI、Gemini / ジェミニ、ジェミナイどっちで読めばいいのか問題 / GeminiとChatGPTの違い / 同じプロンプトで生成結果を比較 / 2024年の生成AIの展望


「耳で学ぶAI、ロボシンク」は生成AIのトレンドや情報を「耳」で学べるポッドキャストです。

AI初心者向けにChatGPTや画像生成AIの可能性をゆるく楽しく解説します。


【リソース】

◎Gemini公式サイト

https://gemini.google.com/app


◎Duplex(AIレストラン予約)のデモ動画

https://youtu.be/D5VN56jQMWM?si=ncPstt41u4RDik_3


-----

◎ロボシンク公式サイト

https://bit.ly/3xlLcW0


◎Xアカウント

https://bit.ly/3Tx6maM


◎Youtube

https://bit.ly/4agZS78

00:08
皆さんこんにちは、矢野哲平です。
このポッドキャストは、無料で学べるAIスキル、ロボシンクが運営する番組です。
耳で学ぶAIをコンセプトに、初心者向けにAIのトレンドや可能性を深掘りしていきます。
今回のテーマは、君はGeminiを知っているか、Googleが投入した生成AIについて語る回、について話していきます。
はい、ということで、今日はGoogleが新しく発表した生成AIのGeminiについて話していきたいと思います。
今日話す内容は、主に3つですね。
まず1つ目にGeminiの概要、2つ目にGeminiで何ができるのか、そして3つ目にChat GPTとの違い、この3つを中心に話していきたいと思います。
Geminiなんですけど、これはですね、今、ポッドキャストを収録しているのが2月13日火曜日なんですけど、
先週Googleからリリースされました。
Geminiというのは新しいサービスというよりもですね、厳密に言うとリブランドになります。
もともとGoogleはBirdという名前で生成AIをリリースしていたんですけど、
そのBirdの名称をGeminiに変更しますよという、リブランドのような形で先週発表しました。
このGeminiという名前もですね、別に今回初めて発表されたわけじゃなくてですね、
2023年の12月7日、ちょうど去年の冬ですね、に発表された生成AIのモデルの名前がGeminiです。
ちょっと分かりにくいんですけど、表側の生成AIのサービスの名前がBirdで、
その中で動いている生成AIのモデルがGeminiという名前だったんですね。
これちょっと分かりにくかったんですけど、今回GoogleはBirdではなくGeminiという名前に統一しましたよということで、
新しく発表がされたわけです。
Geminiには無料プランと有料プランというのがありまして、有料プランは月額2900円。
これ、ChatGPTの有料プランとほとんど同じ値段ですね。
この内容というのが、より高性能なモデルを使用できるというような内容になります。
これもChatGPTの有料プランと同じような感じですね。
ただですね、より高性能なGeminiのモデル、有料プランで使えるモデルというのはChatGPTのGPT4をしのぐというふうに言われています。
Geminiの利用方法に関してですが、これはGoogleのアカウントがあれば誰でも利用することができます。
ウェブサイトgemini.google.com、こちらにアクセスすれば誰でも利用することはできます。
ちなみにですね、これはアプリからも使用可能で、AndroidではGeminiのアプリが出るというふうに言われています。
03:00
そしてiPhoneですね、これはGeminiのアプリを出すというよりも、もともとあるGoogleのアプリがありますよね。
そのGoogleのアプリに内蔵されるというふうに言われています。
iPhoneに関しては日本ではまだちょっとリリースされてないみたいですね。
ちなみにGeminiの呼び方なんですけど、これは2つ意見がありまして、つづりはですね、Geminiですね。
これでGeminiというふうに呼んでるんですけど、2つありまして、GeminiかGeminiという呼び方があります。
海外、英語の発音ではこれあのGeminiはGeminiというふうに呼ぶんですね。
海外のニュース動画とかYouTuberの方とかはですね。
ただ日本ではですね、Geminiの呼び方がもうほぼほぼ定着しつつあるかなと。
というのもそのGoogleの日本法人がですね、Geminiの呼び方についてGeminiってOKですというふうにちょっとコメントを出したこともあって、
日本ではGeminiという呼び方で定着しそうです。
なのでこのエピソードでもですね、Geminiという呼び方に統一して話していきたいと思います。
Geminiで何ができるのかっていうことについてお話しすると、簡単に言うとですね、
ChatGPTと同じようなものと認識していただければと。
具体的に言うとテキストでAIに指示や質問をして、それに対してAIが答えてくれるような内容ですね。
これもほぼほぼChatGPTと同じような感じをイメージしていただければと思います。
一つ機能として挙げると、例えばですね、Geminiでは画像をアップロードすることもできます。
ちょっと私が実際使った、初めて使った画像アップロードがですね、道端に落ちているどんぐりを写真を撮ってですね、
Geminiに投げたんですね。当時はまだバードだったんですけど、このどんぐりの木は何ですかというふうに質問したんですね。
実はどんぐりってですね、その形状によってそのどの木のどんぐりかっていうのが変わってくるんですね。
拾ったどんぐりを見てどの木なんだろうっていうのは、当然私わからないんですけど、
バード、Geminiですね。Geminiに投げて質問をすると正確にその木の種類、樹種と言えばいいんですかね。
樹種を答えてくれてですね、精度高いなっていうふうに驚いた経験があります。
あとは文字の認識ですね。文字の認識も結構精度は高いですね。今の時点で例えばですね、領収書を撮影して、
この領収書をExcelに投げてくださいみたいな、そういった使い方はできないんですけど、かなり文字を認識する、
一つの文字を認識する精度に関してはかなり精度が高いので、ゆくゆくはそういった領収書とか会議資料とかを写真を撮影して文字起こししてくださいみたいな使い方もできるのかななんて思ったりしますね。
それ以外ですと、URLを含んだ質問というのもOKなんですね。
例えばですね、ある海外のニュース記事、そのニュース記事のURLを貼り付けてGeminiに投げて、ようやくと翻訳をしてくださいっていうふうに言うと、
06:01
海外の記事でも認識をしてですね、ようやく翻訳をしてくれるような使い方も可能ですね。
で、次の機能の説明で言うと、あとは拡張機能。これがやっぱりGeminiの、何と言いますか、他の競合他社にはない機能なのかなと思いますね。
この拡張機能というのは簡単に言うとですね、Googleの各種サービスに連携できる機能です。
例えばですね、YouTubeであったりとか、あとはGoogleのドキュメントですね、Googleフライト、Googleホテルなどに接続をできるという。
例えばGmailとも連携できるんですけど、そうですね、例えば田中さんからもらったメールで会議の日程を教えてとかですね、
あとはYouTubeの連携で言うと、YouTubeの動画URLをGeminiに投げて、この動画の要約をしてくださいっていうような使い方もできます。
反対にですね、Geminiに質問をするときに、キャンプのおすすめテントを紹介しているYouTube動画を教えて、
なんて言うと、おすすめのYouTube動画を教えてくれるという、そういったこともできるようになります。
ちなみにGeminiでは動画や音声もアップロードできるというふうに言われているんですけど、一応確認したところですね、現時点では実装されてないみたいですね。
ただゆくゆくは、こういった動画とか音声をAIに投げることができるようになると、例えばですね、動画を投げて文字起こしをしてくださいとかですね、
音声を投げて文字起こしをしてくださいというような使い方もできるようになります。
で、ChatGPTとの違いについて紹介すると、まず一つが金額面ですね。
ChatGPTも無料で使えるんですけど、無料で使える範囲というのがGeminiの方が広いですね。
例えば画像アップロード機能、これはChatGPTは有料プランじゃないとできないんですね。
そして拡張機能。拡張機能はGemini独自のサービスなので比較は難しいんですけど、そういった拡張機能のようなもの、
ChatGPTで言えば、そうですね、プラグインやGPTsになると思うんですけど、そういったものもChatGPTでは有料プランではないと使えないですね。
あとはURLの認識ですね。例えばですね、ChatGPTにURLを認識させることができるのは有料プランからなんですね。
有料プランはBingというマイクロソフトのサービスから情報を取得することができるんですけど、これは無料プランではできないです、ChatGPTの。
一方でGeminiは無料プランでもそのURLの認識をすることができるので、ここはChatGPTとの違いですね。
細かい違いというのはいろいろあるんですけど、やっぱり気になるのは回答の精度がどれだけ違うかっていうのが気になりますよね。
ということで、私の方でですね、同じプロンプトでGeminiとChatGPTに質問をしてみて、ちょっと結果を比較してみました。
09:01
プロンプトはちょっと簡単なものなんですけど、Geminiの無料プランのGeminiと、あとはChatGPTの無料プランのGPT 3.5ですね。
こちらに同じ質問をして比較をしてみました。まず一つ目に質問したのが、生成AIとはというテーマで見出しを含めた記事を書いてください。
生成AIを知らない読者にも分かりやすい内容にしてくださいというプロンプト、指示をAIにしてみました。
まずChatGPTの回答から紹介すると、タイトルが生成AIとは人工知能の新たなる進化ということで、最初の触りの部分だけ説明するとですね、
人工知能の分野は急速に進化しており、その中でも生成AIは注目を集めています。
生成AIは画像、テキスト、音声などのデータを生成し、驚くほどリアルなものを作り出すことができる技術です、という内容ですね。
これがChatGPTの内容です。次にGeminiに同じ内容で質問してみたところ、回答をちょっと紹介しますね。
生成AIとは、生成AI、generative AIは従来のAIとは異なり、新しいデータを生み出すことができる人工知能の一種です。
具体的にはテキスト、画像、音声、動画など様々なコンテンツを生成することができます。
これがGeminiの最初の触りの部分ですね。生成した回答の最初の触りの部分となります。
どうでしょうか。この後ChatGPTもGeminiも説明が続くんですけど、触りの部分を聞いた感じどうでしょうか。
音声なので分かりにくいと思うんですけど、私自身その文章を見る限りですね、両者に大きな差はないのかなというふうに感じています。
もう一つ他のプロンプトも試してみたので紹介したいと思います。プロンプト紹介しますね。
新しく起業家向けのポッドキャストを制作しようとしています。 ポッドキャストの番組名を10個考えてください。
条件、英語の名前、ユニークで直感的な名前。 これをChatGPTとGeminiに投げてみました。
じゃあ先にですね、ChatGPTからの回答を紹介します。 一つがスタートアップスパーク、ベンチャービスタ、
ファウンダーフロンティア、イノベートイグナイトなどですね。 次にGeminiの回答を紹介すると、
ザ・スタートアップグラインド、ザ・ファウンダーズジャーニング、ザ・アイデアトゥイグジット、ザ・ネクストユニコーン
こういった名前を挙げてくれました。 こちらもですね、回答を聞く限りではそんなに大きな違いは感じないのかなと思います。
今回試したのは簡単なプロンプトだったんですけど、 簡単なプロンプトを試す限りではGeminiとChatGPTのGPT 3.5では回答の性能にそんなに大きな違いはないのかなというふうに感じました。
12:08
これからのGeminiの展望と言いますか、生成AI界隈のお話をすると、 Googleが本格的に生成AIに参戦した感じがありますよね。
ChatGPTが2022年にリリースされて、 Googleはその出遅れた感というのは否めなかったんですよね。
2023年ぐらいからGoogleでも生成AIに動き出した感じがあったんですけど、 2024年はですね、今年はちょっと本格的にGoogleが生成AIを取りに来ている感じはしますね。
ただですね、もともとGoogleっていうのはAIの開発をやっている企業なので、 市場では出遅れた感はあるんですけど、もともとAIを開発している企業なので十分巻き返すリソースっていうのがあるんですね。
例えばですね、Googleは2017年にDuplexっていうAIがレストランに予約の電話をするプロダクトっていうのをリリースしているんですね。
これあの概要欄にリンクを貼っておくのでご覧いただければと思うんですけど、 5年前の動画なんですけど、これまあすごいですね。
AIが音声でですね、レストランに予約の電話をするんですね。 予約を受けるレストラン側の人はもちろん人間なんですけど、問題なく予約が完了するっていう。
これあの結構衝撃的な当時ですね、動画だったんですけど。 Googleがですね、決してそのAIの開発競争に遅れをとっているわけではないということが分かる動画ですね。
じゃあですね、なぜGoogleがチャットGPTなど他の企業に比べて遅れをとったのかというと、
一つの考察としてGoogleが展開する検索事業への懸念があったのではないかというふうに言われています。
これはつまりですね、生成AIが普及するとGoogleの検索をする人っていうのは少なくなりますよね。
実際に私もチャットGPTがリリースされてから検索することっていうのはかなり少なくなりました。
検索するときのステップを説明すると、1、検索キーワードを入力する。2、サイト群が表示される。
そして3、サイトに訪問する。クリックする。そして4、自分が欲しい答えをその記事の中から探す。
まあこれ4が一番長いと思うんですけど、これが従来の検索方法でしたね。
4ステップぐらいあるんですけど、これが生成AIになると、1、AIに質問をする。2、回答をもらう。
もう2ステップで終わるんですね。しかもその回答っていうのが自分の質問した内容にパーソナライズされているので、
自分が本当に欲しい答えというのが返ってくる確率が高くなる。このように検索か生成AIに質問するかで言うと、
おそらく今後もですね、生成AIに質問する人っていうのが増えてくるっていうのは明らかなので、
こうなってくると検索エンジンを利用する人が少なくなればなるほど、Googleの検索エンジンの事業ですね、それの売り上げっていうのが減ってくるんですね。
15:02
つまりそのGoogleが生成AIの事業を進めれば進めるほど、自社の検索事業の首を絞めるという一種の矛盾をはらんでしまっていることがあったので、
Googleがなかなか生成AIに本腰を入れれなかったっていうのがあるのではないかというふうに言われてるんですね。
ただですね、そういったことも言ってられなくなってきたと。オープンAI、チャットGPTですね。
チャットGPTの勢いがすごすぎて、これはちょっとやばいぞってなって、2023年の後半ぐらいに本腰を入れだして、
2024年の2月ですね、Geminiを投入してきたというような流れになります。
このようにですね、しばらくはGoogleとあとはチャットGPTのオープンAIですね、を中心に会話系の生成AIの競争が激化していくのではないかというふうに予想しています。
チャットGPTも次のモデルのGPT5をリリースするのではというふうに噂されていますし、
あとは新しく始まったGPT数、これの収益化プログラムも楽しみですよね。
なんならその非公式の情報なんですけど、AIエージェントをチャットGPTが開発しているという話もあります。
AIエージェントっていうのを軽く説明すると、自律的に動くAIのことですね。
例えば今のチャットGPTやGeminiもそうなんですけど、人間の支持に対して回答するという、いわゆる人間で例えると支持待ち人間ですよね。
一つの支持に対して一つの回答やタスクをこなすという、AIエージェントは何かっていうと、支持待ち人間ではなくて自分で考えて動く人間のようなものです。
ある支持に対して自分で考えてどんどんタスクをこなしていく、そういう能動的なものをAIエージェントというふうに言います。
ゆくゆくはGeminiでもこのようなAIエージェントが実装されるかもしれないですよね。
AIエージェントが当たり前に使えるような日が来ると、ますます仕事の効率化が図れるようになると思います。
2024年はどういったようにAIが進化していくのか楽しみですね。
まだGeminiを触ったことがない人や生成AI自体をですね、触ったことがない人はGoogleアカウントがあれば誰でもGeminiは開始できるのでぜひ試してみてください。
概要欄にもGeminiのリンクを貼っておきます。
はい、今日はこの辺ということで本日も聞いていただきありがとうございました。
このポッドキャストでは毎週AIの情報を発信しています。ぜひフォローお願いします。
RoboSyncの公式サイトではChatGPTや画像生成AIを動画で学べるコースも提供しています。
興味のある方はカタカナでRoboSyncと検索してみてください。概要欄にも記載しておきます。
それでは今日もありがとうございました。また次の配信でお会いしましょう。
17:49

コメント

スクロール