1. 耳で学ぶAI、ロボシンク
  2. #99 画像生成AIはどちらが良い..
2025-12-03 18:53

#99 画像生成AIはどちらが良いのか?ChatGPT vs Gemini(Nano banana pro)

✍️内容

現時点におけるChatGPTとGeminiの画像生成の比較について話しました。

直近ではGoogleからNano banana proという新しい画像生成AIが発表されました。

ChatGPTとの比較、Nano banana pro を使う上でのtipsなどを解説します。

---

ポッドキャストアワードご協力のお願い🙏

今年、初めてポッドキャストアワードに応募します。

ぜひリスナーの皆さんにご協力頂ければ嬉しいです。

→ポッドキャストアワード投票フォーム

---

おすすめ生成AIツールの資料を配布中🎉

→資料を受け取る

---

🎧番組紹介

「耳で学ぶAI」はChatGPTやGemini、Claudeなど生成AIを初心者・中級者向けに分かりやすく解説する番組です。

---

👨‍💻パーソナリティ: 矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。ツールも開発しています。株式会社root c代表取締役。⁠

note

---

📩番組の感想や要望はこちら

サマリー

このエピソードでは、画像生成AIにおけるChatGPTとGeminiの比較が詳しく解説されています。特に、Geminiの新しいモデルであるNano Banana Proの性能向上や日本語の文字入れ機能が取り上げられています。また、ChatGPTとGoogleのGemini(ナノバナナプロ)の比較において、画像生成の精度やコストに焦点が当てられています。ナノバナナプロの使用方法や、商用利用時の著作権に関するガイドラインについても詳しく説明されています。

画像生成AIの概要
皆さんこんにちは、矢野 哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIを分かりやすく解説する番組です。
今回のテーマは、画像生成AIはどちらが良いのか、ChatGPT vs Geminiについて話していきます。
はい、ということで今日は、画像生成AIについて話していきます。 皆さん、普段画像生成AIは使っていますでしょうか?
画像生成AIって言っても、いろいろありますよね。 その中でもChatGPTとGeminiの画像生成は、普段使っているチャット画面から利用できて、
使いやすいのではないでしょうか。 今日、画像生成AIを話す理由としては、先日Geminiからリリースされた
Nano Banana Proというモデルが関係しています。 これは、Gemini 3 Pro Imageとも呼ばれる新しいモデルとなります。
単的に言って、非常に精度が良いと。 じゃあ、改めてChatGPTとGeminiの画像生成、
現時点でどちらが精度が良いのか、比べてみようと思いました。 今日話すポイントは主に3つです。
1つ目に、現段階における主要なAI産者の画像生成について。 ChatGPT、Gemini、クロードの現在地。
2つ目に、どの画像生成AIが現時点で性能が高いのか。 そして3点目に、Nano Banana Proに関するチップスを掘り下げていきます。
はい、それでは早速話していきましょう。 まず、現在のAI各社の画像生成の状況について一旦整理したいと思います。
前回のAIモデルの比較の回でも紹介しましたけど、 現時点でよく使われているあのAI、これはChatGPTとGeminiとクロード、この3つが主に使われていると思います。
で、ChatGPTとGemini、画像生成のモデルを開発しています。 で、一方でクロードは画像生成のモデルは開発していないんですね。
ちなみに動画生成AIも開発していません。 ちょっと一旦整理するとChatGPTとGemini、これは画像生成と動画生成
どちらもモデルを開発しています。 で、一方でクロードは画像生成と動画生成のモデルを開発していません。
ここら辺はクロードの独自の展開と言いましょうか。 ChatGPTやGeminiとは少し異なるスタンスで開発しているのがわかります。
で、今回のエピソードではAI各社の画像生成の比較した結果 こういったものをお伝えしようと思いますが
実質はChatGPTとGeminiの画像生成の比較となります。 ChatGPTの画像生成とGeminiの画像生成
どちらが現時点において精度が上なのか。 これあの先に結論をお伝えすると、現時点においてはGeminiの画像生成の方が精度が高いです。
画像生成や動画も良い意味でのいたちごっこが続いていると思います。 ChatGPTが新しい画像生成を公開すれば
その後にGeminiがもっと良い画像生成を公開してくると。 でその次にまたChatGPTがあのもっとすごいのを公開してくると。
こんな感じでずっと良い意味でのいたちごっこが続いています。 現時点においては直近で公開されたGemini、Googleが開発した
ナノバナナプロという画像モデルが非常に精度が高いです。 ちなみにこのナノバナナプロ、無料ユーザーも使うことができます。
今回様々なタスクで比較をしてみました。 人物写真の生成、イラストの生成、あとは複数の画像をアップロードしてこれを一つの画像に結合させるようなタスク。
あとは画像の修正なんかですね。 いろいろ試してみて、やっぱりGeminiの方が使いやすいなと思うケースの方が多かったです。
AIで作成した画像ってちょっとAIっぽさが残るケースってあると思います。 以前の画像生成AIだと明らかにこれAIが作成した画像だよねというのが分かっていたんですけど
結構最近の画像のAIはそういったことが少なくなっています。 でそうしたAIっぽさが残らない、より自然な画像を生成できるのは
Geminiのナノバナナプロの方がそういった機会が多かったです。 ChatGPTの画像生成AIよりも。
であとはChatGPTの画像生成AI、以前まではGeminiに比べて明らかにこのタスク、 精度が良いよねというものがありました。
それが日本語の文字入れのタスクです。 生成する画像に対して何か日本語を入れ込むと。
でこのGeminiの画像生成AIに関しては、こうした画像に日本語を文字入れするタスク、 これはとても苦手だったわけです。
実際に指示をしても日本語が文字化したような感じになって、 あまり精度は良くなかったわけですね、文字入れに関しては。
ですが今回新しく発表されたGeminiナノバナナプロ、 この新しいモデルでは日本語の文字入れも問題なく行えるようになっています。
これあのかなり性能が高くなっているので、以前Geminiでその日本語の文字入れを試して、 ちょっと文字化系をして断念してしまった方、いらっしゃったらぜひ試してみてください。
かなり精度が上がっているので驚くと思います。 私も驚きました。かなり精度が上がっています。
でこれ、なぜテキストを正確に画像に反映できるのかっていうと、 内部でGemini 3 Proのモデルが動作しているからだそうです。
これによって単なる綺麗な画像を生成するという、そういった一般的な使い方から、 説明書や手順書、そういった文字を伴う画像生成も問題なく行えるようになっています。
私、AIのニュースレターを運営しているんですけど、 以前までこのニュースレターの画像、ChatGPTのモデルを使っていました。
画像生成の使い方と検証
AIの画像。でも今はNanobanana Proに切り替えています。 かなり精度が高いので、実際に使っていても使いやすいモデルだなと思います。
私、先ほどこのGeminiの新しい画像生成モデル、Nanobanana Pro。 チャット画面から無料ユーザーでも使えるとお伝えしました。
ちょっと具体的な話をすると、チャット画面からツールで画像作成、これをオンにして、 あとはモデル、あのAIのモデル、これをGemini 3 Proに変更することで使うことができます。
モデルをGemini 3 Pro、思考モードというのがあるんですけど、 こちらに変更することでこのNanobanana Proを誰でも使うことができます。
ただ、Geminiのチャット画面で使うのとは、また別のアプローチでこの画像生成AIを使うこともできます。 API経由で使ったり、あとはGoogle AI Studioで使ったり、あとはGoogleワークスペースなどですね。
チャット画面で使えるのに、わざわざGoogle AI Studioを使う理由って何なの?という話になるんですけど、 これはより精度高く画像生成を使うことができます。
例えば、具体的な違いで言うと、4K画像、こういったものを出力することもできます。 1点だけ補足すると、Google AI Studio経由で使う場合は、APIキーの設定が必要になります。
APIキーっていうのは、このGoogleの画像モデル、これを使うための許可書と言いますか、 鍵のようなものですね。
ちょっとここが慣れないとハードルが高いんですけど、一応このAPIキーを設定することで、Google AI Studioからこのナノバナナプロを使って4K画像を出力したり、
あとはプログラムから操作して、こう自動で画像を生成する、そういったこともできるようになります。 あとはチャット画面の違いで言うと、画像のスカシの違いでしょうか。
これあのすでにジェミニで画像生成使ったことがある人ご存知だと思うんですけど、 ジェミニのチャット画面で画像生成をすると、画像の右下にスカシが入ります。
この画像は生成AIで作成したものですと、画像の右下にジェミニのロゴがスカシとして入ります。 一方でGoogle AI StudioなどAPI経由で画像生成した場合、
こうした場合はこの右下のスカシというのは入りません。 ちょっと一旦整理しますね。チャット画面から画像を生成すると、その生成された画像にはスカシが入ります。
一方でGoogle AI StudioやAPI経由で生成した場合は、画像のスカシは入りません。 一応あの誤解のないようにお伝えすると、じゃあこのAPI経由で生成した画像、
スカシがない画像、こうしたものがAIが作成したものかどうかわからなくなるじゃないかと言うと、そうではありません。
実は人間が認知できないレベルで、この画像はAIが生成したものですと、そういったようにわかるようになっています。
いわゆるあの目には見えない電子スカシというSynthIDと呼ばれるものが入っています。 ただ電子スカシ、人間の認知できないレベルの電子スカシがあると言っても、
この画像は生成AIで作った画像ですよと明示する必要はあると思います。 これはルールというよりもマナーになるのかなと。
私も生成AIで作った画像というのはしっかり明示するようにしています。 この画像は生成AIで作りましたと。
この点だけ画像生成AIを使う上でご注意いただければと思います。 ちなみにあのちょっと話変わるんですけど、
ジェミニを使えばジェミニで生成した画像を判別できると公式は説明しています。 一応公式の説明を引用するとジェミニのチャット画面で画像をアップロードして次のような
プロンプトを入力してくださいと説明しています。 これはGoogle AIによって作成または編集されたものですか。
これはAIで生成されたものでしょうか。 この画像は本物でしょうかと。
こうした質問するとジェミニがその画像の中にあるシンスIDをチェックしてジェミニで 生成した画像、本物の画像どっちかというのを判別してくれると。
このように公式は説明しています。 これ私公式の説明を読んだ時面白いなと思って試してみました。
結果を言うとこれ機能しませんでした。 ちょっとGoogleさんなんでと思ったんですけど、公式の説明通りに行ったんですけど
機能しなかったんですよね。 何か不具合かまだ実装されてないのかちょっとわからないんですけど、とにかく
ジェミニのチャット画面でAIが作った画像を判別するそういったタスクはできませんでした。 ただちょっといろいろ実験をしまして結果的に機能するようになったのでちょっとその点についてもお話しします。
これどうやったのかっていうと Google AI Studioに画像をアップロードしてこのようなプロンプトにしました。
ナノバナナプロの機能とコスト
この画像はGoogle AIによって作成または編集されたものでしょうか。 画像にSynthIDが含まれているかチェックして判定してください。
このやり方でいくとあの結構高い確率でジェミニが作った画像なのか AIが作ったわけではない本物の画像なのかというのを判別できるようになりました。
ポイントとしてはGoogle AI Studioを使うこと、あとはプロンプトにSynthIDが含まれているかチェックしてくださいと明示的に指示をすることでしょうか。
これをやるとうまく機能します。 じゃあこのプロンプト、ジェミニのチャット画面の方で使ったら機能するのかっていうとこれもまた機能しないんですよね。
現状はGoogle AI Studio上でその画像がジェミニが生成したものかどうかっていうのを判別することができます。
気になる方いらっしゃったらぜひ試してみてください。 先ほど私あのGoogle AI StudioやAPI経由でこのナノバナナプロ使えると生成できると
お伝えしましたけど、じゃあどのぐらいの費用がかかるのかという点についてちょっと補足したいと思います。
で、ざっくり言うと1万円あたり大体30から40円ぐらいのコストと見ていただければと。 結構ここらへんの価格は変動します。
ドル換算なので為替レートによって変動します。 で、大体それが1万円あたり30から40円ぐらいかなと。
テキストでどのような指示をしたのか、そのテキストの指示の分量というのもコストに加算されます。
で、あとは出力した画像によってもコストが変わってきます。 で、4K画像を出力した時のコストが大体30円から40円ぐらいで見積もっていただければと思います。
ちなみにこのナノバナナプロ、商用利用できるのかどうかについてちょっとお伝えをすると、 Google公式のノートではこのように説明されていました。
ちょっと読みますね。 広告利用を含む商業利用でナノバナナを利用する場合はGoogleワークスペース with Gemini もしくはVertex AIをご利用くださいとあります。
Google画像生成に限らずなんですけど、著作権周りとか 商用利用ができるかどうかに関して結構他のAIに比べて説明が少ないんですよね。
あと、Google公式のブログではこのようにも説明されていました。 これはVertex AIやGoogleワークスペース、Gemini Enterpriseなど企業向けでの利用を想定した内容となります。
ちょっと読みますね。 商業ニーズへのサポート、ナノバナナで生成されるすべてのアセットにSynthID、Watermarkが組み込まれるため
透明性と責任ある利用を確保できます。 一般提供開始時には著作権保護も提供し、お客様の商業ニーズをサポートすることに尽力いたします。
以上です。つまり一般提供が開始する頃には著作権保護もセットで提供しますよと。 安心してビジネスで使用してくださいよと。
画像生成に関するテクニック
アパレル、EC系の事業者、広告関連の会社などを想定しているようです。
最後にナノバナナプロを使う上でのちょっとしたチップスと言いますかテクニックを紹介したいと思います。
ナノバナナプロはすごく精度が高い画像生成と思うんですけど、いくつか欠点もあります。 それが画像の修正を重ねるほど精度が落ちていくというものです。
これは画像生成だけじゃなくてテキストベースでのAIとのやり取りでもよくあることですよね。 人間との会話、つまりコンテキストが増えれば増えるほど精度が落ちていってしまうと。
こうした現象がナノバナナプロでも確認できます。 こうしたことの対策として修正指示は一括で行うことをお勧めします。
つまり細かく会話を重ねて細かく修正指示を行うよりも修正指示は一括で こことこことこここのように修正してください。
こうした方がうまく機能することが多いです。 結構こうした修正指示って細かく刻んでいきたいと思うんですよね。
背景を修正してとかモデルのポーズを変更してとか。 ただ現時点においてはこうした細かい修正指示も一括で出してしまった方がこちらの方がうまく機能することが多いです。
あともう一つは何度も修正を重ねていくと画像の精度が落ちてしまうので 精度が落ちてきたなと感じたら新規チャットでリフレッシュした方がうまく機能します。
これもテキストベースのやり取りでも似たような現象ありますよね。 ちょっと具体的な手順をお伝えすると、まずナノバナナプロを使って対話を重ねて修正指示を行っているとします。
でこれからまだまだ修正したいところがあると。 でもかなり会話のボリュームも長くなってきて修正指示の精度も落ちてきたと。
こうした時にまず一度現時点の最新の画像を一旦ダウンロードします。 パソコンに。
で改めて新規でチャットを立ち上げてその画像ダウンロードした画像をアップロードして改めて修正指示を重ねていくと。
このように新規でチャットを立ち上げてリフレッシュした方がうまく機能することが多いです。 新しいチャットにその今編集している画像を持ち越すために一度画像をダウンロードしてでまた再度アップロードするというそういった手間がかかってくるんですけどこれで作業が結構やりやすくなるので似たような状況に遭遇した方ぜひ試してみてください。
もう2025年も終わるのでおそらく年内はオープンAIが新しい画像生成を投入してくる可能性は少ないかなと思っています。
ただ来年2026年また新しい画像生成AIを投入してくることが予想されます。 でそうなってくるとオープンAIの新しい画像モデルナノバナナプロよりも精度が高いよねと。
こういったことは全然予想されますし今まで繰り返してきた歴史でもあります。 とはいえ現時点ではチャットGPTとジェミニの画像生成を比較したところ
ジェミニのナノバナナプロに軍配が上がるかなと思った次第です。 こちらのモデル誰でも試せるので気になる方はぜひチェックしてみてください。
はいそれでは今日のポイントをまとめます。 1つ目にチャットGPTとジェミニの画像生成では現時点ではジェミニの画像生成が精度が上回っていると感じます。
2つ目にジェミニの画像生成ナノバナナプロと呼ばれるモデルは無料ユーザーも使うことができます。
3点目、Googleのチャット画面 もしくはAPI経由でGoogle AI スタジオから利用できます。
3点目、Google AIスタジオ経由で利用した場合、画像のスカシがなくなったり4Kの画像を出力できるようになったりします。
場合に応じて使い分けてみてはいかがでしょうか。 はい今日はこのへんということで本日もお付き合いいただきありがとうございました。
話変わるんですけど、ポッドキャストアワードに初めて応募したいと考えています。
日本放送さんが毎年運営しているポッドキャストの採点イベントとなります。
リスナーの皆さんに耳で学ぶAIのこの番組の投票ご協力いただけると嬉しいです。
概要欄に記載していますので応援しますよという方、ぜひご協力をお願いします。
番組ではこのように耳で学べるAIを毎週発信しています。 通勤中や家事の合間にAI情報をキャッチアップできます。
毎週水曜朝に更新していますのでぜひフォローをお願いします。 お相手は耳で学ぶAIの矢野てっぺいでした。
また次の配信でお会いしましょう。
18:53

コメント

スクロール