こんにちは、たてばやし淳です。今回はチャットGPTの最新の画像生成モデルが出ました。
これがイメージ1.5という画像生成の機能みたいなものなんですよね。これが進化しています。
これが果たして仕事に役立つの?使えるの?というズバリな意見を今回述べていきたいと思います。
また最近私も話題にしていますし、非常にバズってるですね。
GoogleのGeminiに備わっているNano Banana Pro、非常に優秀な画像生成モデルなんですけれども、
これとの違いとか、どっちが優れているのか、使い分けなんかはどうしていけばいいのかという話も、私の見解を述べていきたいと思います。
2つの見解というか観点を要してまして、写真の加工の技術、そして図解の作成といった表と、
どちらがどんな風に優秀なのか、どっちが向いているのかみたいなズバリとした話をしていきたいと思いますので、よろしくお願いします。
ちなみになんですけれども、このポッドキャストおよび動画は動画でも配信していますし、
ポッドキャストメディアでは音声のみの場合もあります。
画像を見ている方は見ていただきたいんですけれども、こちらのサムネイル画像の私の写真なんですよね。
こちらは実はChatGPTで加工して作っています。かなり優秀というところがわかるんじゃないでしょうか。
私のプロフィール写真をアップロードしてこんなポーズにしてというラフ描きみたいなものを与えたら、そのポーズの通りにし、
非常に綺麗に、美しく、指先でオープンAI社のロゴが光り輝いているみたいなものを作ってくれたんですね。
こういう加工が非常に上手いというところがあり、実力が見えてくるんじゃないかなと思います。
ちなみにこんな感じですね。画面には見せしていますけれども、
めちゃくちゃ簡単に自分のプロフィール写真と、それから私がスマホでiPhoneでメモに書いたラフ描きみたいな、落書きのようなラフをアップロードして、
プロンプトでこの写真を加工して、イラストのようなポーズにして、指先でオープンAI社のロゴが光り輝いているみたいな感じにしている。
そういう画像を作って、チャットGPTに支持したらこの画像ができましたということで、
かなりプロフィール写真を維持しながら、人物が違う顔にならないように維持しながらもポーズを変えて、
指まで再現し、こういうマジカルなエフェクトまでかけてくれたという実力が素晴らしいと思います。
一方でいまいちというところもありまして、ここは結構残念だなと日本でも話題になっております。
文字化け問題というところですね。先に文字化けをお見せします。
こちらがチャットGPTのイメージ1.5モデルで作られた図解となります。
結構いい線いっているね。かなりいい図解ができているとは思います。
でもよくよく見ると日本語の文字が文字化けしちゃってるんですね。
これ拡大するとわかるんですけども、例えば漢字が難しいところ、修善秘とか。
こちらの図解は持ち家vs賃貸みたいな図解を作って指示をしたんですけども、
やっぱりチャットGPTの画像生成もですね、春頃からこういう画像生成が非常にできるようになってきて、
話題にはなってきたんですけども、やっぱり日本語のちょっと画数の多い漢字とかになってくると文字化けして潰れちゃってるんですよね。
これだと仕事の本番、ビジネス資料とかだとちょっと使えないかなという感じ。
で、いちいちこれをですね、画像を自分でパワーポイントとかペイントとかで加工して直してですね、文字化けがないように直さないといけないというのは手間だよねというところでした。
これがなかなかまだ日本語においては改善していないというところがイマイチなポイントとなります。
でね、英語のアルファベットとかだとかなり綺麗に描画できているみたいなんで、
こういったですね、日本語への対応というのが今一歩というところがあるみたいですね。
ちなみにナノバナナプロの方なんですが、同じように持ち家vs賃貸として図解を作らせてみました。
こちら漢字なども含め日本語完璧というところで、こういうところで図解とか作らせるとテキストの処理能力という部分で差が出ちゃうかなと。
ナノバナナプロ、さすがですね。漢字などの潰れたり文字化けしたりミスなどは見られませんでした。
非常に正確に出せているというところで、資料とか図解とかいうシーンだと今のところナノバナナプロが強いなっていう印象を持ちますね。
一方写真の加工、これは素晴らしいですねという結果をお見せしたいと思います。
私のプロフィール写真を与えまして、バスケをしてダンクをしている躍動感あるアクティブな写真を作ってという指示をしました。
今画面にお見せしますが、左側のチャットGPT、かなり再現度が高いです。
私ねバスケはこんなに上手いわけがないんですが、かなり躍動感のある私の顔に全身バスケ選手みたいな感じにしてくれています。
ナノバナナプロでも同じ指示をしてみたんですが、やってるけど全然違う人物になっちゃう現象というのがナノバナナでよく起こるんですね。
これ私の見解なんですけども、日本人の被写体を用意して画像加工させようとした時に、
やっぱりAIはGoogleで作られていますから海外の人の写真の学習データは多いでしょうが、日本人、アジア圏の人間の学習データが少ないから、こういうものは元と全然違う顔になっちゃうんじゃないかなと思うんですよね。
そこがナノバナナ、今年の夏にプロ版じゃないナノバナナが出てきてからずっとこういうのを試していたんですけども、
やっぱりねプロになってもあまり変わらないなぁという結果ですね。
写真の加工においてはやっぱチャットGPTの画像生成が強いなというところが見て取れます。
もう一パターンですね。
セミナーをしている姿を作ってくださいという指示をしてみました。
大きな会場でセミナーを行っていて、後ろに長袖が沸き立っているみたいな写真。
そしてビジネススライドみたいなプレゼン資料が映っているみたいなものを作らせました。
こちらもやはりチャットGPTが一番自然に画像加工できてますね。
私が大きな会場で長袖に向けて大きなプレゼンをしているみたいなものを作ってくれました。
それに対してやはりナノバナナプロの方はちょっとこれ別人じゃないの?
どっかの有名な芸人さんみたいな感じの顔になってしまって。
近いし服装は似てるんだけどもちょっと違う人になっちゃってるってところがあって
やはりこれも日本人アジア圏の人間の学習データが足りないんじゃないかなとちょっと思うようなところがありました。
一方でですね後ろのスライドを見てみましょうか。
この人物の後ろに映っているスライドの方なんですけども
チャットGPTの方だと英語で書かれていてビジネスストラテジーとか書かれています。
英語での描写ではですねテキスト結構うまくいってると思うんですね。
ナノバナナプロは後ろの方ですね日本語でしっかりスライドを作っているんですね。
やや遠目に見ている部分が文字化けっぽくなっているんですが
いかにも日本のビジネスカンファレンスでありそうなスライドを再現してくれていて
ビジネスDXとかそういうことを書いてあるんですよ。
この辺のですねやはりテキスト表現の差が出るなというところで
日本のプレゼンスライドっぽいものを描写するという能力はナノバナナプロは強いなというふうに感じましたね。
次の事例最後の事例としてお見せしたいと思います。
インタビュー写真みたいにしてくださいというふうに指示をしてみました。
私のプロフィール写真を与えてインタビューを受けているような感じの写真を作ってという指示もしました。
これもチャットGPTが再現度が非常に素晴らしく
私の顔をなるべく維持したままポーズを変えて
インタビュー受けている人みたいな感じにしてくれました。
それに対してですねナノバナナプロの方ですが
似てるけどちょっとこれ顔が変わっちゃってるかな別人に近いかなという感じにしてしまっていますよね。
再現度とか一貫性の維持というところではチャットGPTの方が私は使いやすいなと感じたところですね。
このあたりサマリーで今お見せしてきましたがお分かりかと思います。
あのですね写真の加工はチャットGPTの画像生成非常に優秀かなと思います。
一方で日本語のスライドみたいなも作らせたり図解とかねインフォグラフィックみたいに作らせるときはどうしても文字化けが気になってしまう部分があり
英語圏では問題ないかもしれませんが日本語においてはナノバナナプロの方が優秀なのかなという印象を持ちます。
こういったことですねより深く掘り下げていく内容にしていきたいと思います。
今回の目次ですねはい番組説明やアイスブレイクを話した後ですねイベント告知などをしてで最新動向今回のねリリースにまでの経緯とか
オープンAI社とグーグル社のバトルね今どういう状況なのかという話をやったりですね
それからチャットGPTの画像生成イメージ1.5期待外れだったのかということで結構ねがっかりしている日本人ユーザー多いんですよ
いや日本語の文字分け問題直ってないじゃんというところなんですがここについての見解ですねそれぞれの強み
そして実例紹介ということでチャットGPTの画像生成でできること結論使い分けが重要という話
そして料金プランについてですね私はチャットGPTどちらも有料プランですが今後どういう課金をしていくかという感じの方針などを言ってからですねまとめをしていきたいと思います
はい一旦番組説明をさせていただきます
ExcelとAIで人生を自動化して楽にするラジオという番組です
著書累計8万部の生成AI最速仕事術の著者であり講師で2次の子育て仕事の両立を奮闘しつつ体調悪化をしたり多忙の極みとなったりしたんですけども
AIをフル活用した自動化ライフハックの研究と実践を続けております
皆さんがExcelとAIの力で多忙な毎日を自動化し楽にするための実用的なノウハウ経験体験談をお伝えしていきます
スポーティファイとYouTubeでは動画付きのポッドキャストそしてボイシーはじめとする各種のポッドキャストメディアでは音声のみとなっております
アイスブレイクということでちょっと雑談です
興味のない方は一旦飛ばしてください
先日はですねもともと私は横浜に長年住んでいて最近ここ2,3年ですかね湘南エリアに住んでいるんですけども
毎年家族で横浜の赤レンガ倉庫で開かれるクリスマスマーケットに行っているんですね
恒例の家族行事でした
今年はですね雨だったので非常に寒かったんですけど昼頃には霧雨になってきて
それでも子供たちね2歳と6歳の子ですけども霧雨の中でですね風邪ひかないかすごく心配だったんですが無事に行くことができました
で駐車場を探したいとかですね現地の情報なんかを得るのもチャットGPTのリサーチ能力非常に高まっているので
片手間でもチャットGPTに調査を依頼してそういった情報を得ることができました
また現地でですねクリスマスマーケットなんですけどもいろんな国のですね特に北欧の国が多いのかな
はいでは本題に移っていきましょうAI画像生成の最新動向ということで
今映像で見せているのがノートブックLMで作った資料なんですよね非常に綺麗ですよね
はいこれはGoogleとオープンAIがバトルしているというところが経緯としてあります
シェアでいうとやはりオープンAIのチャットGPTが圧倒的に先を行っているというところだったんですけども
Googleも負けずですね追いつこうと頑張っているというところですね
で一つの事件が最近起こりまして2025年11月ですね
Gemini3という最新バージョンが出ましたこれが非常に優れているということで
様々なベンチマークの指標でチャットGPTの先端モデルであるGPT5.1を上回っているということでセンセーショナルにリリースしました
またその後出た画像生成モデルこのポッドキャストでも何度も紹介してますがナノバナナプロですね
これがすごくですねセンセーショナルでヒットしまして話題になりました
とにかく画像生成の性能が高くテキスト描写もできるのでビジネスに使いやすいと
図解とかフライドとか作れるということでGoogleも様々なサービスでこのナノバナナプロを展開してます
ということで非常に優れているというところで話題になっています
オープンAI社もこれに反応しましたということで社内でコードレッドという赤信号みたいな社内のサインが出たということみたいですね
ちょっとまずいぞとGoogleのGemini3ナノバナナプロはかなりすごいことをやっているので
チャットGPTも緊急で強化するというところに力を入れなきゃいけないというコードレッドが出たというふうに報道されています
最近出たのがGPT5.2というところでベンチマーク奪還というかですね非常に優れた結果を出し
Gemini3を超えてますよといったところをアピールしています
また今つい最近出たのがこの画像生成モデルでGPTイメージ1.5というものが公開されたということですね
なのでこのGemini逆転化というセンセーショナルなニュースの後で
オープンAIもGPT5.2を出し今回画像生成のイメージ1.5を出したので
要はナノバナナプロ対策というかここに対抗馬として出してきたのが明確にわかるというところですね
だからこそどっちが優れているのということを比較されやすい部分があると思うんですよね
そういった経緯があったので今回ね
じゃあチャットGPTの画像生成イメージ1.5すごいのかどうなのかと注目が集まったわけです
その結果なんですが私は第一印象ではあれいまいちかなみたいな感じでした
というのもナノバナナプロのインパクトが強すぎたので
画像生成でフライドは作れるわ図解は作れるわというビジネスのそういうビジュナル表現で
ガンガン使えるものが出てくるのを期待していたところがあります
なんですが結構日本語で文字化けしちゃう問題があり
これはナノバナナプロだよね
こっちがこういうタスクではナノバナナプロが勝ちだよねみたいな評価が多く
日本でもねいまいちみたいな感じのやっぱり評価をしている人が多い気がしています
なんですがそれはちょっと想定というか結論を出すのが早すぎるんじゃないかなと私は感じたわけです
しかしながら写真の加工とかでは強いんじゃないのというところは
先ほど述べた通りでチャットGPTの画像生成かなりいいところがあるというのはわかっています
では次ですねテキスト生成の比較ということで
ナノバナナプロが強いよねということをもう一度復習しておきたいと思います
チャットGPTの画像生成ですね
スクリーンでもお見せしていますけど
持ち家vs賃貸という図解を作ってもらいました
全体的な見た目はいい感じ
あと一歩って感じなんですよね
日本語を拡大してみるとよく見ると文字が潰れてしまい難しい漢字
画数が多い漢字が潰れてしまったり文字化けしているというところですね
修善とか費用の費とかねちょっと画数多くなってくるとこういう潰れが広くなってしまうというところですね
それに対しナノバナナプロが生成した図解は
図もさることながら漢字の表現が完璧にちゃんとできているというところがあり
こうした部分ね修正しなくていいというのがビジネス上非常に役に立つというところですね
スライドとかウェブサイトとかブログとか何でも使えそうですよね
ということでこのあたりの日本語表現が使えるところがあり
ナノバナナプロはやっぱり依然として強いよねという評価となっています
次に行きましょう
人物の写真の一貫性や加工の強み
ここがですね私が考えているChatGPTの画像生成イメージ1.5の進化というところだと思います
先ほども紹介しました
私のプロフィール写真を与えてこの人が大きな会場でセミナーをしている写真を作って
といった時にChatGPTの画像生成ではしっかり人物の一貫性を維持しながら
指示に従って画像生成してくれています
これ合成とかね生成ですと言わないとなかなかわからないレベルかなと思うんですね
一方でナノバナナプロどうしてもちょっと別人かなっていうような写真になってしまっています
もう一つの事例もそうですね
インタビューを受けている写真を作ってといった時にもChatGPTの画像生成は非常に一貫性があります
ナノバナナプロはちょっと別人じゃないのという感じになってしまっています
こうした形ですね
ポートレートの生成
写真を加工するなんてところですね
私なんかですね自分の写真の素材ってあんまり実は持ってないですよね
プロフィールを一枚ずっと長年使い回しているというところがありまして
YouTubeのサムネイル画像とかにも表情を変えてポーズ変えてとかしたいんだけども
毎回同じような写真を使い回していたわけなんです
しかしながらここまでのレベルですねChatGPT画像生成できると
自分のポートレートをあまり持ってない人でも様々なシーンをですね再現できるなということで
これはね私にとっては非常にありがたいですね
これまでねナノバナナプロの前の今年の夏に出てきた旧ナノバナナプロじゃない方のナノバナナでも
いろいろ試してたんですよ
そういうポーズ変更とかできるのかなと試してたんだけど
やっぱり別人になっちゃう問題がどうしても抜けなかったですね
どうしてもねこういうのは海外のAIモデルだから
日本人とかアジア人のね学習データが足りないのかなと諦めていた部分もあります
そうした中でついにねこれならいけるというようなChatGPTの画像生成出てきたので
私は大歓喜しているところというところなんですよね
実例紹介GPTイメージ1.5でできることいくつか紹介していきます
表情のバリエーションということで
これねあの私のプロフィール写真を与えて
4つの表情を1つの画像に割り振ってみたいな指示をしました
驚いてる悩んでるびっくりしてるとか
腕を組んで疑問に思ってるとか
遠くを指差してるみたいなね
なんかいぶかしげにしてるとかですね
何かを紹介してるとかOKの丸をつけてるとか
ちょっと顔変わってるかなみたいなところありますが
何回か生成して一番自分に近いものを選ぶと
かなり再現度が高いんじゃないかなという感じで
表情やポーズのバリエーションつけたり
服装を変えるとかね優秀な挙動をしてくれます
他にも特殊な効果をつけたり
イラストで指示をするなんかも
かなりいい解釈をしてですね指示通りやってくれてます
今回もねなんかポーズを表現するのって
文章だけじゃなかなか難しいじゃないですか
今回私の画像でねサムネイルに使った
指を上に抱えてですねその先に
オープンAIのロゴがあってそれが光輝いてる
まばゆい光みたいな感じなんですけど
どうしても文章では表現しきれない部分を私がですね
手書きのメモ帳に書いたですね
イラストで指示をしました
このイラストのようにポーズを変えてみたいなね
それと自分のプロフィール写真を与えたら
そのイラストの通りのポーズにしてくれたというところです
これはね非常にですねこれができると
なんでもポーズ変えられるし指示がめちゃくちゃ
しやすくなりますねで一方でなんですけど
これちなみにナノバナナで作った結果も
画面に映したいと思います光りすぎと
ちょっとねちょっとウケてしまいましたね
ちょっと若干笑いましたなんとなく顔でかく
体ちっちゃくロゴだけがめちゃくちゃ
光ってるみたいなねちょっとギャグみたいな