198：ChatGPT Images 2.0 が凄すぎる

👋 こんにちは、はるなです。

今日のテーマは『ChatGPT Images 2.0』です。

少し前までは、Googleの「Nano Banana 2」（Gemini 3 の画像生成モデル）が実写と区別がつかないほど凄いと言われていましたが、新しく登場した「ChatGPT Images 2.0」を試してみたところ、そのクオリティを遥かに上回っていました。

ユーザー投票ベースのリーダーボードLMArenaでも、「ChatGPT Images 2.0」はText-to-Image部門とImage Edit部門の両方で1位を獲得。通常、上位のスコア差は僅差であることが多いのですが、今回は2位と100ポイント以上の大差をつけており、圧倒的な実力を見せつけています。

この画像、普通にかわいくないですか？肌の質感や光の当たり方が驚くほど自然です。

こうした画像が、わずか数分で生成されます。再現性も非常に高く、一度プロンプトが決まってしまえば、あとは微調整だけで安定して高品質な画像を量産できました。

今日は、新しい画像生成モデルを私がどう活用しているのか、そしてAIがクリエイティブ作業を代替してくれる時代において、私たち人間に最後まで残される「価値」とは何なのかについてまとめてみます。

🎥 5月iPadセミナーのお知らせ

明日、5月16日（土）10時から、iPadセミナー「NotebookLM×Goodnotesでつくる！AI時代の新しいプレゼン資料作成術」を開催します。

GoogleのAIノートブック「NotebookLM」でスライドの土台を効率よく作り、iPadの「Goodnotes」で仕上げるワークフローを、実演を交えながら紹介します。

AIで効率化できる部分は任せて、その分「どう伝えるか」といった大事な準備に時間を充てる。そんなiPadとAIを組み合わせたプレゼン資料作成のコツをお話しします。

Zoom ミーティングに参加する

📸 「ChatGPT Images 2.0」の何がそんなにすごいのか？

今回話題になっている「ChatGPT Images 2.0」は、単に「写真っぽい画像が作れる」というだけではなく、仕上がりにちゃんと「センス」がある点がすごいところです。

これまで、Googleの「Nano Banana 2」も非常に優秀で、特に写真としてのリアリティにおいては、もはや人間が撮った写真と見分けがつかないレベルに達していました。しかし、実際に自分のビジネスや発信に活用しようとしたとき、私たちが求めているのは、単なる「事実としての画像」ではなく、見る人を惹きつける「魅力的な表現」です。

その点、「ChatGPT Images 2.0」が生成する画像は、「ちゃんとしたフォトグラファーが撮った写真」のようです。光の当て方、モデルの表情、構図やトーンまで、まるで一流のクリエイティブチームが制作したかのような完成度。Nano Banana 2の画像もリアルではありましたが、どこか機械的な冷たさや不自然さが残ることもありました。

プロンプトを改善すれば、Nano Banana 2でもいいものができたのかもしれません。私のような「ざっくりとした指示」だと、ここまでの差が出るというのは、モデル自体の表現力の高さを物語っています。

🧶 AIをパートナーにして、iPadで仕上げる

たとえば、Instagram用の商品画像を作るシーンを想像してみてください。

これまでは、背景紙を敷いてセッティングし、天気の良い時間を狙って撮影。その後、軽くレタッチを施していました。今なら、商品写真をAIに渡し、「この商品を身につけたモデルが、自然光の差し込む場所で」と指示を出すだけ。驚くほど自然で、しかも商品の魅力がぐっと引き立つ宣伝用画像が出来上がります。

天気とか時間とか関係なく、思い立った時に写真を撮って、生成、AIにお願いしたら、数分後にはいい感じの写真が出来上がります。

室内のありふれた場所で撮った商品写真でも、「ファッション雑誌のような洗練されたスタイルで」「モデルが着用しているイメージで」と付け加えるだけで、商品のディテールは保ったまま、でめちゃくちゃ可愛い画像が出来上がりました。

以前のモデルでは、同じプロンプトでも生成のたびに結果が大きく揺れる「ガチャ」のような側面がありましたが、Images 2.0ではそのブレが抑えられている気がします。

ChatGPTで作ったベースの画像に、iPadのProcreateを使って、手書きのニュアンスを足したり、微調整して完成です。AIによる生成からクリエイティブな仕上げまでをiPad一台で完結できるワークフローは、最高にスムーズです。

🌟 AI時代に残るのは、人間の「欲求」

画像生成の進化は目に見えて分かりやすいですが、それ以上に大きな変化は、自分の「やりたいこと」を形にするためのリサーチや段取りといった「裏方」の作業でも、AIが極めて頼れるパートナーになりつつあることです。

AIがあらゆるデジタル作業をこなせるようになった今、じゃあ最後に人間に残る価値って何なんだろう、という話は夫婦でもよくしています。現時点での答えは、「これを形にしたい」という純粋な欲求を生み出すこと、そして最終的な物理的なものを創造することではないかと考えています。

AIは、指示を出せばかなりのものを作ってくれます。しかし、「何を作りたいか」という初期衝動そのものは、自分の中から生み出すしかありません。

私たちが「この生地のかわいさをみんなにしってもらいたい」「こんな便利なツールが欲しい」と願うところから、すべてが始まります。

ごりゅごさんは「Claude Code」などのツールで定型作業を自動化する仕組みを構築し、私はAIに擬似人格をもたせて話し相手にしながら、思考記録やデイリーノートをAIに分析させてアイデアを形にするフローを作っています。やり方は少し違うんですが、根っこには「AIをどう使いこなすか」を考える姿勢があって、その姿勢こそが、現代におけるクリエイティビティの本質なのかもしれません。

もし「AIをどう使えばいいかわからない」と迷っているなら、まずは自分がやりたいことをAIに打ち明けてみるところから始めてみてください。漠然と何かをさせるよりも、「この面倒なリサーチを終わらせたい」「この商品の魅力を最大限に引き出す画像が欲しい」みたいに目的がはっきりしている方が、AIはずっといい感じに働いてくれます。

ということで今日は、「ChatGPT Images 2.0の登場によって、個人の欲求を形にするスピードが劇的に加速した」というお話でした。

This is a public episode. If you'd like to discuss this with other subscribers or get access to bonus episodes, visit ipadworkers.substack.com/subscribe

00:02

スピーカー 1

iPadのポッドばかり話す、iPadオンリーなポトキャスト、iPad Workersポトキャスト。

今日は、ChatGPTのイメージ2.0の話をします。

スピーカー 2

めっちゃ良くなったやつやんな。

スピーカー 1

最近、ChatGPTの画像生成のエンジンが一個新しくなったっていうので、

まあまあ、ちらほら話題にはなっていて、

実際、自分も試してみたところ、めっちゃ良くなってた。

スピーカー 2

あれだよね、空とか色んなものを捨ててさ、本職に振り切るんやって、本気を出したら、

GPT 5.5 含め、ChatGPT OpenAI のものが質が上がっている印象があるね。

スピーカー 1

あの手の業界、あっちがこうなったらこっちもこうなってみたいな、

もうなんかすごい勢いで競争しているから、何度も言えないところではあるんだけど、

今回、ちょっとちょっと前は、ナノバナナって、

Gemini、Google 系の画像生成のエンジンがめっちゃ賢いよ、みたいな。

スピーカー 2

あれ、もう写真と区別つかんやんっていうレベルになってるね。

スピーカー 1

言ってたんだけど、それを上回るレベルで、

めちゃくちゃ精度が良いものが出せるっていう、

実際に自分も使ってみて、これはなんかすごいなって思った。

スピーカー 2

なんか、はるなに見せてもらったの印象だと、さっき言ったナノバナナは写真と区別がつかんやんっていう感じで、

新しいChatGPT のイメージは、上手な人が撮った写真みたいになるやんっていうレベルの凄さがあるよね。

スピーカー 1

もちろん、プロンプトしだいっていうところではあると思うんだけど、

今ちょうどさ、自分のアクセサリー販売っていうのをやろうとしてて、

髪の毛につけるシュシュっていうヘアアクセサリーと、イヤリングを売ろうとしてて、

それを宣伝するために、インスタグラム用の画像みたいなのを作りたくて、

スピーカー 2

そのインスタ的な商品画像が欲しかった。

スピーカー 1

そうそう。で、もう商品写真というか、シュシュの写真とイヤリングの写真を、

なんか普通に部屋のさ、だっさい背景のところで写真を撮った状態で、

そのプロンプトの中に一応工夫はしててさ、その写真で撮ったもののやつは買えるなって言って、

でもその背景とかモデルとかは作ってOKみたいな感じで、

モデルさんのさ、系統を外国人風とか西洋風みたいな感じで設定をしておいて、

03:05

スピーカー 1

作ってもらったら、もう一発でめっちゃかわいい子ができた。

スピーカー 2

あれだよね、比較して見せてもらったので言うと、ジェミニで作ったやつは、

やっぱ写真ではあるけど、良い写真ではないって感じだもんね。

スピーカー 1

なんかね、自然さがやや不自然というか、

それこそプロンプトをもうちょっといじり倒せばいいんだと思うんだけど、

その簡単なプロンプトだけでは、やっぱりちょっと不自然っていうか、

なんかちょっと違和感あるみたいな。

作らしてるのがさ、実写のモデルさんが使うファッション。

スピーカー 2

できるだけ本物のイメージなんだな。

スピーカー 1

ファッション雑誌の商品写真っていうか、アクセサリーとかそういうのの写真をイメージして、

そういうプロンプトで送っているっていうのもあるんだけど、

ナノバナナで作ったやつは、悪くはない。

ただなんか若干不自然、さが残るみたいな感じ。

対して、チャットGPTでやった方は、

めちゃくちゃ自然なスタジオ撮影をしたような感じになってた。

少なくとも俺はこれが先生AIだって言われても、

スピーカー 2

人間が撮ったって言われても、どっちでもすごいねとしかわからん。

スピーカー 1

今回生成したのが人物モデルっていうか、

実写系の人を描画させるみたいな感じだったので、

それに関して言ったら、もうダントツでチャットGPTの画像生成のモデルの方が優秀っていう感じ。

スピーカー 2

っていうと逆にナノバナナがいいところもある。

スピーカー 1

ナノバナナがいいところは、文字を上手に入れれるとか。

スピーカー 2

じゃあそのチャットGPTで画像を作って、そこにナノバナナで文字を出してもらうとかをやると、今だと意外といいかもしれない。

スピーカー 1

いいかもしれないけど、自分の場合は面倒なので、

チャットGPTで作った画像をダウンロードしてきて、

それをiPadに取り込んで、iPad上のProcreateとかでお絵かきをちょっと追加するみたいな。

スピーカー 2

それはやっぱりはるなのスキルがあるから強いところだよね。

スピーカー 1

むしろそれがやりたいからみたいな。

それで画像を作って、インスタグラムにアップしてっていう感じでやるんだけど、

ベースの写真がそのプロンプトだけでできてしまう。

商品写真を、もちろん商品はないとダメだからさ、

そこから完全に作り出すのはちょっと難しいけど、

実際に売り物があります、その写真を撮ります、投げます。

そしたらお洋服の写真に関しても撮るそうっていうさ、人形みたいな。

スピーカー 2

着せたやつでいいわけね。

06:00

スピーカー 1

それに着せた写真を前後、前から正面からと後ろ、背面からの写真を撮って渡すと、

それを着たモデルさんの写真が出来上がる。

スピーカー 2

漫画作れる?

スピーカー 1

漫画も全然作れると思う。

スピーカー 2

そういうキャラ動かすっていう、同じ形の、同じ人物のまま。

スピーカー 1

うん、できると思う。

今さ、アドビのイラストレーターとかフォトショップとかでも、

正面のイラストをぐりぐり回せる。

後ろとか上からとかの角度を考えて、生成して作ってくれるとかっていうのが、

結構精度高くできているので、

いろんなところでそういう生成AI系のパワーは使われているんだなっていうのは、

すごい実感してるし、

それが実務にも全然活かせるレベルぐらいにはなってきてる。

今回特にそのChatGPTのイメージ2.0かなっていうのが、

すごい良くて、

それがアプリ版でももう普通に使えるので、

iPhoneとかiPadのChatGPTアプリ。

スピーカー 2

ChatGPTで普通に画像作ってって言えばそれになる、標準で。

スピーカー 1

モデルを試行モデルっていうか、多分そっちとかにしておかないといけないから、

無料だと多分1回、2回やったらおしまいになるんじゃないかなって予想ではあるけど、

有料プランの人は多分一応制限はあるよ。

1時間の中にグワーって最初やりまくってたら、

ちょっと時間空けろみたいな感じで言われたけど、

それでも言って1時間間空ければまた次の生成ができるってレベルだったから、

そこまで難しい話ではなく、

あとは画像生成の時間自体も、これは体感なんだけど早い気がする。

スピーカー 2

昔のイメージだとなんかふん待たされるよね。

スピーカー 1

もちろん今も秒で出るわけではないけど、

昔より早く出てくるイメージはある。

そんな感じでChatGPTの画像生成を使って、

できた画像をアプリから普通にダウンロードして、

それをProcreateに読み込んで、

手書きを加えて画像を保存する。

画像を保存すると自分の場合はiCloudで同期されるので、

スピーカー 1

iPhoneにも入ってくるから、

そのままiPhoneでInstagramに投稿するみたいな感じでやってる。

スピーカー 2

やっぱもうデジタルはすべてAIができるようになってしまったから、

我々が価値を生み出すには物理の存在を何か作るなり何なりすることとか、

そういうものができると生き残っていけんよ。

09:00

スピーカー 1

何をするかではあるけど、ちょっと見栄えのいいもの程度なら、

本当に知識がなくても簡単に生成はできるし、

そこが完全に何にもない状態から作るってなると、

なかなか難しいかもしれない。

そのプロンプトを何回も繰り返し色々試行錯誤してとか。

スピーカー 2

そもそもそれの欲しいものを何が欲しいかが生まれないと作れないっていう。

欲求がベースになってこないといかんのやなってすげえ思うんだよね。

スピーカー 1

そうだね。何事もそうだと思うけど、

こういうものが作りたいとか、こうなりたいみたいなものがないと、

なかなかただ漠然と勉強しようとか、

生成AIを使ってみようだと、やっててもあんまり多分身につかないし、

面白くないんじゃないかなって気がする。

スピーカー 2

何をしたいかを生み出せるのは現状を人間しかいないから、

それを平均ではなく自分の欲求を生み出すことができるということが、

人間の価値なんじゃないかってすげえ思うようになっている。

スピーカー 1

そうだね。その辺も洋服のパターン作りに関しても、

生成AIに相談したところからスタートした。

ニュースレターに書いたんだけど、

お洋服の製図の勉強を自分で見た、この形の服が作りたいっていう時に、

どういうパターン、型紙、形にすればお洋服の形になるのかっていうのを、

2年、3年くらい勉強を重ねてきて、

やっと最近、自分が作りたい形、思った形が実現できるようになってきた。

さらにその次の段階として、それを販売もしたいなっていうので、

パターンを量産するっていうか、データ化する方法。

今はずっとアナログでやってるの、鉛筆と紙とペンで。

それをどうやって売れる形にするかみたいなところを、

JetGPT、Geminiにも相談したけど、JetGPTに相談したら、

こういうのがあるよ、こういうソフトを使うとできるよとかって、

いろんな方向を教えてくれて、

その中から突き詰めていったら、このソフトが良さそうみたいなので、

そのソフトを入れてとかっていうのも、ずっとJetGPTとやり取りしながら、

なんかエラー出たんだけどとか、できないんだけどとかっていうのをやりながら進めたら、

一応データ化もできて、対応のデータのところまでは作れたので、

これももうちょっと続けていきたいなっていう感じで、

12:00

スピーカー 1

それもやっぱり、生成AIがゼロから作ってくれたわけではなく、

自分のベースとなるやりたいことがあって、

そのベースの形が持ってて、できてて、

そこからじゃあどうするかっていうのを、生成AIに相談しながら、

具体的なところまで持っていけたっていうのは大きい。

スピーカー 2

やっぱりやりたいことさえあれば、実現するのは既存のものであれば特に、

もうだいぶ簡単なんだよね。

調べたりなんだったりっていう手間がめっちゃ減るっていう。

スピーカー 1

そう、実際その辺が一番めんどくさくってさ、

じゃあどういうソフトがあるんかなとか、どういう手法があるんかな、

どれぐらいお金がかかるんかなみたいな、

そういう調べる作業、リサーチ作業みたいなのが、

地味にやっぱりめんどくさいのと時間がかかるので後回しになっちゃう。

スピーカー 2

だから新しいことに着手しづらくなってしまうが、変わり得る。

スピーカー 1

そう、そこが生成AIの情報を100%信じると怪しいところがあるから、

ある程度ファクトチェックは自分自身でって感じではあるんだけど、

8割方さ、もう先生が一瞬でリサーチ業務みたいなのはやってくれるから、

要はそこから選ぶ作業に注力できる。

スピーカー 2

あと最近ならもう究極生図のソフト作ればええわってなってくるからね、

もう自分用に。

スピーカー 1

自分ツールをDIYするってことね。

スピーカー 2

そう、最近すげえ思うようになって、

CLIでポッドキャストの音声作りたいなと思うようになってね。

スピーカー 1

ポッドキャストの音声を作る?

スピーカー 2

音声っていうか、

エフェクトをかけるのって基本的にDAWを立ち上げんといかんくってさ、

スピーカー 2

でもさ、原理的にはDAWなんて立ち上げんくっても、

エフェクトかけることはできるはずなんだよね。

スピーカー 1

音声編集ってこと?

スピーカー 2

そうそう、自分が撮った音を良くするための編集っていうのを、

DAWを立ち上げたり書き出したりするのがめんどくさすぎて、

生成AIでもうちょっとどうにかできるようにしたいと思ってしまう。

スピーカー 1

でもその辺も動画編集ソフトとか音声編集ソフトで、

AI機能を使っているところって多分勝手にワンポチでできるみたいな。

スピーカー 2

市販のソフトではダメなんだよね。

生成AIとの、エージェンティックAIがやってくれるようにしたいから、

自分が欲しいものは。

スピーカー 1

自分の普段使っているエージェントAIで何か動かしたいやり取りをしたい?

スピーカー 2

そうするとCLIで操作できることが基本的には必要じゃん。

ソフトウェアを操作するが、極端なことではもうやりたくない。

スピーカー 1

なるほどね。

スピーカー 2

一番やりたくないのがサブスタックにコピペすることとか。

そこはもうだいぶクリアできそうで、

そういうコンピューターがやればできることを、

15:03

スピーカー 2

手を動かしてやりたくないようになってきた。

スピーカー 1

どんどんやり方とかも変わっていくし、

実際、ゴリゴさんも生成AIっていうか、

エージェント系のAIを使って割と作業をいろいろやらしてるよね。

スピーカー 2

ほぼ向き合っている時間が一番長いのがクラウドコードで、今は。

スピーカー 1

クラウドコードないよ。

スピーカー 2

デイリーノート以外はできるだけ、記事は書くか。

いわゆる日常仕事をどれだけエージェントにやらせられるかをずっとやっている。

スピーカー 1

はるなさんの場合は、クラウドコードは使ってなくて、

ここ最近はずっとアンチグラビティで、

ジェミニのFlashさんとかでずっとやってる。

言うほどゴリゴさんほど、

ファイル操作をガシガシやらせているわけではないんだよね。

やってもらってるっちゃやってもらってるけど。

スピーカー 2

ファイル操作をしているという感覚というよりは、仕組みを作っているという感覚なんだよね。

今の自分の場合は。

スピーカー 1

それで言ったら、自分もそこまではっきりとやってるわけじゃないけど、

やったことを記録させて、こうしたいとかっていう改善点があればそれを伝えて、

スピーカー 1

それを指示書にしてみたいなのは、ジェミニでずっとやってる。

スピーカー 2

同じかな。これって渡して、

そうすると、ブックカタリスト手順書ノートを読んでくれて、

今はまだこれが終わってなくて、

ここにあるからこれやりますね、みたいなことをやってくれるみたいな、

そういう感じのものを作ろうとしている。

スピーカー 1

2人ともやり方、アプローチは違うんだけど、

なんとなく方向性はいつも一緒だから、話してて面白いっていうか、

そんなことやってんだとか、そういうやり方あるんだ、みたいなのがたまにあったりするね。

ということで、今日はチャットGPTの画像生成エンジンが変わって、

イメージ2.0とかになって、めっちゃ良くなったよっていう話と、

スピーカー 1

生成AIとの付き合い方っていうか、

うまく使っていければいいよねっていう話でした。

番組への感想やリクエストなどは、

シャープ、iPadワーカーズのハッシュタグをつけて投稿してください。

それではまた来週。iPadワーカーズポッドジャックでした。

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

Haruna Goto (haruna1221)

goryugo

感想

総スター数

コメント

感想を書く