AIとの出会い
お疲れ様です。
薩摩訛りの耳毒ラジオ。
時代の波に乗り切れず負け続けた反省。
この配信は残りの人生一度でも勝ちたい私、
miyakenneがチャレンジ最後のチャンスに奮闘した記録を
薩摩訛り全開で発信しています。
木曜日は老化デーなんですけど、
全然木曜日じゃないんですけど、月曜日なんですけど、
最近ね、老化、これも老化なのかな?
老化と思っていた脳機能の低下みたいなのを感じてたんですけど、
老化というか、老化のせいなのか、
いわゆるADHD機質が強くなってきてるんじゃないかなっていうのを感じている。
つまり、老化によってこの機質を埋めていた、
能力で埋めていた部分がだんだん埋め切れなくなって、
露出してきてるんじゃないかという仮説を考えているでおなじみ、
うまく描けたきゃ絵を描くな、絵を作れ、イラスト講師、ミヤケンです。
耳どくラジオ、よろしくお願いします。
では、いくぜ!
はい、では、本日のテーマはAIですね。
先日、3月31日に、
ChatGPTのプラスを1か月課金してみまして、
いろいろ試しております。
その前の配信で、今度のアップデートがすごいということで、
絵描きがいよいよ、講師もいらない、絵描きもいらない未来が見えてきたと、
非常に焦りましてね。
まあ、とにかく触ってみないことにあって、触り始めたんですが、
結論から言うと、まだですね、どうやら。
やはり宣伝というか、
今度のアップデートすごいということを、
若干、やっぱり大げさに吹き飛ばしているんだろうな、
ということだったんだろう。
そういうことだったのかな、と思ってます。
実際、僕、触り始めてね。
確かにできるんだけど、って感じですね。
うわあ、これは、っていうほどは意外となかったっていうのが印象です。
画像生成の方で特に、僕としては力を入れて触ってやっているんですけど、
印象としては、今までと変わらないですね。
変わらないっていうか、やることは変わらないですね。
出来上がるものの精度は高いんですけど、
こっちがやること、プロンプトの指示っていうのを、
結構いろいろ試さないといけないっていう部分と、
あと、やはりガチャだなっていうところは変わらない。
変わらないというか、その延長線上ではあるなっていうふうに思いました。
思ったんですが、最近ね、力さんもやってますよね。
画像生成の試行
AIを育てるという意識で取り組むみたいなね。
僕もですね、実は今回のアップデートについても、
YouTube動画を見まくったところでですね、
やはりこの育てるという概念が非常に面白いなって、
そして大事だなっていうところを感じていたので、
この課金し始めてからですね、僕も育てる意識っていうのを持ってやり始めてます。
具体的に言うと、スレッドはできるだけ一つのスレッドでやっていくということと、
できるだけいちいちまとめをさせて、
まとめた部分でこれ大事っていうまとめは、
特にしっかり覚えておいてくださいみたいな、
記憶の定着を意識させてさせるっていうね、
この辺りを重視しながらやり取りを進めております。
ただ最初の頃はですね、ちょっとスレッドいろいろ分けて使い分けもしていたんで、
今現在一つのスレッドに一本化してますが、
その中でですね、最初の最初でちょっと、
一個イラスト作品を作るのの手助けをしてもらおうと思って、
言えば作品を作る気は僕はAIで作る気はないんで、
一応下書きまでは作れないかなっていうのをね、
試してみようと思って、
それ専用の一応スレッドを立てたんですけど、
そこで得た知見を話してみたいと思います。
そしてこれを話すにあたってですね、
AI自身に、マチャドGPT自身に最初にこういう質問をしてます。
このスレッドでのやり取りを通じて、
AIが画像生成をするときに難しい部分として、
私が発見したこと、そして私のリアクションを受けて、
あなたが発見したこと、あなたっていうのはGPTのことですね、
をまとめて音声配信しようと思います。
要定をまとめたプロットを作ってほしいのですが、
やってくれますか、みたいなね、ことを投げた上で、
プロット的なものを一応作ってもらって、
一回質問が返ってきたんですけど、それに答えながら、
作ってもらったプロットを元に話していきたいと思います。
ということで、ここから先は、
AIの作ってくれたプロットを元にしゃべりますので、
一つよろしくお願いします。
実際にこのスレッドを通してやったことなので、
そういう知見も含めております。
では、そんなところで進めていきましょう。
タイトル1を出してますね。
画像生成AIは育てる時代へ。
サブタイトル、AIと構図、テンプレートを一緒に作って、
わかったこと、っていうタイトルをつけてますね、AIが。
では、オープニングというところでいきます。
軽い挨拶とか書いてますけど、
これはいつもの僕の挨拶だったということで。
今日は画像生成AIとのやり取りを通じて、
わかったことをお話しします。
さっきしゃべった部分ですね。
進めましょう。
AIに任せて、とりあえず日本語で指示してみました。
写真を渡してね。
この写真を簡単な、この風景画像を簡単な線画にしたい、
みたいなのを最初投げたら、
フォトショップとかクリップスタジオとかで、
こういう風にすれば線画を抽出できますよって返ってきたんで、
いや、そうじゃない。
それはあなたにやってほしいんだということでですね。
だから線画抽出じゃなくて、
簡単なスケッチにしてくださいって言ったのかな。
そしたら一応線画みたいにしてくれました。
白黒のスケッチって言ったらね。
そういうところからスタートしてですね。
ここに人物を配置したいのでということで、
選択機能を使って、
その背景画像の真ん中あたりに選択機能で、
ちょっと丸を選択して、
このあたりに人物を置きたいですという感じでね。
この人物は右向きでこっちを向いていてとか、
指示をしたんですが、
何度言っても左向きを出すんですよ。
人物を反転してって言ってもね、
はい、反転できましたって言って、
やっぱり同じ向きを出すんですよ。
どういうことだっていうところから始まりましたね。
これ何でそうなるんですかっていうところを、
ちょっと自分で検証してくださいって言って、
検証させて、そしたら、
人物は右肩が手前に来ていて、
左肩が後ろに下がっていてみたいなね。
右足が前に出て、左足が後ろに下がっていて、
完全に右向きですって言って、
あなたの指示通りですって返ってくるんですよ。
いや違うと、私から見ると、
これは完全に逆になってますよというのを返すわけですね。
いろいろやり取りをしてたらですね、
背景との兼ね合いで、
どうしてもこの背景に合わせようと思うと、
こっち向きの絵が多いので、
そっちに引っ張られてしまいますみたいなことを言うんですよ。
何だ引っ張られるってとか思って。
言えばビッグデータを参照しているので、
やっぱりこういう構図が多いなと思うと、
こっちの指示よりも、
よくある構図っていう方を優先的に出しちゃうっていうね、
癖があるらしくてね。
そういうことがやり取りしているうちに分かってきました。
なぜそうやって引っ張られてしまう原因っていうのは、
指示の複雑さ、
複雑さとかつ曖昧な部分っていうのを、
読み取れなくて、
よくあるパターンっていう風に、
どうしても落ち込みやすくなるっていうような感じでしたね、回答は。
この回答の中で面白かったのが、
結局GPT、
4O自体は、
分かってるんですよ、私の指示が。
でも4Oが画像を出す時に、
画像ジェネレーター、
イメージジェネレーターってやつですかね、
こっちに英文プロンプトとして渡すんだけど、
この時にやっぱり曖昧さとかが出てしまう、
ということが分かってきました。
お互いに検証をさせているうちにね。
なので、ここの、
英文プロンプトを、
もうちょっと精度を上げてやらないといけない、
ということになって、
体の向きを、
ちゃんと向けるためには、
体の向き、
顔の向き、
目線がどっちを向いているかって、
この3点を特に指示してあげないといけません、
という話になって、
それともう一つは、
我々、
右手とか左手とか言ったら、
自分自身の右手、
左手っていうのを、
見ている対象に対しても言うじゃないですか、
だからお互い向き合った状態で、
例えばイラストだったら、
こっち目線で向こうに人物が立っている、
イラストだったら、
右手を上げさせたいと思ったら、
こっちから見て、
左側の手が上がって、
右手みたいな、要は主観で、
ものを言うじゃないですか。
これを勘違いしているんじゃないかなと思って、
AIに確認しました。
普通、右手とか左手、
要は人物の左右を言うときは、
主観を元に言うんだと。
あなたはどういうふうに定義していますか、
みたいなね、GPT君って。
そしたらね、GPTの方はですね、
やっぱり人間と同じように、
左側で右で左で、
右側左側を判断はしているようです。
ところがですね、
画像ジェネレーターの方が、
これが曖昧だというふうに答えました。
左右の認識自体がそもそも曖昧なんだと、
画像ジェネレーターは。
理解の深まり
なのでそこをしっかり定義付けしてあげる必要がありますね、
みたいなね、会話になりまして。
えっとごめんなさい、今気づいたけど、
今僕が喋っているやつね、
完全にこのAIが提案してくれたプロット無視してました。
今気づいた。
まあいいや、
やっぱり自分の言葉の方が喋りやすいな。
しかも結構細かく今僕喋ってるんでね、
思い出してきたんで。
まあまあそんな感じでですね、
分かってるけど画像ジェネレーターの方が分かってねえっていうことが、
非常にたくさんあるということが伝わってきました。
だから画像ジェネレーターはですね、
見た目で判断してるので、
やっぱなんだろうな、
画面の左側、画面の右側、
っていうふうに見てるんですよ。
画像ジェネレーターはですね。
だから分かってきたのは、
GPTは3次元で物を捉えられるけど、
画像ジェネレーターはあくまで2次元的にしか物を見れてないっていうことですね。
画像ジェネレーターはあくまで2次元的にしか物を見れてないっていうことですね。
この時点でですね、
やっぱイラストの道具としては非常にやっぱり
足りてないなって思いました。
しかもですね、
このやり取りの中でですね、
もう一つあったのが、
パースを理解できないって言ってましたね。
パースってのは要は遠近感ですね。
遠近感をですね、やっぱり理解できないっていうのを
最初の方に言ってて、
それどういう意味だって思ったんですけど、
だからパースで人物をもっと遠くに置いてくださいとか、
パースで人物をもっと遠くに置いてくださいとか、
もしこっちが指示したら、
パースを考えた時にその人物は小さくなっていくわけですよ。
で、人物を手前に置いてくださいって言ったら、
パースを考えると大きくなるわけですよ。
結局この前後の動きとかが、
絵は分かんないって言うんですよ。
結局、2次元的にしか取られてないってことですよね。
そこもね。
なので、GPTは頭がいいので
3次元が分かるんだけど、
画像ジェネレーターは2次元的にしか、
絵を組み合わせてるんだなっていうことがね。
よく分かってきました。
だから、3次元的なものを言葉を使って、
我々イラストレーターはやっぱりパースとかで、
3次元的なものの捉え方っていうのを、
ある程度絵が描ける人でも、
もう一歩上のレベルに行くためには、
やっぱり立体をしっかり捉えられるっていう、
立体で物を考えられるっていう感覚と、
それをちゃんと絵に落とし込むっていう必要があるんですけど、
これ大きな壁なんですけどね、一つの。
やっぱりこの壁の手前にいるんだなっていうのがね、
分かりましたね。
だから2次元的な絵は得意だけど、
AIと視覚表現の課題
3次元的な絵は本当の意味では苦手です。
だから、
例えば煽りとか俯瞰とかのイラストを、
たくさんそういうイラストをデータとして持ってるから、
それっぽいものっていう形で、
パース感のある絵を、
AIは出せるものの、
こっちからこういうパースで描いてねとか、
いうのは全然反映できないみたいですね。
なので、
構図の下書きを渡していただければ、
私描けますよ、みたいなことを言ってきましたね、向こうは。
なるほどと。
だから2次元的な見た目、
それこそ遠くだから人が小さいとか、
あるいは伸ばした拳、
それこそ僕の、
PMAの、
MCHマイクルヒーローズジェネシスのガイアみたいに、
手が手前に来てるみたいなのを、
手はこれくらいの大きさで、体はこれくらいの大きさですよ、
っていう風なサイズシートというか、
実際絵でそれを渡してあげると、
再現できる、みたいなことですよね。
言葉でいくら、手は手前だから大きくして、
体は奥だから小さくしてっていうのを、
言葉で伝えても、
ジェネレーターは理解できないらしいです。
なぜかというとパースが違うじゃん、そこ、
とか言っても分かんないらしいですね。
っていうのが分かったんで、
だからね、大きな問題はそこですね。
まだやっぱり2次元と3次元の壁を、
実は越えられてないっていうね、
ことが分かってきました。
指示の明確化と反転
そういうことがあって、
そういうのがあるもんだから、
体の向きっていうのも、
3次元的に捉えてないんで、
右と左が曖昧になるっていうね、
画面の右側だって思っちゃうとかね、
そういうのがあるらしくて。
それをですね、
AIと一緒に、
これどう解決すればいいですかっていうところを
AIとやったんですよ。
そうしたら、
こうしたって言ってみるかな、
そういうのの構造、言葉で伝える難しさっていうのを、
僕自身も分かりました。
AIは行間を読めないっていうことがあるんで、
とにかく伝わらないなって言ったら、
定義を細かく割って、
これはこういう意味だからね、
しっかり覚えといてねってしてやらないといけない。
僕がその中で、
実際に1個ずつ作っていきましょうかってやったのが、
体の向きをしっかりと指示に従って
出せるようにしてくれというところで、
まず、
左真横を向いている絵を出してっていうのをやると、
確かね、左は出したのかな。
右真横を出してって言ったら、
左真横を出してきました。
ダメじゃんって、さっきと一緒じゃんみたいな。
なぜそうなるんだっていうのをもう一回検証させて、
なかなか言葉で伝えるのは難しいということが分かってきたので、
そしたら向こうが、
これは左真横向きっていうのの工具、
要は英語のテンプレート、
ポロンプトを確定させて、
右向きにしたい場合は、
それを反転させるという要素を加えましょうと。
要は、やっぱりビッグデータの兼ね合いで、
得意な角度っていうのがどうしてもあるんですよね、
AIは。
だから、得意な角度っていうので、
まず定義をしっかり決めて、
それを反転させるっていう形で、
ポロンプトの構文、
構文テンプレートというものを作っていきましょう、
ということを向こうが言ってきたので、
じゃあそれでやりましょうって感じで、
じゃあ左真横固定して、
その反転で右真横っていうのを覚えて、
次、左斜め、
左斜め向き、
違う、
左斜め、
左斜め前向きっていうのをやらせると、
右斜め前を出すんですね。
それは右斜め前だから、
じゃあ右斜め前でしっかり覚えてくださいと。
じゃあ右斜め前でしっかり覚えてくださいと。
はい、覚えました。
それの反転が左斜め前ということで覚えてくださいと。
はい、わかりました。
じゃあ今覚えたやつをもう一回表にして、
ちゃんと出してくださいって言うと、
しっかり表にできました。
その上でテストしていきますということで、
右斜め前の人物を出してくださいと。
何回かテストしたら、
ちゃんと指示通りに出せるようになりました。
ということをずっとやってましたね。
時間かかるな、はっきり言って。
一応こっちが、
体の向きを指示した通りに、
出せるようになるまで、
こういう風にして形を詰めてやらないといけなかったということで、
これは時間かかるなっていうのと、
同時に力さんがまさにやっているのと同じように、
AIとの日常的な活用
僕もAIを成長させております。
育てております。
ここまで育ったものを、
これだから別スレッドでやってたので、
この内容を別のスレッドに持ち込みたいんだけど、
どうすればいいかということで、
そこもじゃあそういう風にしますみたいな感じでやらせて、
一応、
一つのスレッドで全部、
例えばタスク管理とか、
スケジュール管理とかをやっているスレッドに、
これを持ってきました。
イラストを描くときのやつとかね。
それもテストして、
別スレッドでも指示通りに向きを変えられたから、
よし、これもOKだなみたいな感じでね。
育ててやると、
自分専用になっていくんだなっていうのが、
感覚として分かってきましたね。
だから僕のChatGPTでは、
じゃあ右斜め前の構図で、
例えば髪の長い女の子のキャラクターを描いてって言えば、
その体の向きで描けます。
その上で顔は正面を向いて、
目は右に反らしてとか言っても、
もう描けるようになっています。
だけど多分、
皆さんが使っているGPTで同じ指示を出しても、
多分出せないはずです。
っていうのは僕これだけ苦労してやっと詰めて、
できるようになったんで。
こんな感じなんですね、ChatGPTって。
っていう風にすごく思いました。
可能性は感じるんだけど、
やはりまだまだだなっていう風にも思いました。
他のことでも全部結局同じですよね。
何か通じないなっていうのがあれば、
自分で検証してみてって。
私はこう思うんだけど、
あなたはこう思ってるってことですよね。
この認識の擦り合わせをまずやっていきましょう。
とにかくこの共通認識を固定させていくっていう作業をして、
それから話を進めていくと、
すごく使いやすくなっていくなっていうのを感じました。
そんな感じです。
皆さんどうでしょうかね。
今後また続けていきたいなと思うのと、
同時にですね、
ChatGPTでいいなって思っているのが、
もう一つちょっとメタ的な部分で言うとですね、
UberEatsをやりながらこれができるんですよ。
UberEatsで走るじゃないですか。
で、信号待ちで、
信号待ちって長いところで40秒とかね。
なんですけど、
25秒とか40秒とかね。
長いところで本当に長い大通りに乗るんですよ。
でも、
2分とかなんですけど、
そこで止まったときに質問をバーって投げるんですよ。
で、またブーンって走っていって、
走ってる間にGPTが考えて答えてくれるんで。
でですね、
次に信号でちょっと止まったときにですね、
これを音声で読ませるんですよ。
GPTが出した文章。
で、走りながら、
GPTが出した文章。
で、走りながら音声で聞くんですよ。
で、また走りながらそれに対する返答を考えるんですよ。
で、信号待ちでバーっと返答を打つんですよ。
っていう感じでですね、
実はUberEatsで配達をしながら、
GPTとのやり取りができるっていうことを発見しました。
すごく時短になってます。
なのでね、
っていうのと同時に、
これギガが足りるのかと、
足りない気がするって思ってます。
スマホ買えて、
キャリアを乗り換えたことで、
すいません、まだちょっと息が詰まりますね。
キャリアを乗り換えたことで、
ギガ数が増えたんですけど、
それも使い切りそうな勢いですね。
そこが難点だな。
でもこれ必要なこととして、
投資する部分なのかなと思ってます。
ということで、
テンプレ無視して喋ってるんで、
最後ぐらいまとめましょうかね。
エンディング1から2分。
まとめ。
AIはまだ完璧じゃないけど、
自分で言うなって感じしますけどね。
AIは自動で全部やってくれるツールじゃなくて、
一緒に考えてくれる、
キームメイドみたいな存在でありますね。
リスナーへの一言。
AIを使ってみようとしている方、
最初はうまくいかなくても、
試しながら育てていく感覚で、
やってみてください。
私のこの呼吸が限界ですね。
喋ると。
というところで、終わりまーす。
今日も誰よってこいつを聞いてくれて、
まごてあいかてこっこわした。
みなさんまたねー。
イラストをこうし、三宅んでした。
それでは、チェスト!