仕事おさめとAI研究
はいどうもアメショのユキです。
ティーマーや忍者などでAIアートクリエイターとして活動しております。
よろしくお願いいたします。
はい、今週も始まりましたね。
はい、今年最後の週ではないですけど、
あの仕事に関しては、今週が最後の週ですかね。
私ちょっと長めに休みを取っているので、
はい、今日が仕事おさめですね、実は。
長いなって思われると思いますけども、
今年はちょっと長めにお休みをいただくことにしましたが、
ちょっと例によって仕事の特性であれなんですよね、
職場の近くにいなきゃいけない期間がまあまあ長くてですね、
年内一杯はそんな感じで職場の近くにいなきゃいけないということで、
正月からまた自宅に帰れるんですけども、
はい、それまではねちょっと職場の方の近くで待機しながらお休みという形になるかなというふうにね、
そんな感じでございます。
AI特性の比較
クリスマスもね、実はね昨日クリスマス来ましたね、家でね。
いやーねちょっとね、なんだかなって感じではありますけどね、
まあしょうがないかなというふうにね、ところでもございますね。
そうそうそうそう。
で、例によってね、先週からずっと研究の方をしておりますけれども、
GPTイメージ1.5とナノバナナプロとね、機能の比較みたいなのをやるのって難説ですよねって話が、
まあまああるっていう話をしてたと思うんですけども、
そうそう強みをね、それぞれの強みは何なんですかっていうか、
AIの特性をしっかり踏まえた上で使い分けることが重要なんじゃないかなっていうふうにね、思ってますね。
そう、ナノバナナプロとGPTイメージ1.5に同じことをさせて比較をすること自体には、
まあバズるっていうかネタとしてはね、話のネタとしてはあるのかもしれないですけども、
画像生成とかに関してそれを使い分けるっていうか、同じことをさせて比較をすることは全然あまり意味がなくて、
そう、片方が得意で片方が不得意なことを把握するという意味ではあるのかもしれないですけども、
そう、だけど、今までGPTイメージ1.5が出てくるまではですね、ナノバナナの方でサブを作ったりとか、
部分修正をしたりとか全体修正をしたりとかね、してましたけども、
そう、明らかにGPTイメージ1.5の方が得意な画像生成のやり方っていうのがあって、
それをそこでしっかり使うっていうことがやっぱり必要かなというふうにね、思いますよね、うん、そうそうそうそう。
あと、ミッドジャーニーとかね、2次ジャーニーとの違いとかね、
その、結構その、普通に他のAIとかもそうですけども、やっぱりガチャ要素がね、高いじゃないですか、AI、ね、画像生成するにあたって。
それが実は強みだったりとかすることも多いんで、その辺がね、GPTイメージ1.5とかとの違いかなというふうにね、思いますよね、そうそうそうそう。
あの、ガチャ要素でいろんな構造とか、いろんな格好とかね、服装とか持ち方が違うとかね、
そのガチャ要素で楽しむことができるというか、そういう特性があるのはね、ミッドジャーニーとか2次ジャーニーとか、画像生成のその一般的なね、AIの特性ですけども、
OGPTイメージ1.5はそこは全く違いますよね。
うん、そうそう、それがカチッと決まってて、そこからどう崩していくかというか、どれをね、タガを外してあげるのか、破綻させてあげるのかという発想をいただきゃいけない。
真逆ですよね。やってることがね。そうそうそう。
で、だけど、ここだけはっていう、ここだけは何とか直したいみたいなね、すごい細かい話に関しては、これはもうガチャ要素が高いAIでは絶対できない、まあ絶対とは言わないですけどね、できますけど、
うん、直すの自体がガチャだし、で、ナノバナナって実は、プロもそうですけども、全体、昼を夜にしてくださいとか、この色をこっちに変えてくださいとか、この服全体はこんな服に変えてくださいとかいうことに関しては、
ナノバナナプロはね、ナノバナナも含めてね、ナノバナナ系列のAIはすごく得意だと思うんですけど、ここのこの部分に一点を変えてくださいみたいな話っていうのはね、実はあまり得意じゃないんですね。そうそうそう。
それはどちらかというと、GPTイメージ1.5、それはもうカチッと決めて、これはこういうものですっていうようなことが定義ができるAIの方が得意だなっていうのはね、使っててよくわかりますよね。
うん、そうそうそう。だから、私がよく作っている忍者ダオのキャラで、これは普通に考えたら、例えば忍者なら忍者でもいいんですけどね、お選んだらお選んでもいいんですけども、
世の中一般というか、実際にリアルに存在しているとか、もしくは他にキャラとして存在している、みんなが知っているこのキャラクター、忍者なら忍者というキャラクターはこういう格好をしているよねっていうふうなのと、
例えば元絵が違ったりとかしたときに、例えば忍者を描いてくださいって言ったら、こういうふうな特徴のある忍者を描いてくださいって言っても、そっちには寄っていかないんですよね。それは何でかというと、世の中一般が知っている忍者と元絵の忍者が違うので、そこはそうはならないっていうね。
そういうのがAIで画像を作るときのすごく難点というか、それは特徴というべきなのかもしれないですけども、だと思うんですね。そこを部分的に強制的にというか、修正をして、こういうふうなもの、これはこういうものですという形で指定して、だからそこの部分はこう書いてくださいっていう。
言っていることが何言っているかわからないかもしれないですけども、部分修正を強制的にこういうルールで、ここはこういうふうになっていますからこうしてくださいみたいなのを、はっきり部品とか部分的に指定をすることによって変えるということについては、GBTイメージ1.5の右に出るものはないなというふうに今思っていますね。
そうそうそうそう。だから、ナノバナナプロにしても、GBTイメージ1.5にしても、ミードジャーニー、ニッジジャーニーにしても、それぞれの特徴というか強みを生かしながら画像生成でうまく組み合わせて作っていくと結構すごいのができるんじゃないかなというふうに思いますね。
さたがれの選挙に出ていたときに、ずいぶん世界の構築、世界観の構築でキャラ自体はちゃんとある程度雰囲気ができたものができるんですけど、背景がなかなか自分が言った通りにならなくてすごい悩んでいたんですけども、そんなのはね、GBTイメージ1.5に言うと一発でできますね。
そう、こういう特性のAIだとできるちゃうんだっていうのはね、もうはっきりわかりましたよ。
例えばね、なんだろう、昨日ちょっとやってみたらね、花札の特性を持った内装に花札を取り込んだお座敷の風景を作ってくださいって言っても、ミドジャーニーやニッジジャーニーはできないんですね。
これナノバラのプロでもできなかったんですけど、GBTイメージ1.5ではね、スパッとできましたね。そういう違いがあるってことですね。
そこを踏まえて使い分ける、もしくは部分的に取り入れて組み合わせてやっていくと、作品としてはすごく奥深いものが、奥気があるものになるんじゃないのかなって思った次第でございます。
研究の継続と展望
まだまだね、研究中ですけれども、引き続きね、ちょっと休みの待機の期間なんかも含めてね、研究の方を深めていきたいなというふうに思っているところでございます。
はい、Tマニアに唯一の規定があります。エンターテインメントの利用はセルフパッドエヴィルマン。
それだけでなく、みんなも楽しませる1日にしてまいりましょう。
それでは、メルシュンギでした。