1. クロエのおしゃべり場
  2. #348 AIのガチャも特性を理解..
2025-12-23 07:49

#348 AIのガチャも特性を理解すれば武器になる


---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/65cf85580a4a74f98f461b16

サマリー

AIアート生成における新たな特性として、GPTイメージ1.5と他のAIツールの違いが明らかになり、従来のガチャ機能が新たな武器になり得ることが示されています。特に、異なるAI技術が持つ特性を理解することが、効果的な創作活動に寄与すると論じられています。

AIアート生成の特性
はいどうもアメショのユキです。
ティーマや忍者ダオでAIアートクリエイターとして活動しております。
はいよろしくお願いします。
はいよろしくお願いします。
今日はですね、お休みです。
今日からというべきなんですかね。
ちょっと休みを長く今年とっているんで。
はい、それでね、いつもだと6時前後くらいに、7時前かな、7時過ぎくらいに配信してるんですけども、
今日はちょっと遅めの配信となっております。
ということで始めたいと思いますけども、
えーと、ここ数日ですね、GPTイメージ1.5っていう、
オープンAIのね、ChatGPTの画像生成の機能の強化版がね、アリリスされたんですけども、
そう、このコードレッドのね、あれで、
Geminiの3の方がね、ナノバナナプロを出してきたってことで、
オープンAIの方がね、サムアルトマンがコードレッドということでね、追いつかなきゃということで、
慌ててね、いろいろ機能アップを図っているところの一つとして、
GPTのね、イメージの1のアップデート版、1.5が出たんで、
それのね、性能検証をずっとしてました、してますけれども、
そうで、まあね、大体特性がね、つかめてきたんですけども、
やっぱりね、ナノバナナプロとは全然違うのです。
これを比較するのは全く何せさなんていうのは、私もね、そういうふうに感じてますけども、
まあそれはそれとして、GPTイメージ1.5の良さと、
まあ、悪さというかね、特性というのがあるっていうのは前もお話ししたんですけども、
まあそこを踏まえて、改めて他のAIというか、
特に私が普段から使っている、ステーブルディフュージョンとかね、
まあ2次ジャーニー、3次ジャーニーはよくね、しょっちゅう使ってますけども、
そちらの今まで使ってたね、画像生成AIとの差っていうのが、
まあ如実になってきたんですね。
まあそれを踏まえると、これまで、
ああ、なんでこんななっちゃうかなと思っていた、いわゆるガチャ機能ですね。
ガチャ機能って、ガチャをしなければいけないという、
これまでの画像生成AIの特性、
まあ同じものが2回できないし、
ガチャ要素でいろいろ変わってしまうっていうところが、
逆に切り口として、
武器になるな、この特性をね、
AIのガチャの特性を理解すれば、
それはそれで一つの大きな武器になるなっていうのをね、
改めてGBTイメージ1.5の研究をすると、
理解が深まったなっていうのがね、
今回の検証の途中ですけどね、まだ、
成果かなというふうに思っています。
で、なんでかっていうと、
特性の違いでGBTイメージ1.5で作ると、
振れ幅はないんですよね。
振れ幅はないって振れ幅はありますけど、
同じような構図でずっと出すことができるんですよね。
だからガチャ要素は少ない。
なんですけど、逆に言うとガチャ要素が少なすぎて、
振れ幅がないがゆえに、
もうちょっとこうしたいよなとか、
こういう風にしていろんな構図を作ってみたいよな、
っていうことに関してはね、
GBTイメージ1.5はやっぱり向かないんですね。
量産には向かないですね。
量産に向かないというよりも、
いろんな構図をたくさん試して作って、
その中から一つというような、
これまでのAIアートでの使い方には向かない。
逆に同じ構図でバチッと決めたやつを作りたいんだったら、
それを量産するのはできますよね。
だけどそれを何枚も量産しても仕方がないので、
今度は振り返って、
ミッドジャーニー、ニジジャーニーのような、
従来の生成AIで作ると、
同じ構図はまず出ないですね。
似たような構図は出ますけども、
同じような構図は出ない。
服装とか細かいものも含めてですね。
出ない中で、だけどそれをいろんなパターンが出てきて、
その中で変化を楽しみながらね、
これがいいなみたいな感じで選ぶことができる。
そこに大きな違いがあって、
これはやっぱりガチャだからこそ楽しめるという要素、
楽しめるというかね、できる要素だと思うんですね。
いろんな構図、いろんなカメラワークのパターンが出てくる。
だけどこれまで動画生成をやっていた人たちの悩みは、
同じ構図が再現されないから困るということだったんですね。
それに関してはGPTイメージ1.5は答えてますよね。
確実に答えてますね。
もうバチッと決まったら同じものが出続ける。
同じプロンプトである限りはね、
同じものが出続けるというのはあると思うんですね。
だけど、振れ幅もないし、
言われた通りにバチッと出してくるが故に、
きちっと構造を考えて理解をしてプロンプトを組んで入れないと
思った通りのものも出ないというね。
そういう意味で言うと、
ステーブルディフュージョン、
ステーブルディフュージョンもね、どっちかというとガチャに近いんであれですけども、
狙ったものが出ないという意味で言うと、
ステーブルディフュージョンに近いのかなというふうに思いますし、
その辺の特性というのが使い分けしていくといいんだろうなというふうにね、
研究をして思った次第でございます。
ガチャ機能の新しい可能性
なかなかね、でも面白いですよね。
そうやって考えると、
今までダメだダメだと思って、
これは何でだろうと思ってたことが、
ひるがえって使い方によってはね、
考え方とかその捉え方によっては、
それは一つの武器になるし、
使い方によってはそっちの方がいいということもあるということがね、
改めて理解できたというのは、
なかなか面白い研究成果だったなというふうに思っているところでございます。
はい、ということでね、
今日は休みなので、
ちょっとのんびりして、
これからトレーニングしようかなと思ってますけれども、
はい、皆さんね、
まだね、ちょっとお休みに入っていらっしゃらない方も多いと思うんですけども、
そろそろクリムスマスも近いですし、
年末も近づいてきてますので、
どうかね、お体には気をつけて、
結構風邪ひきかれている方ね、
多いみたいですし、
池原さんインフル食らいましたということで、
倒れていらっしゃるみたいですのでね、
インフルエンザとかね、
ご家族からもらう方もおられると思いますけれども、
お気をつけてお過ごしいただきたいと思います。
はい、で、今日はね、
私の公式の日ですけれども、
今日ね、ちょっと夜、
仕事関係でね、
別件が夕方から入りそうなので、
まあ、休みなんですけどね、
休みなんですけど、
夕方から別件で仕事が入りそうなので、
公式化できるかどうかちょっと分かりませんけれども、
はい、できるようであればやろうかなと思いますので、
よろしくお願いいたします。
はい、ティーマーに唯一の掟があります、
エンターテイナントーリア、
セルフパッド、
エブリワン、
己だけでなく、
皆も楽しませる日にして参りましょう。
それでは、米津玄師でした。
ほなまた。
07:49

コメント

スクロール