画像生成AIを使いこなしている人と普通の人との差がかなり大きくなっています。特定の画像を生成するのに特化した追加データを作れて、それを配布している投稿サイトがあるなど、最近知った画像生成AIの進化について話しました。
=== 目次 ===
画像生成AIのプロ的な人が現れている
特定の画像を生成するのに特化した追加データ
追加データの投稿サイトは「無規制地帯」?
Stable Diffusionのオープンソース戦略
ポーズを指示して人物を生成する技術
-------
#アシカガCAST
デジタル活用のヒントをスキマ時間で。
話題のサービス、注目のソフトウェアの紹介、デジタルツールの活用術など、テック系情報をわかりやすくお届けします。
月〜水 朝8時に更新
■Twitterアカウント
https://twitter.com/ashikagacast
Apple Podcast、Spotify、Google Podcastなどでも配信しています。
■アシカガCAST on アシカガノオト
http://bit.ly/ashikagacast_notion
■アシカガノオト
http://bit.ly/ashikaganote
00:00
アシカガキャスト。 画像生成AIについて、去年の夏頃から何度も取り上げてきました。
世間的には最近ちょっと一段落している感があると思いますが、その界隈では盛り上がっているようです。
どんどん進化していってますし、エコシステム的なものができつつあることに気づきました。
世界中の人たちの集合地で、みんなで知恵を出し合って前進していっているような感じで、その下中にいる人たちは楽しいんだろうなと思います。
で、まず最近感じているのは、画像生成AIを使いこなしている人と、そうじゃない普通の人との差がかなり大きくなっていることです。
私も最初の頃は頑張って、こういう単語を入れたら、生成される画像にこういう影響が出るとか、いろいろ学んだんですが、
今先を行っている人たちのレベルはもう全然追いつけないような領域なんだろうなと感じています。
AIの力で誰もが思い通りにイラストや写真を生成できる時代が来るというのはまだ先の話で、
今は限られた訓練を積んだ、その道のプロ的な人じゃないと思い通りに画像を生成できない、そういう段階かなと思います。
カメラの歴史に例えるなら、まだデジカメ以前、オートフォーカス以前、プロカメラマンとか、かなり勉強したアマチュアカメラマンじゃないと使いこなせないような
そういう時代に相当するんじゃないでしょうか。 ただこういう画像を生成したいとお願いするテキスト、プロンプトと言いますし、日本では呪文とも言われていますが、このプロンプトにもこういう要素は排除するとか、他にもパラメーター的なものもあったりして、いろんな要素があるようです。
なので、AIで画像生成をするプロ的な人が現れるんじゃないんでしょうかね。 企業などから頼まれて、AIで画像を生成するプロフェッショナルということですね。
また、AI画像生成の技術的な部分をサポートするプロとか、 コンサルティング的なこと、情報発信などを仕事としてやる人も出てくるでしょうね。
03:00
画像生成AIに特定の画風でイラストを描かせるとか、何かしらに特化した画像を生成させるように学習させることができるんですね。 特定の傾向に特化した画像をたくさん学習させるということだと思います。
そして、そうやって作った特定の用途に特化したモデルデータというのを世界中の人が作っていて、そういったデータの投稿サイトがあって、誰でもそのデータをダウンロードして使うことができるんですね。
シビットAIというサイトが有名なようです。 何かしらの特定の絵柄用途に特化した画像をステーブルディフュージョンという画像生成AIで生成できるようにする追加ファイル的なものを世界中のみんなが投稿していて、誰もがダウンロードして利用できるんですね。
このシビットAIですが、ITメディアの記事でインモラルな無規制地帯と書かれていました。 確かにはっきり言って何でもありな、いろんな著作物であったり、実在する人物に似せたものを作るためのデータが山ほど登録してあります。
私が詳しくないので見てもあんまりわからないんですが、 実在する人気のアニメのキャラクターに似せたイラストを生成させるためのデータがたくさん登録されているようです。 そしてそのデータは誰かが勝手にそのアニメのキャラクターの画像をたくさん
AIに読み込ませて学習させたということなんですね。 なおそのITメディアの記事では、現行法では画像をAIの学習データに用いるとき、著作権者の許諾を得る必要はない。
ただし特定のキャラクターなどを真似た画像を出力しようとするのは違反になる可能性があると書いていました。 補足というか当たり前のことなんですが
AIが描こうが人間が描こうが、出来上がった結果としてのイラストであったり画像であったりが既存のキャラクター、著作物と酷似している、明らかに真似しているだろうという場合はもう著作権違反ですよね。
ただその学習させたデータを配っている人が著作権違反かとかそういう議論は出てくるでしょうね。 このシビットAIとかに投稿して公開されているもの以外に個人でそういう特定のイラストなり写真なりを学習させて楽しんでる人もいるということですよね。
06:17
有名人、芸能人の写真を学習させてその人っぽい人物を生成させようとしているものもありました。 日本人のものもいくつかあって生成されている画像を見てみたんですが残念ながらというかむしろ良かったというかあんまり本人と似てませんでした。
多分その人の写真をたくさん読み込ませたんだと思うんですが結果あんまり似てない画像が生成されるのが興味深いなと思いました。 もちろんそういうインモラルなものではなく面白いなというものもあって
シビットAIではなくてディフューザーズモデルズギャラリーという別なサイトで見つけたんですが霧絵風とか飛び出す絵本風、モザイクアート、アイソメトリックな感じの3Dの画像そういったものに特化しているモデルのデータがあってそれらはなかなか面白いなと思いました。
ただそれらに関しても学習させた元の画像のデータがその著作権者から許可を取ってるものなのかとか自分が撮った写真なのかとかその辺はわからないですからね。
ちょっとグレーな感じが付きまとうのは否めないですね。 まあITメディアの記事にも書いてましたが技術が出たての頃は大抵そんなもんだと
youtube だって最初の頃はテレビ番組の違法アップされた動画ばっかりでしたからね。 技術が進化していくことに関しては止められないと思うのでうまく落とし所を見つけて
youtube みたいにクリーンな形で成長していくことができるのかなと期待したいですがそれ にはかなり時間がかかりそうですね
ただ最近のそういう動きを見て思うのは画像生成 ai の ステーブルディフュージョンがオープンソースとしてみんなが自由に無料で使える
改変していけるという戦略を取ったのが大成功だったなということです どんどん今世界中の人たちによってブラッシュアップされていってるということですよね
しかも金銭的なインセンティブとは関係なく 自分の好きなアニメのキャラクターをもっと高精度に生成させたいとか
09:07
自分の性癖を満たすような画像を生成させたいとそういう思いのある意味 暇人の人そういうのに咲く時間のある人たちのおかげでどんどん進化していってるんだなと
そういう熱気を熱狂を感じます 今回話してきたことはテキストから画像を生成するテキスト2イメージの話でしたが
画像をもとに画像を生成するイメージ2イメージというのもあります そして最近
ポーズを指定してそのポーズの人物を テキスト2イメージで生成するための
コントロールネットという新技術も登場しています 3d のツールで人物のポーズを作ってその画像をもとにコントロールネットという技術を使って
ステーブルディフュージョンでそのポーズの人物を生成するとか でそういう技術が出たところで世界中の人がいろんな研究をして座ってるポーズを指定した人物と
背景となる椅子を含んだ画像等を別々で生成して合成させるとか そんなテクニックを考えて実際にやってみている人がいたりそういうことをやってる人が
いるよと情報発信している人がいたりで 画像生成 ai 界隈は今日も賑やかですと
いうことです 今回は以上です
アシカガコウジでした
10:55
コメント
スクロール